DataSpell 2023.2: поддержка Polars, ускорение исследования табличных данных и улучшения нового интерфейса
В новую версию DataSpell добавлены интерактивные таблицы для Polars DataFrames, с помощью которых удобно сортировать, экспортировать и просматривать данные. Они поддерживаются и в Jupyter-ноутбуках, и в Python-консолях. К таблицам легко перейти из отладчиков Python и Jupyter, средств просмотра переменных, а также Data Vision.
Мы добавили автодополнение для названий столбцов в поддерживаемых функциях Polars. Это упрощает взаимодействие с библиотекой и управление данными в DataSpell.
Мы упростили процесс исследования данных. Он важен для специалистов в области анализа данных и часто занимает много времени. Теперь достаточно навести курсор на заголовок столбца, чтобы получить важную информацию о нем: распределение значений, медианное значение, среднеквадратическое отклонение и пропущенные значения. В настоящее время эта функция доступна для pandas и Polars DataFrames.
В DataSpell 2023.2 заголовки проектов стали цветными. Это упрощает навигацию, когда открыто несколько проектов. Каждому проекту можно присвоить уникальный цвет и значок, чтобы вам было проще различать их во время работы. Цвета заголовков определены заранее, но вы можете настроить их, как вам нравится. Чтобы задать цвет для проекта, кликните правой кнопкой мыши по заголовку окна, зайдите в контекстное меню, выберите опцию Change Toolbar Color и укажите желаемый цвет. Чтобы отключить эту функцию, снимите флажок с опции Use Project Colors in Toolbar в контекстном меню.
На панели Project теперь есть опция Open Directories with Single Click, которая позволяет быстрее разворачивать и сворачивать папки проектов. Вы найдете ее в выпадающем меню, если нажмете на три точки.
DataSpell 2023.2 позволяет настроить серверы под управлением Jupyter так, чтобы, помимо прочего, можно было:
В новой версии мы значительно улучшили синхронизацию изменений в Jupyter-ноутбуках с внешними приложениями, например Git или браузерной версией Jupyter. Теперь можно легко переключаться между DataSpell и внешними приложениями, при этом все изменения прекрасно синхронизируются, где бы вы их ни внесли.
Мы разобрали плагин Big Data Tools на составные части, которые можно использовать по отдельности. Таким образом, для DataSpell теперь есть шесть новых плагинов: Kafka, Spark, Flink, Remote File Systems, Big Data File Viewer и Zeppelin. Если вам нужны все шесть, вы все еще можете установить Big Data Tools и получить все плагины в один клик.
В новой версии можно подключиться к Redis Cluster и получить тот же набор функций, что и при использовании автономного Redis.
В настройках DataSpell появился новый параметр Time zone. Теперь можно выбрать, какой часовой пояс следует использовать для отображения значений datetime
.
Общие базы данных и их содержимое теперь подвергаются интроспекции. Также интроспективно проверяются datashares, на которых создаются эти базы. Общие базы данных и datashares можно изменить с помощью сочетания клавиш Ctrl/Cmd + F6. Кроме того, в редакторе SQL теперь поддерживаются все связанные операторы.
В новой версии DataSpell мы существенно улучшили диалог миграции схем, чтобы работать стало удобнее.
Основное отличие заключается в том, что теперь одинаковые объекты располагаются на одной строке в обеих частях диалога: так проще понять, какие объекты будут добавлены в целевую схему, удалены из нее или изменены.