Что нового в DataSpell 2024.3

DataSpell 2024.3: JetBrains Data Wrangler и поддержка R 4.4

В DataSpell 2024.3 встроен JetBrains Data Wrangler — инструмент, который упрощает очистку и подготовку данных, автоматизируя задачи, обычно отнимающие 30–40% времени работы с данными. Кроме того, в этой версии добавлена поддержка R 4.4: писать код стало проще благодаря новым возможностям языка. Скачать новую версию DataSpell можно на нашем сайте либо через бесплатное приложение Toolbox App. Также можно установить обновление прямо из IDE. Для пользователей Ubuntu доступны snap-пакеты.

JetBrains Data Wrangler: инструмент для очистки и подготовки данных без написания кода

Наше исследование показало, что до 40% времени работы с данными уходит на их очистку и подготовку. Для повышения эффективности и продуктивности важно автоматизировать эти этапы. Автоматизация включает два этапа: оптимизацию API и интерфейса для работы с данными и внедрение управляемого процесса с использованием LLM-агентов.

JetBrains Data Wrangler — это первый этап автоматизации. Мы начинаем с табличных данных, а в дальнейшем добавим поддержку и других форматов. JetBrains Data Wrangler упрощает подготовку данных к обработке с помощью набора удобных действий.

Фильтр

Очистка и удаление

Поиск и замена

JetBrains Data Wrangler также предлагает готовые функции для решения статистических задач:

  • масштабирование с использованием минимального и максимального значений;
  • нормализация по Z-оценке;
  • выявление выбросов с помощью межквартильного диапазона (IQR);
  • уменьшение перекоса;
  • выявление выбросов с помощью среднего абсолютного отклонения (MAD);
  • выявление выбросов с помощью евклидова расстояния.

Обработка данных сопровождается генерацией кода, который добавляется к основным экспортированным данным и позволяет использовать результаты преобразования как новую ячейку.

Преобразование данных с помощью JetBrains Data Wrangler

Просмотр истории изменений

Экспорт данных в удобном формате

Использование результатов трансформации как новой ячейки

Поддержка R 4.4

Мы добавили поддержку R версии 4.4. Теперь вы можете пользоваться самыми новыми возможностями языка в своих проектах в DataSpell.

Надеемся, эти нововведения вам понравятся.

Хотите быть в курсе обновлений и получать советы по работе с DataSpell? Подписывайтесь на наш блог и нашу страницу в X. Если вы обнаружили ошибку или хотите предложить новую функциональность, пишите в наш баг-трекер.