DataSpell 2024.3 の新機能

DataSpell 2024.3: JetBrains Data Wrangler と R バージョン 4.4 のサポート

DataSpell 2024.3 では、新しい JetBrains Data Wrangler によって合計データ処理時間のうち平均 30~40% を占めるタスクを自動化することで、データのクリーニングとプレパレーションが単純化されています。 このリリースでは R バージョン 4.4 のサポートも追加されており、言語機能の改善によってコーディングエクスペリエンスが向上しています。 新しいバージョンの DataSpell を JetBrains のウェブサイトからダウンロードするか、IDE または無料の Toolbox App から直接更新するか、Ubuntu の snap パッケージをご利用ください。

JetBrains Data Wrangler: データクリーニングとデータプレパレーション用のノーコードツール

弊社の調査によると、データクリーニングとデータプレパレーションはデータ処理の 30~40% もの割合を占めています。 効率を高めて生産性を強化するには、これらのステージの自動化が不可欠です。また、データ操作用の API と UI の最適化と LLM エージェントによるガイド付きプロセスの実装という 2 つのステップでこの自動化を構成する必要があります。

JetBrains Data Wrangler はこの自動化の最初のステップです。 まずはテーブルデータから着手した後、より多くのデータ形式をサポートするようにツールを拡張する予定です。 JetBrains Data Wrangler では一連の使いやすいアクションを使用し、後続の処理に向けてデータのプレパレーションを実施できます。

フィルター

クリーニングと除去

検索と置換

また、JetBrains Data Wrangler を使用すると、初期状態で用意されている次の有効な機能を使用して統計上の問題を解決できます。

  • Min-Max スケーリング
  • Z スコアの正規化
  • IQR(四分位範囲)による外れ値の検出
  • 歪度の軽減
  • MAD(中央絶対偏差)による外れ値の検出
  • ユークリッド距離による外れ値の検出

データ操作にはコード生成が伴います。コード生成はデータエクスポートに追加され、変換結果を新しいセルとして使用する機能を提供します。

JetBrains Data Wrangler によるデータ変換

変更履歴の表示

便利な形式でのデータエクスポート

変換の結果を新しいセルとして使用

R 4.4 のサポート

R バージョン 4.4 のサポートを導入しました。 この言語の最新の機能を DataSpell のプロジェクトで利用できるようになりました。

ぜひこの更新を活用してください!

最新機能に関する最新情報や DataSpell とデータ解析に関するヒントを受け取りたいですか? 弊社ブログをご購読いただき、X をフォローしてください! バグに遭遇した場合や機能の提案がある場合は、課題トラッカーでお知らせください。