DataSpell 2023.3 の新機能

DataSpell 2023.3: AI Assistant、dbt のサポート、SQL セル、対話型テーブルによる生産性の向上など

AI Assistant 一般提供

AI Assistant のプレビューが終了しました!

JetBrains IDE の生産性を向上させる多数の新機能と改善が盛り込まれた JetBrains AI Assistant が一般公開されました。

JetBrains AI Assistant で DataFrame に関するインサイトを取得しましょう!

Explain code(コードの説明)機能で DataFrame に関するインサイトを楽に取得できるようになりました。 このツールは Jupyter Notebook と Python スクリプトのコンテキストメニューを使うか、単に対話型テーブルの右上にある AI Assistant アイコンをクリックして簡単にアクセスできます。 AI Assistant は有効になると、列名や記述統計などのデータセットに関する基本情報を受け取ります。 これにより、DataFrame の関連情報と解析の提供が可能になっています。 AI Assistant との対話を続けることで、より詳細な解析を行うこともできます。

DataSpell の AI Assistant は JetBrains AI Service サブスクリプションをご利用の場合に追加機能として使用できます。

dbt

dbt Core のサポートの導入

DataSpell にデータコミュニティで人気を得ている dbt Core データ変換フレームワークのサポートが導入されました。 dbt Core はデータ変換プロセスを単純化し、モジュール化、テスト、ドキュメント化など、データ解析におけるエンジニアリングのベストプラクティスを促進します。 特に SQL を扱った経験のある方には使いやすいフレームワークです。

DataSpell で dbt Core を使用すると、以下のようなメリットがあります。

  • 効率的なプロジェクトの開始: 事前構成済みのテンプレートを使用して dbt プロジェクトを簡単に開始できます。
  • 単純化された実行、ビルド、およびデバッグプロセス: 実行構成を使用すると、数回クリックするだけで簡単にプロジェクトを実行、ビルド、またはデバッグできます。
  • インテリジェントなコード補完: DataSpell には SQL ファイルと YML ファイルの両方に対応したインテリジェントなコード補完が備わっています。

SQL と Python

SQL セル

DataSpell にバンドルのデータベースツールと SQL プラグインが提供する既存の堅牢な SQL サポートに加えて SQL セルを導入することで、SQL と Python の連携を大幅に強化しました。 Python または Markdown セルと同様に、SQL セルを Jupyter ノートブックで使用できるようになっています。 SQL セルを使うと、簡単にデータベースからデータを取得できます。また、そのデータはノートブックですぐに使用できるように pandas DataFrame に自動的に変換されます。 さらに、SQL コードと SQL オブジェクト(テーブルと列を含む)の両方で完全に機能するインテリジェントなコード補完を使用できるため、SQL コーディングのエクスペリエンスが向上します。 SQL セルは Add SQL Cell(SQL セルの追加)をクリックするだけで簡単に追加できます。

Full Line Code Completion

DataSpell の高度なコード補完がさらに強化され、より詳細にカスタマイズできるようになりました。 このリリースではローカルモデルが IDE 内に直接統合されているため、現在のファイルに合わせてカスタマイズされたコード補完を利用できます。 このモデルはコードを基に学習して完全なコード行を提案するため、データ解析ワークフローの効率と有効性を向上させます。

対話型テーブル

テーブル内統計

DataFrame の記述統計へのアクセスが簡単になると、データ専門家の作業効率が大幅に向上します。 DataSpell では、このような記述統計へのアクセスをさらに楽にしました。 テーブルのヘッダーで欠損値、平均、標準偏差などの基本的なデータインサイトに簡単にアクセスできるようになっています。 この機能は Jupyter ノートブックと Python スクリプトの両方で使用可能で、pandas と Polars をサポートしています。 また、テーブルのヘッダーにあるアイコンを見るだけで各列のデータ型が一目で分かるようになっています。

カテゴリカルデータの分布統計

カテゴリカルデータを処理する場合、対話型テーブルで分布を簡単に表示できます。 この機能を使うと、最も頻繁に出現する値のリストとそれに対応するパーセント値をすぐに確認できます。 一意の値が多数存在する場合は、列に含まれるこれらの重複しないエントリの合計数に簡単にアクセスできます。

テーブルのデータ分布ヒストグラム

データ分布ヒストグラムはデータ解析に不可欠なツールです。データ分布を視覚的なスナップショットで表現し、パターン認識、外れ値の検出、およびデータ品質評価に役立ちます。 DataSpell では、テーブルヘッダー内でこのヒストグラムを直接確認できるようになりました。 ヒストグラムはデフォルトのコンパクトモードと詳細ビューで使用可能です。

テーブルのデータ可視化の単純化

データ解析ワークフローを合理化するため、重要な強化機能である簡易グラフビルダーを導入しました。 この新機能により、テーブルデータからのグラフ作成が合理化され、データ可視化を素早く簡単に行えるようになっています。 左上のチャートビューをクリックして歯車アイコンを選択したら、希望するグラフタイプを選択するだけで簡単かつ効率よくデータの可視化を開始できます。

テーブルでの AI Assistant

対話型テーブルの右上にある AI Assistant アイコンをクリックすると、有益な DataFrame インサイトにアクセスできます。 アシスタントは瞬時に情報を提供します。また、会話を続けることで解析をさらに進めることができます。

UI とナビゲーション

メインツールバーを非表示にする

以前の UI と同様に IDE のデフォルト表示モードを使用しているときにメインツールバーを非表示にするオプションを実装しました。 雑然としたワークスペースからツールバーを消すには、Appearance(外観)を選択して Toolbar(ツールバー)オプションをオフにします。

改善されたナビゲーション

エディター内でさまざまなファイルタイプを同時に扱う際の操作性を改善するため、エディターのタブをデフォルトで色分けし、Project(プロジェクト)ツールウィンドウにその外観を反映させるようにしました。

Speed Search(スピード検索)

ツールウィンドウとダイアログ内を素早くナビゲートできるようにする Speed Search(スピード検索)機能がショートカットで利用できるようになりました。 ツリーまたはリストにフォーカスがある場合、macOS では ⌘ F 、Windows または Linux では Ctrl+F を押してツールウィンドウの Options(オプション)メニューから簡単に検索を呼び出せます。または単にクエリを入力し始めても同じ動作を得られます。