業界: 教育, 研究・リサーチ

使用されている JetBrains 製品: MPS

組織規模: 5,000-10,000

国: 米国

The Weill Cornell Clinical & Translational Science Center

MetaR は Weill Cornell Medicine Clinical & Translational Science Center で JetBrains MPS を使用して開発されたもので、バイオメディカル科学者が最小限のコンピュータースキルでデータ分析を行いやすくすることを目的としています。

「MetaR は JetBrains MPS を利用し、R 言語でのデータ解析を容易にします。MPS は MetaR に新しくユニークな可能性を生み出しました。」

— Manuele Simi、シニアソフトウェアエンジニア、Weill Cornell Medicine

課題

データ解析ツールは今や生物学研究には欠かせないものになりました。今日私たちが利用できるツールは、数十年にわたって開発された技術を積み重ねて作成されたものです。生物学者や臨床医は往々にして基本的な、あるいは高度なデータ解析を要求されます。データ生成実験に関する特別な知識を有しているため、独自の解析を実行するのに絶好のポストに就いているからです。しかしながら、統計言語は必ずしも彼らにとって理解しやすいものではなく、コンピューターに関する経験が限られていることが障害となっていることもしばしばです。

解決

生物学では R 言語がデータ解析に幅広く使用されています。熟練した生物統計学者や生物情報学者は、生物学的ハイスループットデータ向けに高度な解析を実装する多数の R パッケージを開発してきました。しかしながら、R 言語の柔軟性をフル活用するのに必要なコンピューターと統計の知識を習得するには膨大な時間がかかります。

MetaR は言語ワークベンチ技術を利用し、生物学者に適したデータ解析言語一式を作成します。これらの言語は R 言語で開発されたパッケージを利用するために基本となる R コードを自動生成します。MetaR は、最小限の構造体の構文知識で独自の解析を記述可能な統合環境です。プロジェクションエディタの自動補完機能は異なる言語要素を構成できるだけでなく、オブジェクト間の参照を便利に設定する方法を提供し、入力ミスを防ぐのに役立ちます。

MetaR の主な特徴は、単一のプラットフォームでユーザーインターフェースとスクリプト作成の機能を兼ね備えていることです。このため、データをより効率よく分析することができます。専門家はプログラミング経験を必要とせず、スクリプト作成のメリットを維持しながらも GUI のように動作する簡易化したデータ分析言語を設計できます。また、MetaR はネイティブ環境や仮想環境での解析の実行も可能にしています。

MetaR 言語

ハイスループットデータを処理する場合は往々にしてデータのテーブルを入力として使用する必要があるため、MetaR は Table を設計上の重要な要素に含めています。Table は MetaR にインポートされた後、Analysis 要素内の metar ステートメントで解析されます。

MetaR ステートメントは言語構文の予備知識を必要としない宣言型の言語構造となっており、プログラミング知識のない初心者がスムーズに学習できるようにしています。

MetaR でインポートされた Table の例:

Analysis スクリプトの例:

上記の Analysis スクリプトはテーブルのインポート(import metar ステートメント)、テーブルデータの精緻化(limma voom — 遺伝子セットを比較するための一般的な統計解析手法)と変換(joinsubset rows)を行い、最終的には結果のプロットを導出(heatmap)してから可視化/保存(multiplotrender)します。これは、データ解析では非常に一般的な処理の流れです。

このスクリプトは MetaR で配布される非常に小さな metar ステートメントのサブセットのみを使用します。ただし、このツールは一般的なものであり、容易に拡張してさまざまなデータ解析や可視化に対応させることができます。新しい言語は、Analysis 要素内にすでに存在する metar ステートメントとシームレスに統合する新しい metar ステートメントを簡単に作成および追加できます。

その他のデータ可視化例

対象者

MetaR の使用対象者:

  1. プログラミングスキルを持たず、データ解析を行いたい生物学者。
  2. 反復解析を実行する必要があり、専用マイクロ言語の設計および使用によってデータ解析の効率や一貫性を向上させることが有益であると考える生物情報学者。
  3. 言語の構成と拡張性を実験したい R 言語プログラマー。
  4. 最先端の解析手法を分かりやすい MetaR 解析言語構造にパッケージ化したい生物情報学者。MetaR は、解析手法を R 言語で開発する専門家が可能な限り幅広い対象者に開発手法を配布できるようにするブリッジとして機能できます。専門家はユーザーインターフェースの開発に多大な労力を費やす必要はありません。

トレーニングセッション

トレーニングセッションは Clinical & Translational Science Center のいずれかの機関(Memorial Sloan-Kettering Cancer Center、Hospital for Special Surgery、NewYork-Presbyterian Hospital、Hunter College、Cornell University)で予約を取っている職員、学生、博士研究者、研究者に定期的に提供されていますが、ニューヨーク市内の他の機関からの参加者にもよく提供されています。また、MetaR を使用した場合は初心者が 2 時間未満でセッションの課題を完了することができるのに対し、R とそのパッケージを使用した従来のトレーニングでは数セッション(6~24 時間)と幅広い技術経験が要求されることが分かっています。

MPS を選択する理由

MetaR は JetBrains MPS を利用し、R 言語でのデータ解析を容易にします。MPS は次のように、MetaR に新しくユニークな可能性を生み出します。

  • この言語を使用して解析を開発する際には、自動補完のように対話形式で提供されるプロジェクションエディタの機能が初心者と上級者を分け隔てなくガイドします。
  • テキストユーザーインターフェースとグラフィカルユーザーインターフェースを併用してノードを描画できるため、さまざまなレベルのユーザーエクスペリエンスが提供されます。
  • 言語を構成することで専門家は MetaR を独自の構造で拡張し、他の言語と容易に統合することができます。
  • 実行構成を用いて MetaR が各種環境で解析スクリプトを実行する方法を定義および制御し、スクリプトが実行される前に不足している依存関係を透過的にインストールすることができます。
  • R 言語スクリプト(データ解析では標準)を生成できるため、MetaR を R の機能に基づいて構築し、R で使用可能な膨大な数のパッケージ(10,000 件以上)を利用することができます。

MetaR は MPS 用のプラグイン一式として配布されています。

参考情報

お問い合わせ

Manuele Simi、シニアソフトウェアエンジニア、Weill Cornell Medicine

Twitter: @ManueleSimi

同様のカスタマーストーリー

DTO

Diederik Dulfer、オランダ税務署

JetBrains MPS によって、オランダの税法を理解しやすい言葉で表現することができます。 MPS ではこの言語を使用して税計算を指定およびテストし、ターゲットプラットフォームのソースコードを生成しています。

RoadBotics

Matt Lucas、RoadBotics 製品部門長

当社は部分的に WebStorm への移行を完了させましたが、その決め手となったのは多数の優れた機能が最初から含まれていることでした。おかげさまですぐに仕事に着手し、余計なサードパーティ製品への依存度を下げることができました。 また、すべてのソフトウェアライセンスが一箇所に集約されているため、開発ツールへのアクセスを管理しやすくなりました。

Skillaz

Alexander Shtanov、Skillaz チームリーダー

当社が JetBrains を支持した理由は、そのツール群からなるエコシステムが生産性を向上するだけでなく、その他の点でも業務改善を促す多くの機能を備えていることです。

その他のカスタマーストーリー