Industrie: Bildung, Forschung

Verwendete JetBrains-Produkte: MPS

Organisationsgröße: 5,000-10,000

Land: Vereinigte Staaten

Weill Cornell Clinical & Translational Science Center

MetaR wurde am Weill Cornell Medicine Clinical & Translational Science Center unter Einsatz von JetBrains MPS entwickelt, um biomedizinischen Forschern mit geringen Computerkenntnissen die Datenanalyse zu erleichtern.

»MetaR nutzt die Vorteile von JetBrains MPS, um die Datenanalyse in R zu vereinfachen. Durch MPS haben sich neue und einzigartige Möglichkeiten für MetaR ergeben.«

— Manuele Simi, Senior Software Engineer, Weill Cornell Medicine

Problem

Datenanalysewerkzeuge sind für die biologische Forschung unverzichtbar geworden. Die heute verfügbaren Tools basieren auf Technologieschichten, die über Jahrzehnte hinweg entwickelt wurden. Biologen und Mediziner sind häufig darauf angewiesen, einfache oder auch komplexere Datenanalysen zu ihren Experimenten selbst durchführen, da sie aufgrund ihres themenspezifischen Wissens am besten zur Durchführung dieser Analysen geeignet sind. Statistiksprachen sind jedoch nicht immer einfach zugänglich, und mangelnde Programmierkenntnisse sind oft ein Hindernis.

Lösung

Die Sprache R wird in der Biologie häufig für Datenanalysen verwendet. Erfahrene Biostatistiker und Bioinformatiker haben zahlreiche R-Pakete für erweiterte Analysen von großen biologischen Datenmengen entwickelt. Um die Flexibilität von R in vollem Umfang nutzen zu können, bedarf es jedoch umfassender Programmier- und Statistikkenntnisse, deren Erwerb sehr aufwendig ist.

MetaR erstellt mithilfe der Language-Workbench-Technologie eine Reihe von Datenanalysesprachen, die auf den Einsatz in der Biologie zugeschnitten sind. Diese Sprachen generieren automatisch R-Code und ermöglichen dadurch die Verwendung von Paketen, die in R entwickelt wurden. MetaR ist eine integrierte Umgebung, die von Benutzern, die ihre eigenen Analysen schreiben möchten, nur minimale Kenntnisse in Bezug auf die Syntax der Konstrukte fordert. Die Zusammenführung von Elementen aus verschiedenen Sprachen und die automatische Vervollständigung im Projektionseditor bieten eine praktische Möglichkeit, Referenzen zwischen Objekten festzulegen und dabei Tippfehler zu vermeiden.

Ein wesentlicher Aspekt von MetaR ist die Kombination von Benutzeroberfläche und Skripterstellung in einer gemeinsamen Plattform. Dies ermöglicht eine effizientere Datenanalyse. Experten können vereinfachte Datenanalysesprachen entwerfen, die keinerlei Programmiererfahrung erfordern und sich wie grafische Benutzeroberflächen verhalten, aber dennoch alle Vorteile des Scripting beibehalten. Mit MetaR können Analysen in nativen oder virtualisierten Umgebungen durchgeführt werden.

Die MetaR-Sprachen

Da bei der Arbeit mit großen Datenmengen häufig Tabellen als Datenquellen verwendet werden, ist Table ein zentrales Element des MetaR-Designs. Tabellen werden in die MetaR-Modelle importiert und anschließend mit metar-statements in Analysis-Elementen analysiert.

MetaR-Anweisungen sind deklarative Sprachkonstrukte, die keine Vorkenntnisse zur Sprachsyntax erfordern. Dies ermöglicht Anfängern ohne Programmierkenntnisse einen problemlosen Einstieg.

Beispiel einer in MetaR importierten Tabelle:

Beispielhaftes Analyseskript:

Das obige Analyseskript zeigt einen gängiger Analyseablauf: Das Skript importiert eine Tabelle (metar-statement import), analysiert die Daten (limma voom – eine verbreitete statistische Analysemethode zum Vergleichen von Gendaten), transformiert sie (join, subset rows), erzeugt eine Darstellung der Ergebnisse (heatmap) und visualisiert bzw. speichert diese (multiplot, render).

Dieses Skript verwendet nur eine kleine Teilmenge der in MetaR verfügbaren metar-statements. Das Tool ist sehr vielseitig verwendbar und kann problemlos erweitert werden, um ein breites Spektrum von Datenanalysen und -visualisierungen zu ermöglichen. Neue Sprachen können auf einfache Weise neue metar-statements definieren, die sich in Analysis-Elementen nahtlos mit vorhandenen Anweisungen kombinieren lassen.

Weitere Beispiele für Datenvisualisierung

Ziel

MetaR ist geeignet für:

  1. Biolog*innen ohne Programmierkenntnisse, die ihre Daten analysieren möchten
  2. Bioinformatiker*innen, die wiederholungsintensive Analysen durchführen und durch spezielle Mikrosprachen die Effizienz und Konsistenz ihrer Datenanalysen steigern möchten
  3. R-Programmierer*innen, die mit Sprachkomposition und -erweiterung experimentieren möchten
  4. Bioinformatiker*innen, die modernste Analysemethoden in benutzerfreundlichen MetaR-Analysesprache-Konstrukten bereitstellen möchten: MetaR dient als Brücke, mit deren Hilfe Experten ihre in R entwickelten Analysemethoden einem breiten Publikum zugänglich machen, ohne viel Aufwand in die Entwicklung von Benutzeroberflächen investieren zu müssen.

Schulungen

In regelmäßigen Abständen werden Schulungen für Mitarbeiter*innen, Studierende, Postdocs und Forscher*innen angeboten, die in den Einrichtungen des Clinical & Translational Science Center (Memorial Sloan-Kettering Cancer Center, Hospital for Special Surgery, NewYork-Presbyterian Hospital, Hunter College und Cornell University) arbeiten. Die Teilnehmerliste enthält jedoch oft auch Gäste aus anderen Institutionen in New York. Wir haben festgestellt, dass Anfänger*innen die im Rahmen der Schulung gestellten Aufgaben nach weniger als 2 Stunden Schulungsdauer erledigen können, während bei einer herkömmlich konzipierten Schulung für R und R-Pakete dieselben Aufgaben mehrere Sitzungen (6 bis 24 Stunden) und umfassende technische Hintergrundkenntnisse erfordern würden.

Gründe für MPS

MetaR nutzt die Vorteile von JetBrains MPS, um die Datenanalyse in R zu vereinfachen. Durch MPS haben sich neue und einzigartige Möglichkeiten für MetaR ergeben:

  • Die interaktiven Funktionen des Projektionseditors wie die automatische Vervollständigung bieten Anfängern und Experten Unterstützung bei der Entwicklung von Analysen.
  • Die Möglichkeit, Knoten mit einer Mischung aus Text und grafischen Komponenten zu rendern, bietet eine Benutzererfahrung auf verschiedenen Ebenen.
  • Durch Sprachkomposition können Experten MetaR um eigene Konstrukte erweitern und diese einfach in andere Sprachen integrieren.
  • Durch Ausführungskonfigurationen kann MetaR definieren und steuern, wie Analyseskripte in verschiedenen Umgebungen ausgeführt werden. Fehlende Abhängigkeiten werden dabei transparent installiert, bevor die Skripte ausgeführt werden.
  • Durch die Fähigkeit, Skripte in der Sprache R (dem Goldstandard der Datenanalyse) zu generieren, kann MetaR auf die Funktionen von R aufbauen und das volle Spektrum der mehr als 10.000 für R verfügbaren Pakete nutzen.

MetaR wird als Plugin-Set für MPS bereitgestellt.

Weitere Informationen

Kontakt

Manuele Simi, Senior Software Engineer, Weill Cornell Medicine

Twitter: @ManueleSimi

Ähnliche Kundenstudien

DTO

Diederik Dulfer, niederländisches Finanzamt

JetBrains MPS gibt uns die Möglichkeit, die niederländischen Steuervorschriften in einer leicht verständlichen Sprache auszudrücken. Wir verwenden diese Sprache in MPS, um unsere Steuerberechnungen zu definieren und zu testen und um Quellcode für unsere Zielplattformen zu generieren.

RoadBotics

Matt Lucas, Produktleiter, RoadBotics

Wir sind unter anderem deswegen auf WebStorm umgestiegen, weil viele der Premium-Funktionen bereits vorinstalliert sind. Dadurch können wir schnell loslegen und gleichzeitig die Abhängigkeit von weiteren Anbietern reduzieren. Außerdem lässt sich der Zugang zu unseren Entwicklungstools leichter verwalten, wenn wir alle unsere Softwarelizenzen an einem Ort konzentrieren.

Skillaz

Alexander Shtanov, Teamleiter, Skillaz

Wir haben uns für JetBrains entschieden, weil das Unternehmen ein Tools-Ökosystem bietet, dessen zahlreiche Funktionen nicht nur unsere Produktivität steigern, sondern uns auch auf anderen Wegen helfen, besser zu arbeiten.

Weitere Kundenstudien