Industria: Educación, Investigación

Productos de JetBrains utilizados: MPS

Tamaño de la organización: 5,000-10,000

País: Estados Unidos

Weill Cornell Clinical & Translational Science Center

MetaR, creado con JetBrains MPS, se desarrolló en el Weill Cornell Medicine Clinical & Translational Science Center para facilitar el análisis de datos a científicos biomédicos con habilidades de informática mínimas.

«MetaR aprovecha MPS de JetBrains para facilitar el análisis de datos con el lenguaje R. MPS ha creado posibilidades nuevas y únicas para MetaR».

— Manuele Simi, ingeniero de software Senior, Weill Cornell Medicine

Problema

Las herramientas de análisis de datos se han vuelto esenciales para el estudio de la biología. Las herramientas disponibles actualmente se han construido utilizando capas de tecnología desarrolladas durante décadas. A los biólogos y profesionales clínicos a menudo se les pide que lleven a cabo análisis de datos básicos o avanzados, pues su conocimiento único de los experimentos que generan los datos los sitúan en una posición ideal para realizar sus propios análisis. Sin embargo, los lenguajes estadísticos no siempre están fácilmente accesible para ellos, y su limitada experiencia en informática suele resultar un obstáculo.

Solución

El lenguaje R se utiliza ampliamente para el análisis de datos en biología. Expertos bioestadísticos y bioinformáticos han desarrollado numerosos paquetes de R que implementan análisis avanzados para los datos de alto rendimiento biológicos. No obstante, se necesita mucho tiempo para adquirir el conocimiento computacional y estadístico requerido para aprovechar completamente la flexibilidad que ofrece R.

MetaR aplica Language Workbench Technology para crear un conjunto de lenguajes de análisis de datos adaptado a los biólogos. Estos lenguajes generan de forma automática el código R subyacente para aprovechar los paquetes desarrollados en este lenguaje. MetaR es un entorno integrado que permite a los usuarios escribir sus propios análisis con un conocimiento mínimo de la sintaxis de las construcciones. Las funcionalidades de autocompletado de los editores de proyecciones, además de la composición de elementos de diferentes lenguajes, ofrecen una manera práctica de definir las referencias entre los objetos y ayuda a los usuarios a evitar los errores tipográficos.

Un aspecto clave de MetaR es el modo en que combina la interfaz de usuario y los scripts en una sola plataforma. Esta funcionalidad permite analizar los datos de manera más eficaz. Los expertos pueden diseñar lenguajes de análisis de datos simplificados que no requieren experiencia previa en programación y se comportan como interfaces de usuario gráficas, al tiempo que conservan las ventajas de los scripts. MetaR también permite realizar análisis en entornos nativos o virtualizados.

Los lenguajes MetaR

Dado que trabajar con datos de alto rendimiento a menudo exige la utilización de tablas de datos como entradas, MetaR incluye Table como elemento clave del diseño. Las tablas se importan en los modelos MetaR y después se analizan con metar-statements dentro de los elementos Analysis.

Las declaraciones MetaR son construcciones de lenguaje declarativas que eliminan la necesidad de conocimientos previos de la sintaxis del lenguaje, lo que reduce la curva de aprendizaje de los principiantes sin conocimientos de programación en los primeros pasos.

Ejemplo de tabla importada en MetaR:

Ejemplo de script de análisis:

El script de análisis anterior muestra cómo importar una tabla (declaración metar import), elaborar (limma voom, un método popular en el análisis estadístico para comparar conjuntos de genes) y transformar (join, subset rows) sus datos y, finalmente, dibujar (heatmap) y visualizar/guardar (multiplot, render) una representación gráfica de los resultados, lo cual es un conjunto de procedimientos muy común en el análisis de datos.

Este script solo utiliza un subconjunto muy pequeño de las declaraciones metar distribuidas con MetaR. No obstante, la herramienta es general y se puede ampliar fácilmente para respaldar una gran variedad de análisis de datos y visualizaciones. Se pueden crear nuevos lenguajes fácilmente y añadir declaraciones metar que se integran perfectamente con las que ya existen en los elementos Analysis.

Otros ejemplos de visualización de datos

Destino

MetaR lo pueden utilizar:

  1. Biólogos sin habilidades de programación que quieren analizar sus datos.
  2. Bioinformáticos que necesitan realizar análisis repetitivos y a los que les resulta beneficioso diseñar y usar microlenguajes especializados para aumentar la eficiencia y la coherencia de sus análisis de datos.
  3. Programadores R que quieren experimentar con la composición y la extensión de los lenguajes.
  4. Bioinformáticos que quieren agrupar métodos de análisis de última generación en construcciones de lenguaje de análisis MetaR fáciles de usar. MetaR puede actuar como un puente que permite a los expertos que desarrollan métodos de análisis en R distribuir estos métodos a la mayor audiencia posible sin tener que invertir demasiados esfuerzos en desarrollar interfaces de usuario.

Sesiones de formación

Periódicamente, se ofrecen sesiones de formación a empleados, estudiantes, postdoctorandos e investigadores con un puesto en una de nuestras instituciones del Clinical & Translational Science Center (Memorial Sloan-Kettering Cancer Center, Hospital for Special Surgery, NewYork-Presbyterian Hospital, Hunter College y Cornell University), pero a menudo incluyen a participantes de otras instituciones de Nueva York. Hemos detectado que los principiantes pueden completar los ejercicios de la sesión en menos de 2 horas con MetaR, mientras que una formación más tradicional en R y sus paquetes requeriría varias lecciones (6–24 horas) y una amplia experiencia técnica.

Por qué MPS

MetaR aprovecha MPS de JetBrains para facilitar el análisis de datos con el lenguaje R. MPS ha creado posibilidades nuevas y únicas para MetaR:

  • Las funcionalidades interactivas del editor de proyecciones, como el autocompletado, ofrecen consejos tanto a principiantes como a expertos cuando utilizan el lenguaje para elaborar análisis.
  • La posibilidad de mostrar nodos con una combinación de texto y de componentes de interfaz de usuario gráfica garantiza distintos niveles de experiencia del usuario.
  • La composición del lenguaje permite a los expertos ampliar MetaR con sus propias construcciones e integrarlas fácilmente con el resto de lenguajes.
  • Las configuraciones de ejecución permiten a MetaR definir y controlar cómo ejecutar los scripts de análisis en distintos entornos e instalar de manera transparente las dependencias que falten antes de que se ejecuten los scripts.
  • La capacidad de generar scripts de lenguaje R (el criterio de referencia en materia de análisis de datos) permite que MetaR aproveche las funcionalidades de R y se beneficie de la gran variedad de paquetes (más de 10 000) disponibles para R.

MetaR se distribuye como un conjunto de complementos para MPS.

Referencias

Contacto

Manuele Simi, ingeniero de software Senior, Weill Cornell Medicine

Twitter: @ManueleSimi

Historias de clientes similares

DTO

Diederik Dulfer, Oficina de Recaudación de Impuestos de los Países Bajos

JetBrains MPS nos permite crear el lenguaje comprensible de la normativa fiscal holandesa. En MPS, utilizamos este lenguaje para especificar y probar nuestros cálculos fiscales y generar código fuente para nuestras plataformas de destino.

RoadBotics

Matt Lucas, responsable de producto, RoadBotics

Nos pasamos a WebStorm en parte porque incluye de base muchas funcionalidades premium, lo que nos permite empezar con rapidez y reducir nuestra dependencia de terceros. Además, tener todas nuestras licencias de software en un solo lugar facilita la gestión del acceso a nuestras herramientas de desarrollo.

Skillaz

Alexander Shtanov, jefe del equipo, Skillaz

Optamos por JetBrains por su ecosistema de herramientas, cuyas muchas capacidades no solo mejoran nuestra productividad, sino que también nos ayudan a trabajar mejor en otras vías.

Más historias de clientes