Setor: Educação, Pesquisa

Produtos da JetBrains usados: MPS

Tamanho da organização: 5,000-10,000

País: Estados Unidos

Weill Cornell Clinical & Translational Science Center

O MetaR, criado com o JetBrains MPS, foi desenvolvido no Weill Cornell Medicine Clinical & Translational Science Center para facilitar a análise de dados para cientistas biomédicos com habilidades mínimas de computação.

“O MetaR aproveita o JetBrains MPS para tornar a análise de dados com a linguagem R ainda mais fácil. O MPS criou possibilidades totalmente novas e exclusivas para o MetaR.”

— Manuele Simi, Engenheiro de Software Sênior, Weill Cornell Medicine

Problema

Ferramentas de análise de dados tornaram-se essenciais para o estudo da biologia. As ferramentas disponíveis hoje foram desenvolvidas usando camadas de tecnologia desenvolvidas ao longo de décadas. Biólogos e médicos são frequentemente chamados para realizar análises de dados básicas ou avançadas, pois seu conhecimento único dos experimentos que geram os dados os coloca na posição ideal para realizar suas próprias análises. No entanto, as linguagens estatísticas nem sempre são facilmente acessíveis para eles, e sua experiência de computação limitada costuma ser um obstáculo.

Solução

A linguagem R é amplamente usada para análise de dados em biologia. Especialistas em bioestatística e bioinformática desenvolveram muitos pacotes R que implementam análises avançadas para dados biológicos de alto tempo de processamento. No entanto, demora muito para adquirir o conhecimento computacional e estatístico necessário para se beneficiar totalmente da flexibilidade que o R pode oferecer.

O MetaR aplica a Language Workbench Technology para criar um conjunto de linguagens de análises de dados sob medida para biólogos. Essas linguagens geram automaticamente o código R subjacente para aproveitar os pacotes desenvolvidos nessa linguagem. O MetaR é um ambiente integrado que possibilita aos usuários escrever suas próprias análises com conhecimento mínimo da sintaxe dos construtos. Os recursos de autocomplementação dos editores de projeção, além da composição de elementos a partir de diferentes linguagens, oferecem uma maneira conveniente de definir referências entre objetos e ajudam os usuários a evitar erros de digitação.

Um aspecto importante do MetaR é a maneira como ele combina a interface de usuário e scripts em uma única plataforma. Esse recurso permite analisar os dados com mais eficiência. Os especialistas podem projetar linguagens de análises de dados simplificadas que não requerem nenhuma experiência anterior em programação e que se comportam como interfaces gráficas de usuário, mantendo ao mesmo tempo todas as vantagens dos scripts. O MetaR também possibilita a realização de análises em ambientes nativos ou virtualizados.

As linguagens do MetaR

Como trabalhar com dados de alto tempo de processamento geralmente requer o uso de tabelas de dados como entradas, o MetaR inclui Table como um elemento-chave do design. Tabelas são importadas para os modelos do MetaR e depois analisadas com instruções metar dentro de elementos Analysis.

Instruções MetaR são construções de linguagem declarativa que dispensam a necessidade de conhecimento prévio sobre a sintaxe da linguagem, o que ajuda a fornecer uma curva de aprendizado suave para iniciantes que estão começando e que não têm conhecimento de programação.

Exemplo de tabela importada no MetaR:

Exemplo de script de análise:

O script Analysis acima mostra como importar uma tabela (instrução metar import), elaborar (limma voom, um método popular em análise estatística para comparar conjuntos de genes) e transformar (join, subset rows) seus dados e, por fim, desenhar (heatmap) e visualizar/salvar (multiplot, render) um gráfico dos resultados, que é um conjunto de procedimentos muito comum em análises de dados.

Esse script usa apenas um subconjunto muito pequeno de instruções metar distribuídas com o MetaR. No entanto, a ferramenta é geral e pode ser prontamente estendida para oferecer suporte a uma ampla variedade de análises e visualizações de dados. Novas linguagens podem facilmente criar e adicionar novas instruções metar que se integram perfeitamente com aquelas já existentes dentro de elementos Analysis.

Outros exemplos de visualização de dados

Alvo

O MetaR pode ser usado por:

  1. Biólogos sem habilidades de programação que desejam analisar seus dados.
  2. Bioinformáticos que precisam realizar análises repetitivas e que acham benéfico projetar e usar microlinguagens especializadas para aumentar a eficiência e a consistência de suas análises de dados.
  3. Programadores especializados em R que desejam experimentar composição e extensão da linguagem.
  4. Bioinformáticos que desejam agrupar métodos de análise de última geração em construtos de linguagem de análise MetaR fáceis de usar. O MetaR pode atuar como uma ponte que permite aos especialistas que desenvolvem métodos de análises em R distribuir esses métodos para o maior público possível, sem precisarem investir muitos esforços no desenvolvimento de interfaces de usuário.

Sessões de treinamento

Sessões de treinamento são oferecidas periodicamente a funcionários, alunos, pós-doutorandos e pesquisadores que têm uma consulta em uma das instituições do Clinical & Translational Science Center (Memorial Sloan-Kettering Cancer Center, Hospital for Special Surgery, NewYork-Presbyterian Hospital, Hunter College e Cornell University), mas, em geral, incluem participantes de outras instituições em Nova York. Descobrimos que os iniciantes podem completar as tarefas da sessão em menos de 2 horas com o MetaR, enquanto o treinamento mais tradicional em R e seus pacotes exigiria várias sessões (6 a 24 horas) e um amplo conhecimento técnico.

Por que o MPS?

O MetaR aproveita o JetBrains MPS para tornar a análise de dados com a linguagem R ainda mais fácil. O MPS criou possibilidades totalmente novas e exclusivas para o MetaR:

  • Os recursos interativos do editor de projeção, como a autocomplementação, fornecem orientação para iniciantes e especialistas ao usar a linguagem para desenvolver análises.
  • A capacidade de renderizar nós com uma combinação de texto e componentes de interface gráfica de usuário garante vários níveis de experiência do usuário.
  • A composição da linguagem torna possível para os especialistas estender o MetaR com seus próprios construtos e integrá-los facilmente com outras linguagens.
  • Configurações de execução permitem que o MetaR defina e controle como executar scripts de análise em diferentes ambientes e instalam de forma transparente as dependências ausentes antes que os scripts sejam executados.
  • A capacidade de gerar scripts da linguagem R (o padrão ouro quando se trata de análises de dados) torna possível para o MetaR basear-se nos recursos do R e beneficiar-se da ampla variedade de pacotes (mais de 10.000) disponíveis para o R.

O MetaR é distribuído como um conjunto de plug-ins para o MPS.

Referências

Contatos

Manuele Simi, Engenheiro de Software Sênior, Weill Cornell Medicine

Twitter: @ManueleSimi

Histórias de clientes semelhantes

DTO

Diederik Dulfer, Administração Fiscal Holandesa

O MPS da JetBrains nos dá o poder de criar uma linguagem compreensível de regulamentações fiscais holandesas. Usamos essa linguagem no MPS para especificar e testar nossos cálculos de impostos e gerar código-fonte para nossas plataformas de destino.

RoadBotics

Matt Lucas, Chefe de produtos, RoadBotics

Migramos para o WebStorm em parte porque muitos dos recursos Premium estão incluídos no pacote, o que nos permite começar rapidamente, reduzindo nossa dependência por ferramentas de terceiros. Além disso, ter todas as nossas licenças de software em um só lugar facilitou o acesso às nossas ferramentas de desenvolvimento.

Skillaz

Alexander Shtanov, Líder de Equipe, Skillaz

Optamos pela JetBrains por causa de seu ecossistema de ferramentas, cujas variadas funcionalidades não apenas melhoram nossa produtividade, como nos ajudam a trabalhar melhor de outras maneiras também.

Mais histórias de clientes