Сфера деятельности: Образование, Исследования

Используемые продукты JetBrains: MPS

Число сотрудников: 5,000-10,000

Страна: США

Центр клинических и трансляционных исследований Weill Cornell Medicine

Система MetaR была разработана с помощью JetBrains MPS в Центре клинических и трансляционных исследований Weill Cornell Medicine, чтобы ученым, занимающимся медико-биологическими исследованиями, было просто выполнять анализ данных, обладая минимальными навыками программирования.

«MetaR упрощает анализ данных с помощью языка R. MPS создает новые уникальные возможности для развития MetaR».

— Мануэле Сими, старший разработчик, Weill Cornell Medicine

Проблема

Инструменты для анализа данных незаменимы в биологии. Те, что доступны сегодня, создавались с использованием технологий, разрабатываемых десятилетиями. К анализу данных часто привлекают врачей и биологов, поскольку именно они обладают знаниями об экспериментах, из которых получены данные, и лучше других подходят на роль аналитиков. Однако порой этому препятствуют ограниченный опыт программирования и сложность языков для статистического анализа.

Решение

Язык R широко используется для анализа данных в биологии. Эксперты в области биостатистики и биоинформатики разработали множество пакетов R для высокопроизводительных вычислений при анализе биологически данных. Однако для использования гибких возможностей R, необходимо получить знания в области статистики и программирования, и это занимает много времени.

В MetaR используется технология Language workbench для создания набора языков, адаптированных к потребностям биологов. Эти языки автоматически генерируют R-код, чтобы у пользователей был доступ к преимуществам пакетов. MetaR — это интегрированная среда, которая позволяет самостоятельно производить анализ с минимальным знанием синтаксиса языка. Автодополнение в проекционных редакторах и использование элементов из разных языков, помогают устанавливать ссылки между объектами и избегать опечаток.

Важная особенность платформы MetaR заключается в том, что она объединяет в себе пользовательский интерфейс и написание скриптов. Это позволяет более эффективно анализировать данные. Специалисты могут разрабатывать упрощенные языки, которые не требуют опыта программирования и ведут себя как графические интерфейсы, сохраняя при этом преимущества программного подхода. MetaR также позволяет выполнять анализ в нативных и виртуальных окружениях.

Языки MetaR

Поскольку работа с большими данными часто требует использования таблиц, Table является ключевым элементом MetaR. Таблицы импортируются в модели MetaR, а затем анализируются с помощью <1>metar-операторов<1> внутри элементов Analysis.

MetaR-операторы — это декларативные языковые конструкции, которые устраняют необходимость знать синтаксис языка. Это помогает быстро освоить инструмент тем, кто только начинает работать и не владеет навыками программирования.

Пример таблицы, импортированной в MetaR:

Пример скрипта анализа:

Приведенный скрипт представляет собой довольно распространенный набор процедур при анализе данных: импортировать таблицу (metar-оператор import), обработать данные (limma voom — популярный метод статистического анализа для сравнения наборов генов), преобразовать их (join, subset rows), представить результаты (heatmap) и визуализировать/сохранить их (multiplot, render).

В этом примере использованы лишь несколько metar-операторов, доступных в MetaR. Это универсальный инструмент, который можно легко расширять для поддержки различных способов анализа и визуализации данных. Можно создавать и добавлять новые metar-операторы, которые легко интегрируются с теми, что уже есть в элементах Analysis.

Другие примеры визуализации данных

Применение

MetaR могут использовать:

  1. Биологи, не владеющие навыками программирования, которые хотят анализировать данные.
  2. Биоинформатики, которым необходимо выполнять повторный анализ и выгодно разрабатывать и использовать специализированные микроязыки для повышения эффективности и согласованности анализа данных.
  3. R-программисты, которые хотят поэкспериментировать со структурой и расширением языка.
  4. Биоинформатики, которые хотят обернуть современные методы анализа в удобные языковые конструкции MetaR. MetaR позволяет специалистам, разрабатывающим методы анализа на языке R, распространять эти методы среди широкой аудитории, не вкладывая больших усилий в создание пользовательских интерфейсов.

Обучение

Мы периодически проводим занятия для сотрудников, студентов, постдоков и исследователей в одном из наших учреждений (Мемориальном онкологическом центре им. Слоуна-Кеттеринга, Больнице специальной хирургии, Нью-Йоркской пресвитерианской больнице, Хантерском колледже и Корнельском университете). Часто в семинарах участвуют специалисты из других учреждений Нью-Йорка. Оказалось, что новички справляются с заданиями в MetaR менее чем за два часа, в то время как для более традиционного обучения R и его пакетам требуется несколько занятий (6–24 часа) и обширный технический опыт.

Почему MPS

MetaR упрощает анализ данных с помощью языка R. MPS создает новые уникальные возможности для развития MetaR:

  • Интерактивные функции проекционного редактора, такие как автодополнение кода, помогают новичкам и экспертам при использовании языка для анализа данных.
  • Возможность отображать узлы в сочетании с текстовыми и графическими компонентами интерфейса обеспечивает различные уровни взаимодействия с пользователем.
  • Специалисты из разных областей могут расширять MetaR собственными конструкциями и легко интегрировать их с другими языками.
  • Конфигурации запуска позволяют определять и контролировать выполнение скриптов анализа в различных окружениях и устанавливать недостающие зависимости до выполнения скриптов.
  • Возможность генерировать скрипты на языке R (эталонном языке анализа данных) позволяет использовать возможности R и огромного количества доступных пакетов (более 10 000).

MetaR распространяется как набор плагинов для MPS.

Ссылки

  • Сайт MetaR: metar-languages.github.io
  • Сайт Центра клинических и трансляционных исследований: ctscweb.weill.cornell.edu
  • Центр клинических и трансляционных исследований в X: @WCMC_CTSC
  • Сайт Campagne Laboratory (где изначально разрабатывался MetaR): campagnelab.org
  • Fabien Campagne, William ER Digan, Manuele Simi MetaR: simple, high-level languages for data analysis with the R ecosystem bioRxiv 2015 doi: dx.doi.org/10.1101/030254

Контакты

Мануэле Сими, старший разработчик, Weill Cornell Medicine

Twitter: @ManueleSimi

Похожие истории клиентов

DTO

Diederik Dulfer, представитель Налоговой и таможенной администрации Нидерландов

Платформа JetBrains MPS позволила нам создать понятный язык для применения голландского налогового законодательства. Мы используем этот язык для ведения и тестирования налоговых расчетов и генерации исходного кода для целевых платформ.

RoadBotics

Мэтт Лукас, руководитель продукта, RoadBotics

Одной из причин, побудивших нас перейти на WebStorm, было наличие в его стандартной комплектации множества премиальных возможностей, которые позволили быстро приступать к работе и снизить зависимость от стороннего ПО. Кроме того, централизация всех лицензий на программное обеспечение позволила нам проще управлять доступом к инструментам разработки.

Skillaz

Александр Штанов, тимлид, Skillaz

Мы выбрали JetBrains, потому что это целая экосистема инструментов, которые не только повышают нашу продуктивность, но и помогают во многом другом

Другие истории клиентов