업계: 교육, 연구

사용한 JetBrains 제품: MPS

조직 규모: 5,000-10,000

국가: 미국

Weill Cornell 임상 및 중개 과학 센터

JetBrains MPS로 구축된 MetaR은 최소한의 컴퓨팅 능력만 가진 생의학 과학자들이 데이터를 쉽게 분석할 수 있도록 Weill Cornell 의학 임상 및 중개 과학 센터에서 개발되었습니다.

“MetaR은 JetBrains MPS를 활용하여 R 언어를 이용한 데이터 분석의 편리성을 높여줍니다. MPS는 MetaR을 새롭고 독특하게 활용할 수 있는 가능성을 제시합니다.”

— Manuele Simi, Weill Cornell Medicine 선임 ​​소프트웨어 엔지니어

문제

데이터 분석 도구는 생물학 연구에 필수적이 되었습니다. 오늘날 사용 가능한 도구는 수십 년에 걸쳐 개발된 기술 레이어를 사용하여 만들어졌습니다. 생물학자와 임상의는 데이터를 생성하는 실험에 독자적인 지식을 가지고 있어 자체 분석을 수행할 수 있는 이상적인 위치에 있기 때문에 기본 또는 고급 데이터 분석을 수행하도록 요구 받는 경우가 많습니다. 그러나 통계 언어는 이들이 항상 쉽게 접근할 수 있는 것은 아니며 컴퓨팅 경험이 제한적인 점도 장애 요인이 됩니다.

솔루션

R 언어는 생물학의 데이터 분석에 널리 사용됩니다. 전문 생물 통계학자와 생물 정보학자들이 생물학적 고처리량 데이터에 대한 고급 분석을 구현하는 많은 R 패키지를 개발하고 있습니다. 그러나 R이 제공하는 유연성을 최대한 활용하는 데 필요한 계산 및 통계 지식을 습득하려면 오랜 시간이 걸립니다.

MetaR은 Language Workbench Technology를 적용하여 생물학자에게 맞춤화된 데이터 분석 언어 세트를 만듭니다. 이러한 언어는 이 언어로 개발된 패키지를 활용하기 위한 기본 R 코드를 자동으로 생성합니다. MetaR은 사용자가 구문에 대한 최소한의 지식만으로 자신의 분석 구문을 작성할 수 있게 해주는 통합 환경입니다. 여러 다른 언어의 요소를 복합시킬 수 있다는 점과 함께 프로젝션 에디터의 자동 완성 기능을 통해 객체간에 참조를 간편하게 설정하고 사용자의 오타를 방지할 수 있습니다.

MetaR의 핵심적 측면은 단일 플랫폼에서 사용자 인터페이스와 스크립팅을 결합하는 방식에 있습니다. 이러한 방식을 도입하면 데이터를 보다 효율적으로 분석할 수 있습니다. 전문가들은 사전 프로그래밍 경험이 필요하지 않고 그래픽 사용자 인터페이스처럼 작동하면서도 스크립팅의 장점을 유지할 수 있는 단순한 데이터 분석 언어를 설계할 수 있습니다. MetaR을 사용하면 또한 네이티브 또는 가상화된 환경에서 분석을 수행할 수 있습니다.

MetaR 언어

처리량이 많은 데이터로 작업하려면 종종 데이터 테이블을 입력으로 사용해야 하므로 MetaR에는 설계의 핵심 요소로 테이블이 포함되어 있습니다. 테이블은 MetaR 모델로 가져온 다음 Analysis 요소 내에서 metar-문으로 분석됩니다.

MetaR 문은 언어 구문에 대한 사전 지식의 필요성을 없애주는 선언적 언어 구조문으로, 프로그래밍에 대한 지식이 없는 초보자가 쉽게 배울 수 있습니다.

MetaR에서 가져온 테이블의 예:

분석 스크립트의 예:

위의 분석 스크립트는 데이터 분석에서 매우 일반적인 절차로서, 테이블을 가져오고(import metar-statement) 데이터를 처리하고(limma voom - 유전자 세트를 비교하기 위해 통계 분석에서 널리 사용되는 분석법) 변환하고(join, subset rows), 마지막으로 결과 플롯을 그리고(heatmap) 시각화/저장(multiplot, render)하는 방법을 보여줍니다.

이 스크립트는 MetaR과 함께 배포된 metar-문의 극히 일부만 사용합니다. 그러나 이 도구는 일반적이며 광범위한 데이터 분석 및 시각화를 지원하도록 쉽게 확장할 수 있습니다. 새로운 언어에서 Analysis 요소 내에 이미 들어 있는 내용과 원활하게 통합되는 새로운 metar-문을 쉽게 만들고 추가할 수 있습니다.

데이터 시각화의 다른 예

대상

MetaR은 다음과 같은 형태로 이용할 수 있습니다.

  1. 프로그래밍 기술이 없지만 데이터 분석을 원하는 생물학자.
  2. 반복적인 분석을 수행해야 하고 데이터 분석의 효율성과 일관성을 높이기 위해 특수 마이크로 언어를 설계하고 사용하는 것이 유익하다고 느끼는 생물 정보학자.
  3. 언어 구성 및 확장을 실험하려는 R 프로그래머.
  4. 최첨단 분석법을 사용자 친화적인 MetaR 분석 언어 구문으로 패키징하려는 생물 정보학자. MetaR은 R에서 분석법을 개발하는 전문가가 사용자 인터페이스를 개발하는 데 많은 노력을 기울일 필요없이 가능한 광범위한 대상에게 이러한 분석법을 배포할 수 있도록 하는 가교 역할을 할 수 있습니다.

교육 세션

교육 세션은 임상 및 중개 과학 센터 기관(Memorial Sloan-Kettering 암 센터, 특수 수술 병원, 뉴욕 장로 병원, 헌터 칼리지 및 , 코넬 대학) 중 한 곳에서 예약을 잡는 직원, 학생, 포스트닥터 및 연구원들에게 주기적으로 제공되지만 종종 NYC의 다른 기관에서도 참여합니다. MetaR을 사용하면 초보자라도 2시간 내에 세션 과제를 완료할 수 있습니다. 반면, R 및 해당 패키지에 대한 보다 전통적인 교육에서는 여러 세션(6 ~ 24시간)과 광범위한 기술 배경이 필요합니다.

MPS여야 하는 이유

MetaR은 JetBrains MPS를 활용하여 R 언어를 이용한 데이터 분석의 편리성을 높여줍니다. MPS는 MetaR을 새롭고 독특하게 활용할 수 있는 가능성을 제시합니다.

  • 자동 완성과 같은 프로젝션 에디터의 대화형 기능은 언어를 사용하여 분석을 개발할 때 초보자와 전문가 모두에게 유익한 가이드를 제공합니다.
  • 텍스트 및 그래픽 사용자 인터페이스 구성 요소가 혼합된 노드를 렌더링하는 기능은 다양한 수준의 사용자 경험을 제공합니다.
  • 언어 구성을 통해 전문가는 자체 구문으로 MetaR을 확장하고 다른 언어와 쉽게 통합할 수 있습니다.
  • 실행 구성을 통해 MetaR은 다양한 환경에서 분석 스크립트를 실행하는 방법을 정의 및 제어하고 스크립트가 실행되기 전에 누락된 종속성을 투명하게 설치할 수 있습니다.
  • R 언어 스크립트를 생성하는 기능(데이터 분석과 관련하여 절대 표준)을 사용하면 MetaR이 R의 기능을 기반으로 R의 방대한 패키지(10,000개 이상)가 제공하는 이점을 누릴 수 있습니다.

MetaR은 MPS용 플러그인 세트로 배포됩니다.

참조

문의

Manuele Simi, Weill Cornell Medicine 선임 ​​소프트웨어 엔지니어

트위터: @ManueleSimi

유사한 고객 후기

DTO

Diederik Dulfer, 네덜란드 세무서

Jetbrains MPS를 통해 이해하기 쉬운 네덜란드어 세금 규정 언어를 개발할 수 있었습니다. MPS에서 이 언어를 사용해 세금 계산을 지정 및 테스트하고, 대상 플랫폼의 소스 코드를 생성하고 있습니다.

RoadBotics

Matt Lucas, RoadBotics 제품 총괄

저희가 부분적으로 WebStorm으로 전환한 이유는 많은 프리미엄 기능이 처음부터 포함되어 있다는 점 때문이었습니다. 이로 인해 추가적인 타사 제품에 대한 의존도를 낮추면서도 일에 바로 착수 할 수 있게 되었습니다. 그뿐 아니라 소프트웨어 라이선스가 한 곳에 있어, 개발 도구에 대한 접근 관리가 한결 간편해 졌습니다.

Skillaz

Alexander Shtanov, Skillaz 팀장

JetBrains를 선택한 이유는 제품 도구의 에코시스템 때문이기도 했습니다. 이러한 도구는 다양한 기능으로 생산성을 향상시켜줄 뿐만 아니라 다른 방식으로도 업무 효율성을 높여주었습니다.

고객 후기 더보기