“MetaR 利用 JetBrains MPS 来简化使用 R 语言进行的数据分析。MPS 为 MetaR 创造了全新而独特的可能性。”
— Manuele Simi,高级软件工程师,Weill Cornell Medicine
数据分析工具对于生物学研究必不可少。现今可用的工具是利用数十年来发展起来的各种技术层次构建的。生物学家和临床医生经常被要求进行基本或高级数据分析,他们在生成数据的实验方面拥有独特知识,所以十分适合自己进行分析。然而,统计语言对他们来说并不总是那么易用,而且他们有限的计算经验往往也成为障碍。
R 语言被广泛用于生物学中的数据分析。资深的生物统计学家和生物信息学家开发了许多可对生物高通量数据进行高级分析的 R 软件包。但是,要完全从 R 提供的灵活性中受益,需要花费很长时间来获取计算和统计知识。
MetaR 采用语言工作台技术创建了一套为生物学家量身定制的数据分析语言。这些语言会自动生成底层的 R 代码,以便使用以该语言开发的软件包。MetaR 是一个集成环境,让用户能够在不太了解结构语法的情况下编写自己的分析。除了不同语言的元素组合之外,投影编辑器的自动补全功能还提供了一种方便的方法来设置对象之间的引用并帮助用户避免拼写错误。
MetaR 的一个关键特征是它将用户界面和脚本编写结合在一个平台上。此功能可以更高效地分析数据。专家可以设计简化的数据分析语言,这些语言不需要任何先前的编程经验,而且在保持脚本编写的优势同时,可以像图形用户界面那样工作。此外,MetaR 还可以在本机或虚拟环境中执行分析。
处理高通量数据通常需要将数据表作为输入,因此 MetaR 将 Table 作为设计的关键要素。将表导入到 MetaR 模型中,然后在 Analysis 元素内使用 metar 语句进行分析。
MetaR 语句是声明式语言结构,无需深入了解语言语法知识,这有助于为刚入门但不了解编程的初学者提供一个平滑的学习曲线。
MetaR 中导入的表示例:
分析脚本示例:
上面的分析脚本显示了如何导入表(import metar 语句),详细阐述(limma voom - 统计分析中比较基因组的一种常用方法)并转换 (join、subset rows)其数据,最后绘制 (heatmap) 并可视化/保存(multiplot、render)结果图,这是数据分析中非常常见的一组过程。
此脚本仅使用与 MetaR 一起分发的 metar 语句的一个很小的子集。但是,该工具通用,可以轻松扩展以支持一系列数据分析和可视化。新语言可以轻松创建和添加可与 Analysis 元素内已经存在的语句无缝集成的新 metar 语句。
MetaR 可供以下人员使用:
我们定期为在 Clinical & Translational Science Center 机构(Memorial Sloan-Kettering Cancer Center、Hospital for Special Surgery、NewYork-Presbyterian Hospital、Hunter College 和 Cornell University)之一中任职的工作人员、学生、博士后和研究者提供培训课程,但通常包括来自纽约市其他机构的参与者。我们发现,初学者可以使用 MetaR 在不到 2 小时内完成课程任务,而使用 R 及其软件包的更传统培训则需要多次课程(6-24 小时)和广泛的技术背景。
MetaR 利用 JetBrains MPS 来简化使用 R 语言进行的数据分析。MPS 为 MetaR 创造了全新而独特的可能性:
MetaR 作为 MPS 的一组插件分发。
Manuele Simi,高级软件工程师,Weill Cornell Medicine
Twitter:@ManueleSimi
Diederik Dulfer,荷兰税务局
JetBrains MPS 让我们能够创造可理解的荷兰语税收规则语言。 在 MPS 中,我们使用这种语言来指定和测试税务计算,并为我们的目标平台生成源代码。
Matt Lucas,RoadBotics 产品主管
我们已部分改用 WebStorm,因为许多高级功能都已经预打包,这样我们就可以快速地开始工作,同时减少对其他第三方的依赖。 而且,将我们所有的软件许可证集中于一处更易于管理开发工具的访问权限。
Alexander Shtanov,Skillaz 团队主管
我们选择 JetBrains 产品是因为其工具的生态系统,这些工具的功能不仅能够提升我们的生产效率,还有助于我们以其他方式更好地工作。