目 录CONTENT

文章目录

告别代码!Watershed Bio平台助科学家无需编程,高效运行复杂数据分析

Administrator
2025-10-15 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://news.mit.edu/2025/helping-scientists-run-complex-data-analyses-without-writing-code-1014

原文作者:Zach Winn | MIT News


告别代码:Watershed Bio平台赋能科研人员,加速生物学发现

由一位麻省理工学院校友联合创立的Watershed Bio公司,为那些并非软件工程师的研究人员提供了一种运行大规模分析的方法,从而加速生物学研究的进程。

近年来,随着诊断和测序技术的成本大幅下降,研究人员积累了空前数量的疾病和生物学数据。然而,希望将这些数据转化为新疗法的科学家们,往往需要依赖具备软件工程经验的人员的帮助。

现在,Watershed Bio正通过其平台帮助科学家和生物信息学家运行实验并获得洞见,该平台允许用户无论其计算技能如何,都能分析复杂的数据集。这个云平台提供了工作流模板和一个可定制的界面,帮助用户探索和共享所有类型的数据,包括全基因组测序、转录组学、蛋白质组学、代谢组学、高内涵成像、蛋白质折叠等。

联合创始人兼首席执行官Jonathan Wang(MIT 2013届,硕士2015届)表示:“科学家们希望学习该领域的软件和数据科学部分,但他们不想仅仅为了理解数据就成为编写代码的软件工程师。有了Watershed,他们就无需如此。”

Watershed正被工业界和学术界的大型和小型研究团队用于推动发现和决策制定。当科学期刊中描述了新的先进分析技术时,这些技术可以立即作为模板添加到Watershed平台上,使所有背景的研究人员都能更容易地使用前沿工具并进行协作。

“生物学中的数据正在以指数级的速度增长,而生成这些数据的测序技术只会变得更好、更便宜,”Wang说。“作为麻省理工学院毕业的人,这个问题非常贴近我的领域:这是一个艰难的技术难题,同时也是一个有意义的问题,因为这些人正在努力治疗疾病。他们知道所有这些数据都很有价值,但他们难以利用这些数据。我们希望帮助他们更快地解锁更多见解。”

零代码探索

Wang最初打算在麻省理工学院主修生物学,但他很快就被能够扩展到数百万用户的计算机科学解决方案的可能性所吸引。他最终获得了电气工程与计算机科学系(EECS)的学士和硕士学位。Wang还在麻省理工学院的一个生物学实验室实习,他对实验的缓慢和劳动密集程度感到惊讶。

“我看到了生物学和计算机科学之间的差异,在计算机科学中,你有这些动态环境,可以立即获得反馈,”Wang说。“即使是单独编写代码的人,也拥有触手可及的许多资源可以进行尝试。”

在麻省理工学院从事机器学习和高性能计算工作期间,Wang还与几位同学共同创立了一家高频交易公司。他的团队雇佣了具有数学和物理学博士学位的研究人员来开发新的交易策略,但他们很快在流程中发现了瓶颈。

“事情进展缓慢,因为研究人员习惯于构建原型,”Wang说。“这些是对他们可以在本地机器上运行的模型的小型近似。要将这些方法投入生产,他们需要工程师在计算集群上以高吞吐量的方式使它们正常工作。但工程师并不理解研究的本质,所以有很多来回沟通。这意味着你认为一天内就能实现的想法,却花了数周时间。”

为了解决这个问题,Wang的团队开发了一个软件层,使构建生产级模型就像在笔记本电脑上构建原型一样简单。然后,在从麻省理工学院毕业几年后,Wang注意到DNA测序等技术变得廉价且普及。

“瓶颈不再是测序,所以人们说,‘让我们对所有东西进行测序,’”Wang回忆道。“限制因素变成了计算。人们不知道如何处理生成的所有数据。生物学家们在等待数据科学家和生物信息学家来帮助他们,但这些人并不总能理解足够深入的生物学知识。”

这种情况让Wang感到似曾相识。

“这与我们在金融领域看到的情况完全一样,研究人员试图与工程师合作,但工程师从未完全理解,而且由于人们需要等待工程师,导致了大量的效率低下,”Wang说。“与此同时,我了解到生物学家渴望运行这些实验,但存在巨大的鸿沟,他们觉得必须成为软件工程师,或者只专注于科学。”

Wang于2019年正式创立了Watershed,联合创始人是他的麻省理工学院前同学、现已不再参与公司日常运营的医生Mark Kalinich(2013届)。

此后,Wang从生物技术和制药公司的管理人员那里了解到生物学研究的复杂性日益增加。解锁新的见解越来越多地涉及分析来自整个基因组、人群研究、RNA测序、质谱分析等数据。开发个性化疗法或为临床研究选择患者群体也可能需要巨大的数据集,而且科学期刊上不断发表新的数据分析方法。

如今,公司可以在Watershed上运行大规模分析,而无需设置自己的服务器或云计算账户。研究人员可以使用与所有最常见数据类型兼容的现成模板来加速工作。像AlphaFold和Geneformer这样的流行AI工具也可用,Watershed的平台使共享工作流程和深入挖掘结果变得容易。

“该平台在易用性和可定制性之间找到了一个适合所有背景人群的平衡点,”Wang说。“没有科学是真正相同的。我避免使用‘产品’这个词,因为它暗示着你部署了某个东西,然后就永远按规模运行它。研究不是那样的。研究是关于产生一个想法、测试它,并利用结果产生另一个想法。你设计、实施和执行实验的速度越快,就能越快地进行下一个。”

加速生物学发展

Wang相信Watershed正在帮助生物学家跟上生物学的最新进展,并在此过程中加速科学发现。

“如果你能帮助科学家加快见解的解锁速度,不是快一点点,而是快10倍或20倍,那就能真正起到重要作用,”Wang说。

Watershed正被学术界和各种规模公司的研究人员使用。生物技术和制药公司的管理人员也使用Watershed来决定新的实验和候选药物。

“我们在所有这些领域都看到了成功,共同点是人们理解研究,但不是计算机科学或软件工程的专家,”Wang说。“看到这个行业发展起来令人兴奋。对我来说,作为麻省理工学院的毕业生,现在回到Watershed所在的肯德尔广场,感觉很棒。这里是如此多尖端进展发生的地方。我们正努力为生物学的未来做出贡献。”

图示:Watershed Informatics为非开发人员的研究人员提供了一种运行大规模分析以加速生物学发展的方法。

A network showing DNA, chemistry, data alignment, and a human icon

图注:Watershed Informatics为非开发人员的研究人员提供了一种运行大规模分析以加速生物学发展的方法。

图片来源:MIT News; iStock




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型:https://api.qingyuntop.top/pricing

详细的调用教程及文档:https://api.qingyuntop.top/about

0

评论区