客户案例 / 生命科学 / 美国

2024 年

Insilico Medicine 利用 Amazon SageMaker 加速新药发现

了解生命科学企业 Insilico Medicine 如何利用 Amazon SageMaker 将 ML 模型训练速度提升 16 倍以上。

缩短 83%

模型更新部署时间

提升超 16 倍

模型迭代和部署速度

概览

Insilico Medicine(以下简称“Insilico”)正通过其全机器学习(ML)平台 Pharma.AI 加速新药发现。自 2014 年起,该公司就开始将生成式人工智能(AI)应用于新药发现领域,比该技术获得广泛采用早了数年。Insilico 运用基于 ML 的技术来识别新的治疗靶点、设计新分子以及筛选理想候选化合物进行进一步测试。Insilico 是首批在 18 个月内确定临床前候选化合物、30 个月内进入人体临床试验的 AI 新药发现公司之一。

为加速新药发现进程,Insilico 需要灵活调用计算资源以快速训练新 ML 模型,因此选择了 Amazon Web Services(AWS)。Insilico 将其模型训练迁移至了 Amazon SageMaker,这是一套通过完全托管的基础设施、工具和工作流构建、训练和部署 ML 模型的解决方案。通过使用 Amazon SageMaker,该公司将实现新模型所需的时间从 50 天缩短至 3 天,大大加快了新药候选化合物的发现进程,同时提升了快速原型团队的工作效率。 

机会 | Amazon SageMaker 对灵活模型训练的支持助力 Insilico 加速新药发现

Insilico 成立于 2014 年,致力于利用 AI 和深度学习技术识别潜在治疗靶点并设计具有优化特性的疗法。在传统的新药发现中,研究人员必须对分子进行大量的测试与合成迭代,才能获得成功的结果。而 Insilico 通过部署 ML 来设计优质候选分子供湿实验室进一步评估,简化了这些初期阶段。Insilico 高级技术总监 Daniil Polykovskiy 表示:“我们的技术解决方案能考量远超人工设计分子时可以考量的参数。对于每个环节,我们都有相应的自动化流程或 ML 模型来评估候选分子的可行性。” 目前公司有 30 个项目正在开发中,其中 5 个处于 1 期临床试验,1 个已进入 2 期。

Insilico 的快速原型团队则负责在幕后开发和训练各种新模型,以不断优化其基于 ML 的解决方案。该团队不断探索新的前沿领域,并与 Insilico 的其他团队紧密合作,为特定研究需求定制专属模型。为推动这一进程,团队需要 GPU 资源的支持,此前,他们通过另一家云服务提供商获取这些资源。但是,原有架构依赖静态虚拟机和需手动扩展的 Kubernetes 集群,导致资源利用效率低下:时而出现硬件闲置,时而又需要团队等待资源分配。

 Polykovskiy 表示:“我们需要一种不必操心硬件配置或实现细节的高效建模方式。我们还需要一个集中化的环境,让各团队能够随时获取充足资源、开展协作、训练和评估模型,以及流畅地共享成果。” 为此,Insilico 于 2024 年启动了向 Amazon SageMaker 的迁移。

kr_quotemark

在 Amazon SageMaker 上,整个训练流程更加高效。我们可以快速扩大实验规模,并为每个模型选择所需的后端和硬件。”

Daniil Polykovskiy
Insilico Medicine 高级技术总监

解决方案 | 通过 Amazon SageMaker 实现 3 天完成新模型训练

依托 Amazon SageMaker,Insilico 将迭代和部署新 ML 模型所需的时间从 50 天缩短至 3 天,提速超过了 16 倍。公司此前所用的 ML 流程线系自主开发,需要先后尝试不同模型、使用不同参数训练模型,再筛选理想的模型进行部署。现在,使用 Amazon SageMaker,Insilico 可以并行执行这些步骤,还可以自动纵向扩展模型测试资源以及按需调用尖端 GPU 和 CPU。Polykovskiy 表示:“在 Amazon SageMaker 上,整个训练流程更加高效。我们可以快速扩大实验规模,并为每个模型选择所需的后端和硬件。” 快速原型团队现在每 2 周(而非数月)即可部署更新模型,时间缩短了约 83%。通过加速模型发布周期,Insilico 将能更快推进科学发现。

Insilico 的 DevOps 团队也节省了维护和扩展基础设施所需的时间及精力。此前,通过 DevOps 团队申请和部署新资源需要大约 1 周的时间,但使用 Amazon SageMaker 后,各团队现在可根据需要独立部署和扩展资源。Polykovskiy 解释称:“各团队都清楚自己的资源配额,可以自主决定训练内容和时间节点,无需等待其他团队分配资源。”

Insilico 的快速原型团队利用 Amazon SageMaker 的可扩展资源训练新基础模型,并与其他 Insilico 团队一起测试模型。Polykovskiy 表示:“通过使用 Amazon SageMaker,我们获得了非常灵活的计算资源,能与多个团队协作,并行开展测试。”举个例子,团队曾在收到假设验证需求后,仅用 1 天就交付了使用特定数据集训练的新模型。截至 2024 年 7 月,Insilico 已有半数技术团队迁移至 Amazon SageMaker,其余团队的迁移也在持续推进中。Polykovskiy 指出:“各团队深切体会到 Amazon SageMaker 的巨大价值。所有人都渴望获得更灵活的计算资源调用能力。” 

成果 | 依托 AWS 的 ML 助力延长健康寿命

通过使用 Amazon SageMaker,Insilico 提高了自身模型训练能力,增强了加速新药发现的解决方案。Insilico 目前有两个系统受益于使用 Amazon SageMaker 训练的高级模型,分别是帮助研究人员识别潜在治疗靶点的解决方案 PandaOmics,以及小分子新药发现综合平台 Chemistry42。

未来,Insilico 将利用依托 AWS 的 AI 和 ML 技术,继续推进新靶点发现与创新分子开发方面的突破性工作,致力于研发改变生命的疾病治疗方案。Insilico AI 平台全球负责人 Petrina Kamya 表示:“我们的使命是延长每个人的健康生产力寿命。这正是我们每天投入工作时矢志追求的目标。”

 

关于 Insilico Medicine

除开发疗法外,Insilico Medicine 还致力于开发有助加速新药发现与开发的技术。公司的使命是延长每个人的健康生产力寿命。

使用的 AWS 服务

Amazon SageMaker

Amazon SageMaker 是一项完全托管的服务,它汇集了大量工具,可为任何使用案例提供高性能、低成本的机器学习 (ML)。

了解更多 »

更多生命科学行业客户案例

未找到任何项目 

1

行动起来

无论行业无论规模,每天都有各种机构在使用 AWS 实现自身业务转型、实现企业愿景。欢迎您联系我们的专家,立即踏上您的 AWS 之旅。