麻省理工学院的“FrameDiff”——生成式人工智能想象出可能改变医学的新蛋白质结构

˂pclass="4b25-6fc5-fdb3-dc23 description"˃˂pclass="6fc5-fdb3-dc23-78c4 description"˃frameDiff系统在构建单个蛋白质的任务上进行了测试,研究人员发现它可以创建多达500个部分的大蛋白质。与以前的方法不同,它不...

frameDiff系统在构建单个蛋白质的任务上进行了测试,研究人员发现它可以创建多达500个部分的大蛋白质。与以前的方法不同,它不需要依赖于预先存在的蛋白质结构图。图片来源:Alex Shipps/MIT CSaiL via Midjourney

麻省理工学院的研究人员开发了“f”“frame diff”,计算这是一种使用生成式人工智能来制作新的蛋白质结构的工具,旨在加速药物开发和改善基因治疗。

麻省理工学院CSAIL的研究人员开发了一种计算方法Nal工具,frameDiff,它使用生成式人工智能来创造新的蛋白质结构。它使用机器学习来模拟蛋白质“骨干”,并在3D中对它们进行调整,从而制作出超出已知设计的蛋白质。这一突破可以通过创造更有效结合的蛋白质来加速药物开发和加强基因治疗,在生物技术、靶向药物输送等领域具有潜在的应用前景。

生物学是一幅奇妙而精致的挂毯。核心是DNA,它是编码蛋白质的编织大师,负责协调维持人体内生命的许多生物功能。然而,我们的身体就像一架调得很好的乐器,很容易失去和声。毕竟,我们面对的是一个不断变化、无情的自然世界:病原体、病毒、疾病和癌症。

想象一下,如果我们能够加快为新出现的病原体制造疫苗或药物的过程。如果我们有基因编辑技术,能够自动产生蛋白质来纠正导致癌症的DNA错误,那会怎么样?寻找能够与靶标紧密结合或加速化学反应的蛋白质对药物开发、诊断和众多工业应用至关重要,但这往往是一项耗时且代价高昂的努力。

为了提高我们在蛋白质工程方面的能力,麻省理工学院CSAIL的研究人员提出了“frameDiff”,这是一种计算工具,用于创造超越自然产生的新蛋白质结构。机器学习方法生成与蛋白质结构固有属性一致的“框架”,使其能够独立于先前存在的设计构建新的蛋白质,从而促进前所未有的蛋白质结构。

“在自然界中,蛋白质设计是一个缓慢燃烧的过程,需要数百万年的时间。我们的技术旨在为解决比自然发展速度快得多的人为问题提供答案,”麻省理工学院CSAIL博士生Jason Yim说,他是一篇关于这项工作的新论文的主要作者。“我们的目标是,就这种产生合成蛋白质结构的新能力而言,开辟了无数增强的能力,比如更好的粘合剂。这意味着工程蛋白可以更有效、更有选择性地附着在其他分子上,这对靶向药物输送和生物技术有广泛的影响,可能导致更好的生物传感器的发展。它还可能对生物医学和其他领域产生影响,为开发更有效的光合作用蛋白质、创造更有效的抗体和用于基因治疗的工程纳米粒子提供可能性。”

框架frameDiff

蛋白质结构复杂,由许多原子通过化学键连接而成。决定蛋白质三维形状的最重要的原子被称为“骨干”,有点像蛋白质的脊柱。主链上的每一个原子三重态都有相同的键模式和原子类型。研究人员注意到,这种模式可以利用微分几何和概率论的思想来构建机器学习算法。这就是框架的作用:从数学上讲,这些三胞胎可以被建模为刚体,称为“框架”(在物理学中很常见),它们在3D中具有位置和旋转。

这些框架为每个三联体提供了足够的信息,以了解其空间环境。接下来的任务是让机器学习算法学习如何移动每一帧来构建蛋白质骨架。通过学习构建现有的蛋白质,该算法有望推广并能够创建自然界中从未见过的新蛋白质。

训练一个通过“扩散”来构建蛋白质的模型需要注入噪声,这种噪声会随机移动所有的帧,模糊原始蛋白质的样子。该算法的工作是移动和旋转每一帧,直到它看起来像原来的蛋白质。框架上扩散的发展虽然简单,但需要黎曼流形上的随机微积分技术。在理论方面,研究人员开发了“SE(3)扩散”,用于学习概率分布,该分布将每帧的平移和旋转分量非平凡地连接起来。

微妙的扩散艺术

2021年,DeepMind推出了AlphaFold2,这是一种深度学习算法,用于从蛋白质序列中预测3D蛋白质结构。在合成蛋白质时,有两个基本步骤:生成和预测。生成意味着创造新的蛋白质结构和序列,而“预测”意味着弄清楚一个序列的三维结构是什么。AlphaFold2也使用框架来模拟蛋白质,这并非巧合。SE(3) diffusion和frameDiff受到启发,通过将帧合并到扩散模型(一种在图像生成中非常流行的生成AI技术,例如Midjourney)中,进一步采用了帧的概念。

蛋白质结构生成和预测之间共享的框架和原理意味着双方的最佳模型是兼容的。在与华盛顿大学蛋白质设计研究所的合作中,SE(3)扩散已经被用于创造和实验验证新的蛋白质。具体来说,他们将SE(3)扩散与RosettaFold2(一种类似于AlphaFold2的蛋白质结构预测工具)结合起来,导致了“rf扩散”。这种新工具使蛋白质设计人员更接近于解决生物技术中的关键问题,包括开发用于加速疫苗设计的高度特异性蛋白质结合物,用于基因传递的对称蛋白质工程,以及用于精确酶设计的健壮基模支架。

frameDiff未来的努力包括提高问题的通用性,以结合生物制剂(如药物)的多种需求。另一个扩展是将模型推广到包括DNA和小分子在内的所有生物形态。该团队认为,通过扩展frameDiff在更多实际数据上的训练并增强其优化过程,它可以生成具有与RFdiffusion相当的设计能力的基础结构,同时保持frameDiff固有的简单性。

哈佛大学计算生物学家Sergey Ovchinnikov说:“抛弃预训练的结构预测模型(在frameDiff中)为快速生成延伸到大长度的结构提供了可能性。”研究人员的创新方法为克服当前结构预测模型的局限性提供了有希望的一步。尽管这仍是初步工作,但这是朝着正确方向迈出的令人鼓舞的一步。因此,由于麻省理工学院研究团队的开创性工作,蛋白质设计的愿景在解决人类最紧迫的挑战中发挥着关键作用,似乎越来越触手可及。”

Yim与哥伦比亚大学博士后Brian Trippe、法国国家科学研究中心数据科学中心研究员Valentin De Bortoli、剑桥大学博士后Emile Mathieu、牛津大学统计学教授兼DeepMind高级研究科学家Arnaud Doucet共同撰写了这篇论文。麻省理工学院教授Regina Barzilay和Tommi Jaakkola建议进行这项研究。

该团队的工作在一定程度上得到了麻省理工学院Abdul Latif Jameel健康机器学习诊所、EPSRC资助和微软研究院与剑桥大学之间的繁荣合作伙伴关系、国家科学基金会研究生研究奖学金计划、国家科学基金会探险资助、药物发现和合成机器学习联盟、DTRA发现针对新兴威胁的医疗对策计划的支持。DARPA加速分子发现项目和赛诺菲计算抗体设计基金。这项研究将在7月份的国际机器学习会议上发表。

参考文献:“SE(3)扩散模型及其在蛋白质骨架生成中的应用”,作者:Jason Yim, Brian L. Trippe, Valentin De Bortoli, Emile Mathieu, Arnaud Doucet, Regina Barzilay和Tommi Jaakkola, 2023年5月22日,计算机科学>机器学习。arXiv: 2302.02277

本文来自作者[admin]投稿,不代表信了号立场,如若转载,请注明出处:https://wak.maigegan.com/xinlehao/11137.html

(30)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年09月15日

    我是信了号的签约作者"admin"!

  • admin
    admin 2025年09月15日

    希望本篇文章《麻省理工学院的“FrameDiff”——生成式人工智能想象出可能改变医学的新蛋白质结构》能对你有所帮助!

  • admin
    admin 2025年09月15日

    本站[信了号]内容主要涵盖:

  • admin
    admin 2025年09月15日

    本文概览:大家好,今天小编来为大家解答微乐广东麻将小程序开挂神器这个问题咨询软件客服可以直接加QQ群了解详细,四川微乐麻将外卦神器下载安装的挂在哪里买很多人还不知道,现在让我们一起来看看吧!一、微乐广东麻将小程序开挂神...

联系我们

邮件:88888@sina.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注我们