新AI模型CARBonAra推动蛋白质序列预测新进展

 
日期:2024-08-13 04:43   点击数:266   来源:   共有条评论
分享到
 

使用CARBonAra进行序列预测(示意图)。图片来源:瑞士洛桑联邦理工学院


瑞士洛桑联邦理工学院推出了一款名为CARBonAra的创新人工智能(AI)模型,该模型能够依据不同分子环境中的主链结构限制,精确预测蛋白质序列,预示着蛋白质工程以及医学和生物技术等多个领域将迎来重要突破。这一研究成果已刊登在《自然·通讯》杂志的最新一期中。


CARBonAra的训练数据集包含约37万个亚基,此外还从蛋白质数据库中选取了10万个亚基用于验证,7万个亚基用于测试。


该模型基于团队之前开发的蛋白质结构转换器框架,利用几何转换器这一深度学习模型来处理点与点之间的空间关系(如原子坐标),从而学习并预测复杂结构。CARBonAra的一大特色是其对“上下文”的感知能力,尤其在提升序列恢复率方面表现出色。


当CARBonAra纳入分子“上下文”信息,如蛋白质与其他蛋白质、核酸、脂质或离子之间的界面时,其序列恢复率得到了显著提高。


CARBonAra不仅在合成基准测试中展现出卓越表现,还通过实验验证证明了其在蛋白质工程中的灵活性和准确性,为未来药物发现提供了新的工具。其在酶工程中的成功应用也显示出巨大的工业应用潜力。