近日,分子之心许锦波团队推出一种全新的AI蛋白质侧链预测算法“AttnPacker”,该算法在速度、内存效率和整体精度方面取得大幅提升,是目前已知的最优侧链结构预测算法,也是全球首创的可同时进行侧链预测和蛋白质序列设计的AI算法。相关论文已在国际权威学术刊物 《美国科学院院刊》上发表。
蛋白质由数个氨基酸折叠而成,其结构分为主链和侧链。蛋白质结构和功能的形成,很大程度上取决于侧链原子间的相互作用,因此,精准的蛋白质侧链预测(PSCP)是解决蛋白质结构预测和蛋白质设计难题的关键一环。应用到药物设计领域,科学家们便能更快、更准确地找到适合药物与受体的结合点位,甚至根据需要优化或设计结合点位;在酶优化领域,科学家们可以通过对蛋白质序列的优化改造,让多个侧链参与催化反应,实现更高效、特异性更高的催化效果。
许锦波教授被业界誉为“AI蛋白质折叠奠基人”,他于2016年提出第一个AI蛋白质折叠算法,后Deepmind受此启发开发AlphaFold,解决了大多数蛋白质主链的三维结构的预测问题。但蛋白质侧链结构预测至今未被完全突破,目前已经成为制约蛋白质设计技术在创新药研发、合成生物学等领域广泛应用的重要因素之一。
许锦波教授从2003年开始研究蛋白质侧链结构预测问题,是该领域研究时间最长的科学家之一。他早期开发的侧链结构预测算法相关论文多次被国际计算分子生物学顶会RECOMB、美国计算机协会(ACM)官方刊物《Journal of the ACM》等学术会议和学术刊物发表。
此次许锦波团队创新性地开发出AttnPacker——一种全新的、端到端的预测蛋白质侧链坐标的深度学习方法,它联合模拟了侧链相互作用,直接预测的侧链结构在物理上更可行,具有更少的原子碰撞和更理想的键长和角度。“AttnPacker的预测效果好、效率高,且更加易用,这些优势有利于对于它被科研和工业领域广泛使用。”许锦波教授表示。
在预测效果上,AttnPacker与此前最先进的方法相比,显示出了最优的预测准确性和效率。同时保证了物理上的真实性。由于采用了创新的方法。AttnPacker与其他方法相比,计算效率显著提高,减少了100倍以上的推理时间。
AttnPacker在蛋白质设计上的表现同样优秀。分子之心训练了一个AttnPacker变体用以协同设计,该变体设计的蛋白质序列在天然序列恢复率、精确度、能量等关键指标上,达到了媲美或超越当下最先进蛋白质设计算法的效果。
除了效果和效率惊人之外,AttnPaker还有一个非常实用的价值——它非常易用,只需要一个蛋白质的结构文件即可运行。
为推进该AI算法的发展和应用,分子之心已将AttnPacker的预训练模型、源代码和推理脚本在Github上开源。
“我们将基于AI持续探索更精准、更高效的蛋白质预测、设计算法。”许锦波表示,希望AttnPacker等算法能够进一步推进解决产业应用中的蛋白质设计需求。