当前位置: 首页 » 资讯 » 科技头条 » 正文

科学家推出酶-底物三维复合体数据库,酶工程进入超高预测AI时代

IP属地 中国·北京 DeepTech深科技 时间:2025-12-14 00:12:29

近日,由美国伊利诺伊大学厄巴纳香槟分校 Huimin Zhao 教授和南京师范大学教授崔海洋等人共同研发出一种名为 EZSpecificity 的 AI 工具,成功给酶装上了智能识别系统,能以前所未有的准确度预测酶和底物之间的匹配关系,相关论文发表于 Nature。

在卤化酶验证实验中,EZSpecificity 对 8 种酶和 78 种多样底物进行预测匹配,准确率高达 91.7%,远远超过了之前最好的 AI 模型 ESP(58.3%)。

崔海洋告诉 DeepTech:“此次成果为整个合成生物学领域提供了一个 AI 预测利器,解决了元件功能定义这一底层问题。此外,为了训练模型,我们首次建立了一个非常高质量的、包含酶与底物三维复合体结构的数据库,涵盖了天然与非天然的底物,这是领域内前所未有的资源,可以为后续更多研究提供支撑。简而言之,我们同时贡献了一个普适性强的模型和一个高质量的数据库。”

他继续说道:“这项成果的首创性在于:我们首次建立了这样一个全面、高质量的酶-底物三维复合体数据库;同时,首次开发了能涵盖自然界中所有酶类型、真正具有普适性的预测模型。”

而如果能够提前预测一种酶会和哪一种底物匹配,不仅可以让人们更深入地理解生命的奥秘,还能在医药、环保和工业生产等领域大展拳脚。比如,可以设计能够降解塑料垃圾的超级酶,或者打造能够精准合成药物的生物工厂等。


(https://www.nature.com/articles/s41586-025-09697-2)

酶的配对:大海捞针般艰难

在我们的身体里有着数以亿计的微小“化学工厂”,它们日夜不停地工作,维持着我们的生命活动。酶便是这些“化学工厂”的工人,同时酶也是一种神奇的生命催化剂。

它能精准地找到自己负责的原料也就是底物,然后将底物加工成人体需要的产品。就像一把钥匙只能打开一把锁,一种酶通常也只认识一种或几种特定的底物,这种特性被称为底物特异性。正是这种精确的识别能力,保证了人体体内成千上万种化学反应有条不紊地进行。

但是,这些微小的酶是如何从一堆长相各异的分子中,准确找到自己的专属搭档的?其实,这并非一件容易事。酶就好比是一场舞会上的挑剔舞者,舞池里挤满形状各异的分子也就是底物,酶必须快速准确地找到那个和自己的“舞步”也就是催化反应相匹配的唯一舞伴。

酶之所以能够识别底物,其关键在于它身上有一个名为活性位点的特殊口袋。这个口袋的形状、电荷分布以及组成它的氨基酸种类,共同构成了独一无二的三维密码。只有底物的形状和化学性质恰好能像拼图一样嵌入这个口袋,并能形成良好的相互作用,才会发生化学反应。

过去,人们主要通过以下两种方法来理解这种配对。第一种是反复实验的笨办法,就像把不同钥匙挨个儿插进锁里试试一样,这非常耗时耗力,而且酶和潜在底物的组成多得惊人,根本试不完。第二种是 AI 预测的方法,但是之前的 AI 模型有点像仅仅通过二维照片来判断酶和底物是否合得来,即通过酶的一维氨基酸序列或底物的分子式来判断。

这导致非常关键的一点被忽略:酶和底物的相互作用发生在三维立体空间里,只看二维平面照片的话,很难准确判断两个立体的东西能否严丝合缝地拼在一起。

此外,自然界中还存在大量身份不明的酶,尽管人们知道它们的存在,但却完全不清楚它们喜欢和什么样的底物打交道。因此,开发一个能够理解三维空间作用、并能准确预测配对关系的 AI 模型,成为一个极具挑战性的问题。


(https://www.nature.com/articles/s41586-025-09697-2)

带着超级工具箱而来的 EZSpecificity

为了解决这个难题,崔海洋等人打造了 EZSpecificity。它的成功得益于三大法宝:一个名为 ESIBank 的超级数据库、一个能够看懂三维结构的眼睛、一个能够抓住重点的注意力机制。

要想让 AI 变得更聪明,首先得用高质量的海量数据来喂养它。为此,他们建立了 ESIBank 数据库,其中包含从多个全微生物数据库和科学文献中收集的 32 万对以上的酶-底物组合,既包括人们从大自然中发现的天然组合,也包括人们在实验室里打造的非天然组合,里面的底物种类达到 3.4 万多种,是之前最佳数据库的 25 倍。

为了从那些只有图片比如发表在论文中的化学结构图、而没有被数据库收录的信息里挖宝,他们开发了一套半自动数据提取流程,这样一来就能自动识别图片中的化学结构,并将其转换成计算机能够读懂的格式,从而极大丰富了数据来源。研究期间,崔海洋等人专门使用这一方法来研究一种名为卤化酶的酶,并建立了包含大约 3,300 配对的数据集,以便用于后续验证。

只知道谁能和谁配对还不够,EZSpecificity 还得知道它们是如何配对的。为此,他们利用分子对接模拟软件 AutoDock-GPU,来为数据库中的每一对酶和底物计算和生成了它们最可能的拥抱姿势,三维复合物结构是这种拥抱姿势的专有称呼。

这个过程就像让 AI 来模拟酶和底物分子到底是如何在微观世界里相遇、靠近并最终结合的,其中包含了三维结构信息的 ESIBank 数据库,能为 EZSpecificity 的自我学习提供充足的养料。

有了数据,EZSpecificity 又该如何理解这些复杂的三维结构?为此,崔海洋等人使用一种名为“SE(3)-等变图神经网络”的 AI 模型作为它的眼睛。SE(3)-等变图神经网络能将酶的活性位点口袋和底物分子一起看作一个由原子和化学键连接而成的三维图。每个原子是一个节点。化学键便是连接节点的边。

SE(3)-等变图神经网络有着较好的等变性,无论把三维分子模型在电脑屏幕上如何旋转和平移,EZSpecificity 所能看到和理解的关键特征是不变的。就像我们观察一辆车模一样,无论从哪个角度看,都能认出它是一辆车,并且能够知道轮子和车门的位置关系。而这种特性对于准确捕捉分子在真实三维空间中的相互作用至关重要。

通过 SE(3)-等变图神经网络这双眼睛,EZSpecificity 可以学到活性位点里的每个原子的化学性质、空间位置,以及它们与周围原子的关系,从而能够感受到这个口袋的立体形状和化学环境。

光能看到细节还不够,EZSpecificity 还必须能从海量信息中抓住关键线索,为此崔海洋等人引入了交叉注意力机制。在酶的活性位点里,有几十个甚至上百个氨基酸和底物上的原子。但是,真正决定它们能否来电的,可能只是其中少数几个关键的接触点。比如,某个带正电的氨基酸正好抓住了底物上一个带负电的原子。

以前在 AI 模型在做同样处理时,往往会给所有原子和氨基酸以同样的权重,但这就像画满了重点的教科书,都是重点反而没有重点。而交叉注意力节制则让 EZSpecificity 学会了聚焦,它能动态地分析酶上的氨基酸和底物上的原子,自动判断哪些配对才是最重要的化学反应,并给这些关键信息分配更高的权重,以及忽略掉那些无关键要的背景噪音,从而能够极大提升模型判断的准确性和可解释性。


(https://www.nature.com/articles/s41586-025-09697-2)

在多轮考验中全面碾压前辈

为了验证 EZSpecificity 的有效性,崔海洋等人对其进行了多轮大考。

在包含 32 万对数据的 ESIBank 进行测试时,EZSpecificity 在各项指标上都完胜了之前的冠军模型 ESP。尤其是在最困难的双重陌生场景下,即同时预测一个数据库里从未出现过的新酶和新底物能否配对时,EZSpecificity 的优势更加明显。这证明了它的强大的泛化能力,即它能够举一反三地预测从未出现的新情况。

前面提到 EZSpecificity 有三个法宝,为了验证每个法宝的重要性,崔海洋等人做了拆解实验也就是消融实验。结果发现:如果去掉三维结构信息,模型性能就会下降;如果去掉交叉注意力机制,性能也会家乡。这就像一旦拆掉了一辆汽车的发动机或方向盘,汽车就会跑不快和开不准。因此,这一实验结果证明了崔海洋等人的每个设计都是必不可少的。

在真实实验室里,他们选择了一类在自然界中既神秘、又非常有用的酶——卤化酶。这类酶能够给分子加上卤素原子,这也是制造药物和制造农药时的关键一步。但是,卤化酶到底喜欢给哪些分子打交道,此前人们并不清楚。

为此,崔海洋等人选取了 8 种不同的卤化酶和 78 种它们可能认识的底物分子,这些底物与 EZSpecificity 之前学习过的分子的平均相似度只有 9%,可以说基本全是陌生面孔。

而在实验室里,崔海洋等人使用高通量实验平台进行了 624 次真实的酶催化反应。与此同时,EZSpecificity 也会根据它从文献中学到的卤化酶知识,来针对每一对组合进行预测,所显示的结果与实验室试管里真实发生的化学反应高度吻合。


(https://www.nature.com/articles/s41586-025-09697-2)

将加速超级降解酶发现过程,助力打造绿色细胞工厂

有了厉害的能力,还得能够发挥出来。在应用前景上:

首先,EZSpecificity 能够用于加速发现超级降解酶的发现过程。面对塑料污染,人们一直在寻找能够高效分解塑料的酶。而 EZSpecificity 可以快速筛选自然界中数以百万计的未知之酶,从而能够预测哪些酶可能具备降解塑料的能力。

其次,EZSpecificity 能够用于设计绿色药物工厂。许多药物的合成过程不仅步骤繁琐而且污染较大,而利用 EZSpecificity 可以设计或者改造酶,从而让其更精准、更环保地合成药物。

再次,EZSpecificity 能够用于解读自然的基因密码。在土壤和海洋中,微生物体内蕴藏着大量功能未知的基因簇,而 EZSpecificity 可以帮助人们将酶与它处理的中间产物对上号,从而破解这些天然产物的合成秘密,借此发现新的药物先到分子。

“总的来说,这个工具能让我们更好地理解生命过程,尤其是在生物合成和工业生物催化领域,它就像是为建造房子找到了各种合适形状的砖块,是一个非常重要的基础砌块。”崔海洋告诉 DeepTech。

他还表示:“创办一家生物科技公司一直是我的一个小梦想。目前我的课题组有结合 AI、合成生物学和机器人技术的项目在推进,时机成熟时会考虑创业。我们此前也参加了相关创新应用大赛,将概念进行了展示并获奖,即我们使用具身机器人来解决合成生物学实验自动化的问题,让机器人帮助我们执行实验操作,未来希望服务于更广泛的生物学和化学领域。不过,目前我们仍处于概念和原型机阶段。”

参考资料:

相关论文 https://doi.org/10.1038/s41586-025-09697-2

运营/排版:何晨龙

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。