AI预测酶的工作效率
酶在细胞代谢过程中发挥着关键作用。为了能够对这些过程进行定量评估,研究人员需要知道酶的所谓“周转数”(简称:k cat )。在科学杂志《自然通讯》上,杜塞尔多夫海因里希·海涅大学 (HHU) 的生物信息学家团队现在描述了一种使用人工智能方法预测各种酶的该参数的工具。
酶是所有活细胞中重要的生物催化剂。它们通常是大蛋白质,结合较小的分子(所谓的底物),然后将它们转化为其他分子,即“产物”。如果没有酶,将底物转化为产物的反应就无法发生,或者只能以非常低的速率进行。大多数生物体拥有数千种不同的酶。酶在各种生物技术过程和日常生活中有着广泛的应用——从面包面团的发酵到洗涤剂。
特定酶将其底物转化为产物的最大速度由所谓的周转数k cat决定。它是酶活性定量研究的重要参数,在理解细胞代谢方面发挥着关键作用。
然而,在实验中确定k只猫的周转数既耗时又昂贵,这就是为什么绝大多数反应都不为人所知。由 Martin Lercher 教授领导的 HHU 计算细胞生物学研究小组现在开发了一种名为 TurNuP 的新工具,可以使用人工智能方法预测酶的k cat周转数。
为了训练k cat预测模型,使用深度学习模型将有关酶和催化反应的信息转换为数值向量。这些数值向量作为机器学习模型(即所谓的梯度增强模型)的输入,该模型可预测 k只猫的周转次数。
主要作者 Alexander Kroll:“TurNuP 优于以前的模型,甚至可以成功用于与训练数据集中相似度较低的酶。” 除非至少 40% 的酶序列与训练集中的至少一种酶相同,否则之前的模型无法做出任何有意义的预测。相比之下,TurNuP 已经可以对最大序列同一性为 0 – 40% 的酶做出有意义的预测。
Lercher 教授补充道:“在我们的研究中,我们表明 TurNuP 所做的预测可用于比迄今为止的情况更准确地预测活细胞中的酶浓度。”
为了使尽可能多的用户可以轻松访问预测模型,HHU 团队开发了一个用户友好的网络服务器,其他研究人员可以使用它来预测酶的 k cat周转次数。
背景:机器学习和深度学习
深度学习模型由多层人工神经网络组成,可以识别和处理输入数据中的模式。使用大型训练数据集是训练深度学习模型处理数值输入的最佳方法。
梯度提升模型是一种机器学习方法,它会产生大量决策树。特定输入的所有决策树的结果用于进行预测。与深度学习类似,训练数据用于细化模型,即生成决策树。
版权声明:本文由用户上传,如有侵权请联系删除!