您的位置:首页 >精选知识 >正文

机器学习有望加速新陈代谢研究

摘要 一项新的研究表明,可以利用机器学习和统计学来解决长期阻碍代谢组学领域发展的问题:不同地点收集的数据存在巨大差异。我们并不总是知道变...

一项新的研究表明,可以利用机器学习和统计学来解决长期阻碍代谢组学领域发展的问题:不同地点收集的数据存在巨大差异。

“我们并不总是知道变异的来源,”西雅图华盛顿大学医学院麻醉学和疼痛医学教授Daniel Raftery说。 “这可能是因为受试者的基因、饮食和环境暴露程度不同。或者这可能是样本收集和处理的方式。”

拉夫特里和他的研究同事想看看机器学习(一种使用计算机算法处理大量历史数据并识别数据模式的人工智能形式)是否可以减少来自不同站点的数据之间的这种差异,而不掩盖重要的差异。

“我们希望将这些不匹配的数据集放在一起,以便可以比较或合并不同研究的结果以进行进一步分析,”拉夫特里说。

他与张大宝和一起领导了该项目,张大宝和曾在普渡大学工作,现在是加州大学欧文分校公共卫生学院的流行病学和生物统计学教授。刘丹妮,博士普渡大学的学生,是这篇论文的主要作者,该论文发表在 2 月 12 日出版的《PNAS》(《国家科学院院刊》)上。

Raftery 是威斯康星大学线粒体和代谢中心的一名研究员,该中心位于西雅图威斯康星大学医学院南湖联合分校。

代谢组学一词与新陈代谢有关,这个词描述了我们的细胞为维持生命而进行的化学反应。这些反应包括分解食物以获取能量并获得细胞生长和修复所需的原材料的反应、涉及生命所需细胞成分组装的反应,以及涉及分解损坏或不需要的成分以便回收的反应,丢弃或用作燃料。

这些代谢过程产生的小化学物质称为代谢物。代谢水平揭示了细胞、组织、器官或生物体在给定时刻正在发生的化学反应,以及这些反应如何随时间变化。

代谢组学是对代谢物及其产生过程的研究。

这些信息不仅可以帮助医学科学家更好地了解细胞如何维持正常功能,还可以帮助了解人们生病时可能出现的问题。拉夫特里说,这些知识可能会带来诊断、预防和治疗疾病的新方法。

在这项新研究中,研究人员建立了机器学习模型来识别导致数据集之间差异的因素。这些模型考虑了研究人群的人口差异,例如年龄和性别,并使用其他代谢物中包含的信息来解释观察到的差异。

研究人员发现,他们的方法将数据集之间的差异减少了 95% 以上,而没有掩盖有意义的差异,例如男性和女性之间自然存在的差异。

“我们已经证明,我们的方法有可能减少代谢组数据中出现的不需要的方差,同时保留感兴趣的代谢组信号,”Raftery 说。

该小组计划扩大研究范围,旨在更深入地了解正常代谢并识别可能是疾病征兆的异常代谢的生物标志物。

版权声明:本文由用户上传,如有侵权请联系删除!