[发明专利]代谢特征谱推断方法、系统、计算机设备及存储介质有效
申请号: | 202110706942.1 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113554176B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 李伟忠;邓永洁;胡寓旻;黄蓬 | 申请(专利权)人: | 中山大学 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/0464;G06N3/08;G06F18/214;G06F18/241;G06F17/16 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 胡枫;曹万菊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代谢 特征 推断 方法 系统 计算机 设备 存储 介质 | ||
本发明公开了一种代谢特征谱推断方法,包括将目标样本数据进行LC‑MS技术处理以获得LC‑MS原始数据;将所述LC‑MS原始数据进行降维转换处理以获得二维矩阵,所述二维矩阵保留所述LC‑MS原始数据的保留时间、质荷比及离子强度;将所述二维矩阵输入卷积神经网络模型以推断出所述目标样本数据的代谢物质特征谱。本发明还公开了一种代谢特征谱推断系统、计算机设备及存储介质。采用本发明,能够解决现有代谢组学方法所存在的误差处理难、原始信号大量丢失以及大类区分局限性的问题。
技术领域
本发明涉及代谢组学数据分析领域,尤其涉及一种代谢特征谱推断方法、系统、计算机设备及存储介质。
背景技术
人类血清中的代谢物包含宿主代谢物、微生物衍生代谢物、以及饮食等外源物质,与各种疾病的发生发展关系紧密。目前的代谢组学方法能够对血清中代谢物质进行定量测定、以及鉴定和分析。液相色谱质谱联用技术(Liquid Chromatograph-MassSpectrometer,LC-MS)是一种常用的代谢物质检测技术,通过高效液相色谱分离不同物质,使用质谱对不同时相分离出来的物质进行质量分析。目前,非靶向LC-MS原始数据的物质鉴定主要是通过数据库比对进行,首先对原始数据进行质谱峰提取,再将不同质谱峰的保留时间、质荷比等属性与数据库中的已知物质进行比较。其中,人类代谢组数据库(The HumanMetabolome Database,HMDB)包含114305个代谢物条目。但他们相比于实际的化学空间还是很少。化学宇宙数据库GDB-17中列举了超过1660亿个有机小分子。此外,代谢组学数据的处理过程中也存在着若干挑战(即稀疏、嘈杂、异质、依赖时间等)。现阶段,深度学习技术在代谢组学数据中的应用较少。SteroidXtract工具应用深度学习技术,能够直接使用原始的质谱图谱,对类固醇物质和非类固醇物质进行分类。然而,LC-MS数据是一种复杂的三维空间数据,同一样本包含多个时相数据(即不同的保留时间),每一时相数据均有一张质谱图。SteroidXtract方法与其它的代谢组学分析方法,均需要人为地对这些大量质谱图进行去冗余处理。此外,血清中代谢物质所参与的生物过程往往不止与单一的某一类或者某一个物质相关联,而这些不同的物质往往分布于不同的时相。
传统的代谢组学方法,首先需要经过复杂过程进行噪音的去除、提取信号质谱峰,后使用统计方法、依赖已有的数据库进行相关分析与物质鉴定。首先,在数据处理的过程中,数据的稀疏性、嘈杂性、批次效应等问题为质谱峰峰对齐、质谱峰提取和后续的统计分析等带来了大量误差。其次,已有的数据库无法囊括真实化学世界的大量代谢物质,一些未知的代谢物可能也在疾病的发生发展过程中发挥重要的作用。已有的深度学习技术使用质谱图作为输入数据,不仅需要繁复的去冗余处理,而且只能进行类固醇和非类固醇的大类区分。一些具有不同功能的同分异构体等可能有着近似的质谱表现,但在液相色谱中被分离至不同的时相。
发明内容
本发明所要解决的技术问题在于,提供一种代谢特征谱推断方法、系统、计算设备及存储介质,能够解决现有代谢组学方法所存在的误差处理难、原始信号大量丢失以及大类区分局限性的问题。
为了解决上述技术问题,本发明提供了一种代谢特征谱推断方法,包括:将目标样本数据进行LC-MS技术处理以获得LC-MS原始数据;将所述LC-MS原始数据进行降维转换处理以获得二维矩阵,所述二维矩阵保留所述LC-MS原始数据的保留时间、质荷比及离子强度;将所述二维矩阵输入卷积神经网络模型以推断出所述目标样本数据的代谢物质特征谱。
优选地,所述将所述LC-MS原始数据进行降维转换处理以获得二维矩阵的步骤包括;将所述LC-MS原始数据进行格式转换;设置起始保留时间、终止保留时间、保留时间区间、保留时间采样间隔、起始质荷比、终止质荷比、质荷比区间以及质荷比采样间隔,其中,所述保留时间区间的范围为起始保留时间至终止保留时间之间的范围,所述质荷比区间为起始质荷比至终止质荷比之间的范围;在所述保留时间区间和质荷比区间内,以所述保留时间采样间隔以及质荷比采样间隔为滑窗,采样所述保留时间区间和质荷比区间内内的最大离子强度,以获得离子强度二维矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110706942.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电梯故障监测和管理方法
- 下一篇:高炉上料输送机构