[发明专利]基于碎片树的现场质谱目标物识别以及衍生物预测方法在审
申请号: | 202110986213.6 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113758989A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 钱翔;杨淑媛;霍新明;余泉;倪凯;王晓浩 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G01N27/62 | 分类号: | G01N27/62 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 王震宇 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 碎片 现场 目标 识别 以及 衍生物 预测 方法 | ||
一种基于碎片树的现场质谱目标物识别以及衍生物预测方法,包括如下步骤:S1、对目标物的多级电压碎裂谱图进行峰形校准;S2、合并处理后的多张谱图,生成一张包含母离子和所有碎片的谱图;S3、对每个碎片峰进行候选分子式预测,通过非带电分子分子式过滤黄金规则、质谱精度排序和碎片树的形成三层筛选,得到最终的候选分子式,再根据中性丢失和峰值相似度对节点和边赋值权重,生成候选分子碎片图;S4、计算最大得分的彩色碎片树;S5、通过碎片树对齐来进行聚类。该方法能够提取衍生物的一级二级质谱特征,训练出分类模型,进而实现对衍生物的鉴定归类。该方法大大弥补了传统现场质谱技术在质谱信号预测上的不足,尤其适于小质谱平台的应用。
技术领域
本发明涉及质谱仪及信号处理的领域,特别是一种基于碎片树的现场质谱目标物识别以及衍生物预测方法。
背景技术
质谱仪是将物质粒子(原子、分子)电离成离子,通过适当的电场或磁场将他们分离,并检测其强度,从而进行定性、定量分析的仪器。因其具有直接测量的本质和高分辨、高灵敏、大通量、高准确度的特性,质谱仪在生命科学、材料科学、食品安全、环境监测、医疗卫生、国家安全等领域具有不可代替的作用和举足轻重的地位。由于现阶段需求的质谱仪主要用于研究的目的,仪器功能复杂、使用和维护要求高,需要专业人员操作,所以只能在实验室里使用。食品安全检测、各种野外环境的现场检测、现场诊断、流程监控、排放物检测与控制、突发事件的处理、尤其是化学和生物武器的检测等诸多需要现场使用质谱仪的场合都对小型便携、操作简单的质谱仪提出了迫切的要求。显然,这样的发展将鼓励质谱拓宽应用领域,成为简化质谱系统,目标操作以及开发各种优化的专业形式的大容量/低利润仪器的驱动力。
目前现场质谱仪的研究尚处于对仪器各部分进行不断改进以满足社会需求的阶段,仪器的小型化通常需要产品架构简单、稳定性强,这将导致仪器的精度和分辨率都无法达到很高的标准,只能进行简单的定性分析。对于质谱信号的分析仍处于初始阶段,并没有充分挖掘并发挥质谱信号的全部价值信息。
国内外提出许多技术和方法用于鉴定小分子,但是大部分的目标识别算法都是针对高精度、高分辨率的大型质谱仪而言。现有的对现场质谱仪的目标识别主流的方法有:(1)质谱库搜索;(2)碎裂搜索法;(3)机器学习;(4)碎片树。
质谱库搜索是鉴定代谢物的一种传统方法。它是将未知化合物在给定条件下的质谱图与含有大量参考质谱图的数据库进行比较。根据数据库中的候选分子质谱图和未知化合物质谱图的相似性进行排序,并返回最佳匹配的候选分子。质谱库搜索的主要缺点是只能识别已知中的未知化合物,即如果数据库中不包含目标化合物的参考谱,则匹配结果不可靠。
碎裂搜索法是从数据库中参考化合物的化学结构生成模拟质谱,并将它们与未知化合物的质谱进行比较。该方法可以帮助鉴定质谱数据库中没有的化合物,提高质谱数据库识别未知化合物的能力。碎裂搜索法适用于识别先验知识较少的化合物,比如不清楚该化合物的碎裂规则。但是,该方法主要基于从分子中断开键生成片段。这些都是近似的估计,实际上键的解离能要复杂得多。
机器学习方法基于机器学习对代谢物进行鉴定的原理是学习和预测质谱和化合物之间的中间表示,然后使用这种表示对质谱库进行匹配或检索。机器学习方法需要大量的数据和基于专家知识进行结构注释,这是复杂的和消耗时间的。此外,它还需要大量的算力,对计算机对较高的性能要求。
碎片树由一组节点表示,每个节点对应于一个片段或前体离子,并用其分子式标注。连接节点对的边表示裂解反应,并以中性丢失的分子式进行标注。现有的碎片树方法对于质谱的质量要求较高,目前仅适于高精度、高分辨率的实验室质谱仪的应用。
目标物识别能够扩展现场质谱的应用场景,让现场质谱的定性检测更加智能,降低现有人工误判和未知新型衍生物的漏检所带来的风险。但是相比于实验室的大型质谱仪器,现场质谱谱图分辨率和质量精度较低,这对后续准确识别和聚类目标物非常不利。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110986213.6/2.html,转载请声明来源钻瓜专利网。