[发明专利]一种基于分子地图的生物样本快速智能识别方法有效
申请号: | 201711248727.1 | 申请日: | 2017-12-01 |
公开(公告)号: | CN109870533B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 张晓哲;赵凡;赵楠 | 申请(专利权)人: | 中国科学院大连化学物理研究所 |
主分类号: | G01N30/86 | 分类号: | G01N30/86;G06K9/62;G06N3/08 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 马驰 |
地址: | 116023 *** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分子 地图 生物 样本 快速 智能 识别 方法 | ||
1.一种基于分子地图的生物样本快速智能识别方法,其特征在于:根据生物样本分子地图所蕴含的特征,而这些特征在不同类生物样本中呈现不同的分布模式,对待测样本进行识别与分类;
包括如下步骤:
A、生物样本提取物利用X-质谱仪器进行分析,得到X-MS数据,其中,X代表气相色谱、液相色谱、离子色谱、凝胶色谱、毛细管电泳、离子迁移谱或其他任意一种能够在时间维度上对分子进行分离的方法,MS代表质谱;该数据中每个离子或化合物,含有保留时间t、质荷比m/z或质量m、强度I三个维度的信息;X-MS数据中总离子的数量≥10;
B、以X-MS数据中的t或其函数变换值,m/z或m或其函数变换值构建分子地图,图中的每个点对应X-MS数据中的一个离子或分子,在分子地图中包括离子的位置,以及离子所形成的强度、轮廓、边缘或纹理中的一种或两种以上;其中离子所形成的强度用高度、颜色、亮度和大小中的一种或两种以上方式表示;
分子地图构建方式是分别以t或其函数变换值作为横坐标即第一维度,和以m/z或其函数变换值作为纵坐标即第二维度,每个点强度用高度、颜色、亮度和大小中的一种或两种以上方式表示;
分子地图的构建方式或者是将每个离子按照t或其函数变换值的顺序或者m/z或m或其函数变换值的顺序,于平面图中的线条上依次有序放置,对应离子形成一个像素点;
C、分子地图的存储与分析格式为能够代表高维数据的格式,具体包括mzXML,xls,t,mat,bmp或jpg中的一种或二种以上;
D、采用相同或相近的操作参数和条件,按上述A-C步骤操作,针对两个以上的已知生物样本进行分析,获取X-MS原始数据;利用图像生成软件将X-MS原始数据转化为分子地图,得到类别已知训练样本的分子地图集;
E、采用与已知样本相同或相近的操作参数和条件,按上述A-C步骤操作,针对待分析的待测样本进行分析,获取X-MS数据;利用图像生成软件将X-MS数据转化为分子地图,得到待测样本的分子地图;
F、在步骤D-E中,分子地图分辨率用像素表示,图形的规格为n*m其中,n≥1,m≥1;分子地图利用图像处理工具进行再处理,在分子地图中,根据离子分布的密集程度与空间关系,形成轮廓、边缘、斑块中的一种或两种以上新的图形特征;
G、上述的每个分子地图被分成一个或两个以上区域,将每一个区域图像的特征,包括像素的位置,以及参考特征,作为深度学习所用的深度神经网络的输入层的输入;
利用类别已知训练样本的分子地图集,训练深度神经网络,提取各类训练样本分子地图的特征,用以表征不同类别训练样本的分子地图集中离子分布的不同模式;
深度神经网络自带分类器;
或将深度神经网络获得的各类样本的特征导入到机器学习工具根据分类效果,进行样本的分类训练,得到训练好的深度神经网络;
H、将步骤E-F中得到的待测样本的分子地图导入到训练好的神经网络中,对待测样本分子地图进行识别,计算待测样本分子地图为训练样本分子地图集中各类样本的所属类别的概率大小P;
I、分类工具样本进行分类时,待测样本不借助阈值或借助阈值进行判定;
1)当不借助阈值时,对概率的大小进行排序,若待测样本与某类参照样本的概率排名越靠前,表明待测样本为与该类样本的可能性越大,反之越小;
2)当借助阈值时,设定阈值γ,用于判断不同来源待测样本与同类参照样本匹配的可信空间,利用阈值γ将不相关的样本排除之外;
由深度学习导出各类训练样本的概率分布范围,选定概率的下限作为该类样本的阈值γ;或,阈值利用文献报道、实验观察或统计学方法得到某类样本概率分布范围,选定概率的下限作为该类样本的阈值γ;其中,样本数至少为2;采用与步骤A-H相同或相近的操作参数和条件所得到的分析结果;
对概率的大小进行排序,当Sc>γ时,若待测样本与某类参照样本的概率排名越靠前,表明待测样本为与该类样本的可能性越大,反之越小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大连化学物理研究所,未经中国科学院大连化学物理研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711248727.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在线式非甲烷总烃分析系统
- 下一篇:黄曲霉毒素生物合成通路靶向代谢组分析方法