[发明专利]一种质谱数据处理中谱峰位置检测方法有效
申请号: | 201610031234.1 | 申请日: | 2016-01-18 |
公开(公告)号: | CN105718723B | 公开(公告)日: | 2018-01-16 |
发明(设计)人: | 田地;郑瀛;范润龙;龙涛;邱春玲;张玉海 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 长春吉大专利代理有限责任公司22201 | 代理人: | 王立文 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种质谱数据处理中谱峰位置检测方法,对原始谱图进行连续小波变换,形成二维小波系数矩阵;在矩阵中设置多个粒子,使粒子按照固定规则移动,逐渐聚集至局部极值点位置;对矩阵位置进行度量,采用噪声阈值和原始谱峰强度修正度量值形成度量值矩阵;在度量值矩阵中搜索脊点,连接脊线,根据脊线确定谱峰位置。该方法综合利用了原始谱峰强度和小波系数矩阵信息进行谱峰位置检测,克服了传统CWT方法进行弱峰和重叠峰检测时误检率上升的问题,提高了算法的灵敏度和对重叠峰的分辨能力。 | ||
搜索关键词: | 种质 数据处理 中谱峰 位置 检测 方法 | ||
【主权项】:
一种质谱数据处理中谱峰位置检测方法,其特征在于,包括以下步骤:Ⅰ、选择一定尺度范围对原始质谱图进行连续小波变换,形成二维小波系数矩阵C(a,b),其中a为尺度参数,b为位移参数;Ⅱ、在小波系数矩阵C(a,b)中均匀设置N个粒子,使粒子按照固定规则移动,逐渐聚集在局部极值点的位置,粒子移动规则如下:粒子进行t次移动后,粒子位置X(t)=(k,j),下一次移动后的位置X(t+1)=(k’,j’)由以下规则确定:A、对于小波系数矩阵C(a,b),以b为水平方向,a为垂直方向,b的范围为1,2,…,B,a的范围为1,2,…,A;B、粒子首先进行垂直方向移动,如果2≤k≤A‑1,那么k’=k+1和k’=k‑1各取1/2的概率;如果粒子到达下边界,即k=1,那么粒子向上移动一格,即k’=2;如果粒子到达上边界,即k=A,那么粒子向下移动一格,即k’=A‑1;C、垂直移动完成后进行水平方向移动,仍先判断粒子是否处于左右边界,即j=1或j=B,若处于边界则粒子向内移动一格,即j’=2或j’=B‑1,否则各按1/2的概率准备向左或向右移动一格,是否移动根据小波系数大小进行判断;粒子移动判断标准如下:①、如果C(k’,j’)>C(k,j)则粒子发生该移动,X(t+1)=(k’,j’);②、如果C(k’,j’)≤C(k,j)则计算差值ΔC=|C(k’,j’)‑C(k,j)|,设置阈值Temp,若ΔC<Temp,则发生该移动,即X(t+1)=(k’,j’),否则不动,即X(t+1)=(k,j);③、随移动次数增加,逐渐减小Temp,使Temp逐渐接近零;该方法类似模拟退火算法思想,随移动次数增加,温度降低,粒子趋于稳定;Ⅲ、按照粒子占据情况对小波系数矩阵中所有位置进行度量,形成度量值矩阵,并采用噪声阈值和对应位置谱峰强度对度量值矩阵进行修正,矩阵位置度量方式如下:设t次移动后矩阵位置(k,j)的粒子个数为n(k,j)(t),粒子移动总次数为T,则矩阵位置初始度量值为:i(k,j)=1TΣt=1Tn(k,j)(t)---(1)]]>度量值矩阵修正方法如下:设阈值i0为噪声点所产生的度量值,从上述初始度量值中减去阈值,并与原始谱图谱峰强度S(j)作乘积形成最终的度量值矩阵:I(k,j)=S(j)·(i(k,j)‑i0) (2)度量值矩阵中所有度量值均为非负实数,上述度量方式中,初始度量值减去噪声阈值i0后,若度量值小于零则将该值归零,若噪声阈值选择得当,此时度量值矩阵将成为稀疏矩阵,从而有效突出小波系数矩阵中的局部极值点,降低后续脊点搜索难度;Ⅳ、在修正后的度量值矩阵中进行局部极大值搜索,并设置强度阈值过滤局部极值得到脊点;Ⅴ、连接脊点形成脊线,设置脊线长度阈值,去除过短脊线;Ⅵ、根据脊线确定谱峰位置,完成谱峰位置检测,谱峰位置为脊线中度量值最大的脊点位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610031234.1/,转载请声明来源钻瓜专利网。
- 上一篇:轧钢导卫导辊装拆工具
- 下一篇:电视机架
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用