[发明专利]一种基于A星算法的蛋白质序列标签测序方法在审
申请号: | 202310035764.3 | 申请日: | 2023-01-10 |
公开(公告)号: | CN116486907A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 李闯;刘纯洋;何典;祝团飞;南苏琴 | 申请(专利权)人: | 湖南工商大学 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B50/30 |
代理公司: | 北京新科华领知识产权代理事务所(普通合伙) 16115 | 代理人: | 王丽 |
地址: | 410205*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 蛋白质 序列 标签 方法 | ||
1.一种基于A星算法的蛋白质序列标签测序方法,其特征在于:包括:
获取待测蛋白质的原始质谱数据,对所述原始质谱数据进行预处理;
基于预处理后的原始质谱数据,构建谱峰连接图;
基于所述谱峰连接图,生成候选序列标签;
基于所述候选序列标签,找出符合母离子质量的候选肽段;
从数据库中搜索序列标签并进行匹配打分排序。
2.根据权利要求1所述的基于A星算法的蛋白质序列标签测序方法,其特征在于:所述预处理包括:基于原始质谱数据生成二级质谱图,对二级质谱图进行去除同位素、去除噪声、峰强度归一化、去除固定离子和内部离子。
3.根据权利要求2所述的基于A星算法的蛋白质序列标签测序方法,其特征在于:构建谱峰连接图包括:
基于预处理后的二级质谱图,确定光谱图中的顶点;
合并所述顶点;
如果任意两个顶点的质荷比等于误差范围内一个或多个氨基酸残基质量的总和时,则两个顶点之间连接一条边,根据谱峰及其质量之间的关系,得到了一张谱峰连接图;
基于所述谱峰连接图计算路径评分。
4.根据权利要求3所述的基于A星算法的蛋白质序列标签测序方法,其特征在于:基于所述谱峰连接图计算路径评分包括:
a)获取谱峰连接图Gp(vi,eij),创建Open表与Close表并初始化为空,创建存放顶点的邻近节点表E并初始化为空;
b)将起点v1加入Open表中;
c)如果Open表不为空,则从Open表中选取分数A最大的顶点为当前顶点vi;如果Open表为空,则进入步骤d;
d)判断顶点vi是否为终点vn,如果顶点vi不是终点,则将顶点vi从Open表中删除并加入Close集中,再进行步骤e;
如果顶点vi是终点,将终点vn加入Close表中,并从终点逐步取出Close表中的顶点直到起点v1,输出取出顶点的顺序路径和此时终点的路径最佳分数A;
e)判断与当前节点vi相关的顶点vj的边是否存在,当边eij存在时,即eij=1,则将此节点作为邻近节点存入表Ei中,表Ei表示当前顶点vi所有的邻近节点;当边eij不存在时,即eij=0,则跳过该相关顶点vj;
f)重复步骤e直至遍历完所有顶点,此时获得与当前顶点vi有边的邻近节点表Ei;
g)判断Ei中的各顶点是否在Close表中和Open表中,只有当Ei中的邻近顶点vk不在Close表和Open表中时,才将邻近顶点的父节点设置为当前节点vi,并加入Open表中,计算分数A记作A_k;当邻近顶点在表Close和表Open中任意一个表时,跳过此顶点,进入步骤h;
h)重复步骤g直到将所有邻近节点遍历完,进入步骤c。
5.根据权利要求4所述的基于A星算法的蛋白质序列标签测序方法,其特征在于:生成候选序列标签包括:
基于获取的路径及相应路径最佳分数,根据分数将路径从大到小排序,选择前多个路径生成多肽标签,将所有多肽标签存入第一索引表;
将生成的多肽标签进行碎裂,得到多个碎裂标签,将所有碎裂标签存入第二索引表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工商大学,未经湖南工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310035764.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆控制系统
- 下一篇:具有增材制造的热交换器的主动冷却的超声探头