[发明专利]一种核酸序列比对的方法有效
申请号: | 201810914779.6 | 申请日: | 2018-08-13 |
公开(公告)号: | CN110875084B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 朱欠华;杨林峰 | 申请(专利权)人: | 深圳华大基因科技服务有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅 |
地址: | 518303 广东省深圳市盐田区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 核酸 序列 方法 | ||
1.一种核酸序列比对的方法,包括如下步骤:
(1)获取与输入序列类似性积分最高的参考序列;
(2)从所述参考序列中截取与输入序列等长的若干个比对序列;
(3)将输入序列分别和比对序列比对,获取输入序列与各个比对序列的匹配信息;
(4)根据步骤(3)获取的匹配信息,获取比对序列的比对得分;
比对得分越高,则输入序列和该比对序列的相似度越高;
所述步骤(4)包括如下步骤:
(4-1)根据步骤(3)获取的匹配信息,按照罚分规则1获得各个比对序列的罚分值;然后选择罚分值为3以下的比对序列进行如下步骤,获得比对得分:
(4-1-1)根据输入序列和各个罚分值为3以下的比对序列的匹配结果,获得相应的匹配分值;每个匹配碱基计1分;
(4-1-2)获得各个罚分值为3以下的比对序列的比对得分;比对得分=匹配分值-罚分值;
(4-2)根据步骤(3)获取的匹配信息,将输入序列分为四个区段,分别为5’末端的第1-2个碱基组成的输入区段S1、A个碱基组成的输入区段A、B个碱基组成的输入区段B和3’末端的第1-2个碱基组成的输入区段S2;A和B均为1以上的自然数;
输入区段A与输入区段B相邻的一端有C个碱基与步骤(1)获取的参考序列完全匹配;输入区段B与输入区段A相邻的一端有D个碱基与步骤(1)获取的参考序列完全不匹配;C为自然数且1<C≤A;D为自然数且1<D≤B;
(4-3)按照如下步骤进行插入比对;
(4-3-1)从步骤(1)获取的参考序列中截取并组装与输入序列等长的若干个比对序列;每个比对序列由第1-2个碱基组成的比对区段V1、A个碱基组成的比对区段A、一个空格、B-1个碱基组成的比对区段C和第1-2个碱基组成的比对区段V2组成;其中空格在比对区段A和比对区段C之间;A和B均为1以上的自然数;
比对区段A与空格相邻的一端的C个碱基与所述输入区段A中与输入区段B相邻的一端的C个碱基完全匹配;
(4-3-2)将输入序列分别和步骤(4-3-1)获得的比对序列比对,获取输入序列与各个比对序列的匹配信息;
(4-3-3)根据步骤(4-3-2)获取的匹配信息,按照罚分规则2获得各个比对序列的罚分值;选择罚分值为3以下的比对序列进行如下步骤,获得比对得分:
①根据输入序列和各个罚分值为3以下的比对序列的匹配结果,获得相应的匹配分值;每个匹配碱基计1分;
②获得各个罚分值为3以下的比对序列的比对得分;比对得分=匹配分值-罚分值;
(4-4)按照如下步骤进行缺失比对;
(4-4-1)向输入序列的输入区段A和输入区段B的中间添加一个空格,作为新的输入序列;
(4-4-2)步骤(1)获取的参考序列中截取与新的输入序列等长的若干个比对序列;每个比对序列由第1-2个碱基组成的比对区段V3、A个碱基组成的比对区段A、B+1个碱基组成的比对区段D和第1-2个碱基组成的比对区段V4组成;A和B均为1以上的自然数;
比对区段A与比对区段D相邻的一端的C个碱基与所述输入区段A中与输入区段B相邻的一端的C个碱基完全匹配;
(4-4-3)将新的输入序列分别和步骤(4-4-2)获得的比对序列比对,获取新的输入序列与各个比对序列的匹配信息;
(4-4-4)根据步骤(4-4-3)获取的匹配信息,按照罚分规则2获得各个比对序列的罚分值;选择罚分值为3以下的比对序列进行如下步骤,获得比对得分:
③根据新的输入序列和各个罚分值为3以下的比对序列的匹配结果,获得相应的匹配分值;每个匹配碱基计1分;
④获得各个罚分值为3以下的比对序列的比对得分;比对得分=匹配分值-罚分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810914779.6/1.html,转载请声明来源钻瓜专利网。