[发明专利]基因组序列的组装方法、结构变异探测方法和相应的系统有效
申请号: | 201610109249.5 | 申请日: | 2016-02-26 |
公开(公告)号: | CN107133493B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 李雷;王安琪;李峥;王占宇 | 申请(专利权)人: | 中国科学院数学与系统科学研究院 |
主分类号: | G16B30/20 | 分类号: | G16B30/20 |
代理公司: | 11409 北京德恒律治知识产权代理有限公司 | 代理人: | 章社杲;卢军峰 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基因组序列的组装方法、和相应的结构变异探测方法,该组装方法包括:通过设计序列映射的唯一性准则,将被测基因组的测序序列向参考基因组进行映射,并对映射结果进行恰当的切割,形成组装叠阵集。然后根据单映序列在组装叠阵集上的坐标和同伴关系估计基因组的构架,并根据组装叠阵集上单映序列的坐标和它们的同伴序列将叠阵向外延拓。延拓对各个叠阵以并行方式计算执行。延拓后的相邻叠阵一致序列如果存在重叠就将它们连接。这样所得到的当前组装基因组作为下一轮的参考基因组,通过调整序列映射的唯一性准则,重复以上拼接步骤,改进基因组的组装结果。所测基因组相对于参考基因组的结构变异,在拼接的过程中同时被探测出来。 | ||
搜索关键词: | 基因组 序列 组装 方法 结构 变异 探测 相应 系统 | ||
【主权项】:
1.一种基因组序列的组装方法,其特征在于,包括:/n(1)通过预定的映射算法将样品的被测基因组的测序序列映射到参考基因组,得到单映射测序序列叠阵集,其中,所述样品的测序序列为利用高通量测序技术测得,所述参考基因组已知并与所述样品的基因组相近;/n(2)基于经过预处理的参考基因组对所述单映射测序序列叠阵集中的测序序列进行筛选,所得筛选结果根据覆盖度再次筛选,得到筛选后的单映射测序序列叠阵集;/n(3)通过单方向测序序列信息对所述筛选后的单映射测序序列叠阵集进行切割,得到初始预组装叠阵集,将当前预组装叠阵集的初始值设置为所述初始预组装叠阵集;/n(4)确定所述当前预组装叠阵集中每个叠阵的相对位置,形成组装基因组架构;/n(5)对所述组装基因组架构中的每个叠阵进行延拓,得到每个叠阵的一致序列;/n(6)将所述组装基因组架构中的相邻叠阵的一致序列中符合预定连接规则的一致序列进行连接,得到所述样品的当前的组装基因组;/n(7)根据所述被测基因组上同源序列的差异调整所述预定的映射算法的映射参数,通过调整后的该预定的映射算法将所述样品的被测基因组的测序序列映射到所述当前的组装基因组,得到当前预组装叠阵集;/n对所述当前预组装叠阵集迭代执行所述步骤(4)、(5)和(6),迭代次数为任何非负整数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院数学与系统科学研究院,未经中国科学院数学与系统科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610109249.5/,转载请声明来源钻瓜专利网。