[发明专利]一种基于混合策略的复杂结构变异检测方法有效
申请号: | 201910370728.6 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110010193B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 王妙;王嘉寅;张选平;韩博;刘涛;管彦芳;王旭文;王申杰 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B20/20;G16B40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 策略 复杂 结构 变异 检测 方法 | ||
1.一种基于混合策略的复杂结构变异检测方法,其特征在于,收集并统计双末端测序生成读对的插入片段长度分布和链向信息,确定读对比对链向、插入片段长度和两端读段比对到的染色体出现异常的读对;
采用双末端映射法、局部组装法和分裂读段法的混合策略对断点进行识别;断点是一对参考基因组上的坐标,在样品中相邻,但在参考基因组上分隔;双末端映射法具体为:通过识别读对的插入片段长度、比对链向信息和比对到的染色体号来确定结构变异,包含以下步骤:
S201、根据读对的插入片段长度、比对链向信息和比对到的染色体号来识别比对不一致的读对;读对包含两个读段,分别是读段1和读段2;当一个读对的两个读段被比对到参考基因组时,若其比对结果同时满足以下三种情况,则定义其为比对一致的读段;否则定义其为比对不 一致的读段:
情况一:读对比对在同一染色体上;
情况二:读对比对在参考序列的方向为一正一负,且读段一为正,读段二为负;
情况三:插入片段长度的区间是[μ-3σ,μ+3σ],其中,μ为片段插入长度均值,σ为插入片段长度方差;
S202、对比对不一致的读对按照比对位置和比对到的染色体号进行排序;
S203、对比对不一致的读对按照比对到的染色体号、比对位置和比对链向信息进行聚类;
S204、初始化假定断点;
根据比对结果更新断点位置信息,将记录结构变异断点信息的断点间隔变为精确位置,将双末端映射法得到结构变异的断点间隔,利用断点间隔寻找在间隔内的读段信息,收集断点间隔范围内的软剪辑读段、断点间隔范围内单端未比对上的读段和断点间隔范围内附近比对不一致的读对后进行组装;其中,软剪辑读段是在基因组测序过程中横跨删除位点及剪接位点的读段;当这些读段被比对到参考基因组时,一条读段被切成两段,匹配到不同的区域;单端未比对上的读段是一端比对到参考基因组上,另外一端读段由于跨越断点而没有比对到参考基因组上的读段;
收集断点间隔范围内含有软剪辑的读段并组装具体为:
利用双末端映射法得到的结构变异信息,找到比对位置在断点间隔范围内且含有软剪辑的读段;根据参考基因组上对应的起始和结束坐标,分别收集所对应的读段,并对它们进行组装;
收集断点间隔范围内的单端未比对上的读段并组装具体为:
在收集单端未比对上的读段时,将结构变异两端的断点作为锚点收集;利用断点作为锚点,利用比对上一端读段的比对位置信息、比对链向信息和结构变异的类型确定未比对上的读段的链向,最后根据锚点搜寻方向和最大搜寻长度收集跨越断点的读段信息,结构变异的类型包括删除、倒位、易位和串联重复;
在双末端映射时收集所有比对不一致的读对,根据收集比对不一致的读对并聚类来初步识别断点间隔;
对收集的符合组装条件的读段,按照读段类型进行组装,得到多条共有序列,最后将得到的多条共有序列再次组装,形成最终的共有序列;
分裂读段法的步骤如下:
S501、提取断点间隔范围内参考基因组的碱基序列;
S502、提取共有序列;
S503、参考基因组与共有序列比对;
结构变异断点信息包括结构变异类型、断点起始位置和支持读段个数;记录读对的比对质量和支持断点的读对个数,完成精确识别结构变异。
2.根据权利要求1所述的基于混合策略的复杂结构变异检测方法,其特征在于,对参考基因组的碱基序列进行反向互补操作的步骤如下:
S504、取得从双末端映射法得到的含有断点信息的断点间隔;
S505、从参考基因组上提取断点间隔范围内的碱基序列;
S506、根据不同的结构变异类型对获取到的参考基因组的碱基序列进行位置调换和反向互补操作;不同结构变异类型包括删除、倒位、易位和串联重复;得到参考基因组的碱基序列和共有序列后,使用间隔切除校准法中的双序列比对方法进行共有序列与参考基因组的比对,最后进行精确的断点识别;将共有序列拆分成两个片段分别映射到参考基因组上,当发生插入事件后,将共有序列拆成三个片段,中间没有比对上的片段为可能的插入片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910370728.6/1.html,转载请声明来源钻瓜专利网。