[发明专利]用于检测目标区域基因融合的方法、装置和存储介质有效
申请号: | 201711107002.0 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107992721B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 陈龙昀;高志博;李淼;王佳茜;陈超;杨洁 | 申请(专利权)人: | 深圳裕策生物科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 孙银行;彭家恩 |
地址: | 518172 广东省深圳市龙岗区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 目标 区域 基因 融合 方法 装置 存储 介质 | ||
一种用于检测目标区域基因融合的方法、装置和存储介质,该方法包括:获取比对结果的步骤,提取目标区域信息的步骤,提取成对扩展区域信息的步骤,信息注释的步骤,断点统计打分的步骤,局部聚类的步骤,以及局部拼接的步骤。本发明充分利用双末端测序读段的优势以及比对的信息,检测过程不需要再次比对,也不需要进行复杂的组装过程,目标区域只覆盖其中一个融合区域也可检测到基因融合事件,在优化资源需求和检测速度的同时,大幅提升检测目标区域基因融合的敏感性和特异性。
技术领域
本发明涉及基因检测技术领域,具体涉及一种用于检测目标区域基因融合的方法、装置和存储介质。
背景技术
融合基因是由两个不相关的基因融合形成的一种基因产物,是染色体易位、中间缺失或染色体倒置所致的结果。
当前主流的用于检测基因融合的方法大部分是针对全基因组结构变异的,如CREST(clipping reveals structure,截取揭示结构)。CREST方法利用软剪切信息进行两次组装比对,存在资源要求高、检测速度慢等缺点,同时该方法考虑的还是全基因组范围的检测,对目标区域测序的检测效果较差。
现有检测目标区域基因融合的方法主要是FACTERA(Fusion And ChromosomalTranslocation Enumeration and Recovery Algorithm,融合/染色体易位枚举和检测算法),该方法在目标区域内利用双末端异常关系进行融合区域的聚类,再利用融合区域的软剪切信息进行解析比较,最后进行再比对确认融合结果。由于目标区域和聚类的限制条件,会造成敏感性方面的缺陷;使用的数据没有充分考虑比对错误对检测结果的影响,加上解析比较的模块不够严谨,会造成特异性偏低;比对的部分不能最大优化计算资源和运行时长。因此,还需对现有的基因融合检测方法进行改进,实现能快速精准地检测基因融合事件。
发明内容
本发明提供一种用于检测目标区域基因融合的方法、装置和存储介质,在优化资源需求和检测速度的同时,大幅提升检测目标区域基因融合的敏感性和特异性。
根据第一方面,一种实施例中提供一种用于检测目标区域基因融合的方法,包括:获取比对结果的步骤,该步骤包括获取目标区域捕获双末端测序数据比对到参考基因组的结果;提取目标区域信息的步骤,该步骤包括提取在目标区域及前后设定范围内的插入片段大小异常的唯一比对序列的有效信息;提取成对扩展区域信息的步骤,该步骤包括提取在成对扩展区域内的插入片段大小异常的唯一比对序列的有效信息;信息注释的步骤,该步骤包括对提取的目标区域信息和成对扩展区域信息进行基因注释以确定序列覆盖的基因;断点统计打分的步骤,该步骤包括根据基因注释结果将提取的成对读段归类到不同的潜在融合集合中,并统计每个集合的支持数,计算每个潜在断点的簇值,统计每个集合中软剪切的支持数;局部聚类的步骤,该步骤包括分别对集合中两个基因的潜在断点进行聚类,分别得到两个基因中最多富集的簇区间,若其中一个区间的簇值总和不低于设定阈值,则选取该潜在的基因融合;和局部拼接的步骤,该步骤包括对分别支持两个基因的软剪切序列两两拼接,若重叠区域同时覆盖到两段序列的软剪切位点,且错配个数不高于设定阈值,视为拼接成功。
进一步地,上述方法还包括:预过滤的步骤,该步骤包括过滤掉潜在的假阳性集合。
进一步地,上述过滤掉潜在的假阳性集合包括如下至少一种:集合的支持数低于设定阈值,融合的两个基因为同源基因,以及其中至少一个基因的潜在断点中最大软剪切支持数低于设定阈值。
进一步地,上述方法还包括:若两个软剪切位点的基因组位置均落在所得到的簇区域内,则输出该基因融合结果,成功拼接的两条序列对应的软剪切位点区域视为融合的两个断点区域。
进一步地,在提取目标区域信息的步骤之前,还包括:过滤掉存在多个插入缺失或存在短串联重复序列的序列。
进一步地,上述目标区域的前后设定范围是前后200bp范围内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳裕策生物科技有限公司,未经深圳裕策生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711107002.0/2.html,转载请声明来源钻瓜专利网。