[发明专利]用于检测目标区域基因融合的方法、装置和存储介质有效
申请号: | 201711107002.0 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107992721B | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 陈龙昀;高志博;李淼;王佳茜;陈超;杨洁 | 申请(专利权)人: | 深圳裕策生物科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 孙银行;彭家恩 |
地址: | 518172 广东省深圳市龙岗区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 目标 区域 基因 融合 方法 装置 存储 介质 | ||
1.一种用于检测目标区域基因融合的方法,其特征在于,所述方法包括:
获取目标区域捕获双末端测序数据比对到参考基因组的结果;
提取在目标区域及前后设定范围内的插入片段大小异常的唯一比对序列的有效信息;
提取在成对扩展区域内的插入片段大小异常的唯一比对序列的有效信息;
对提取的目标区域信息和成对扩展区域信息进行基因注释以确定序列覆盖的基因;
根据基因注释结果将提取的成对读段归类到不同的潜在融合集合中,并统计每个集合的支持数,计算每个潜在断点的簇值,统计每个集合中软剪切的支持数,所述断点的簇值是指将在同一个断点上的软剪切读段的值和PE异常的值累加得到的簇值,所述PE异常是指插入片段大小异常的读段对,但这些读段中不包含软剪切的结果;
分别对集合中两个基因的潜在断点进行聚类,分别得到两个基因中最多富集的簇区间,若其中一个区间的簇值总和不低于设定阈值,则选取该潜在的基因融合;
对分别支持两个基因的软剪切序列两两拼接,若重叠区域同时覆盖到两段序列的软剪切位点,且错配个数不高于设定阈值,视为拼接成功。
2.根据权利要求1所述的方法,其特征在于,在统计步骤之后和聚类步骤之前,所述方法还包括:过滤掉潜在的假阳性集合。
3.根据权利要求2所述的方法,其特征在于,所述假阳性集合包括如下至少一种:集合的支持数低于设定阈值,融合的两个基因为同源基因,以及其中至少一个基因的潜在断点中最大软剪切支持数低于设定阈值。
4.根据权利要求1所述的方法,其特征在于,在所述拼接之后,所述方法还包括:
若两个软剪切位点的基因组位置均落在所得到的簇区域内,则输出该基因融合结果,成功拼接的两条序列对应的软剪切位点区域视为融合的两个断点区域。
5.根据权利要求1所述的方法,其特征在于,在提取目标区域信息的步骤之前,还包括:过滤掉存在多个插入缺失或存在短串联重复序列的序列。
6.根据权利要求1所述的方法,其特征在于,所述目标区域的前后设定范围是前后200bp范围内;所述插入片段大小异常包括大于10Mb或一对读段分别比对到不同染色体上的情况;所述唯一比对序列的比对质量值和平均碱基质量值高于设定阈值;所述有效信息包括比对位置、序列碱基、比对质量值和比对标志。
7.根据权利要求1所述的方法,其特征在于,在提取成对扩展区域信息的步骤之前,还包括:过滤掉存在多个插入缺失或存在短串联重复序列的序列;所述成对扩展区域是根据一条比对到目标区域另一条比对到非目标区域的成对读段位置信息得到。
8.一种用于检测目标区域基因融合的装置,其特征在于,所述装置包括:
比对结果获取模块,用于获取目标区域捕获双末端测序数据比对到参考基因组的结果;
目标区域信息提取模块,用于提取在目标区域及前后设定范围内的插入片段大小异常的唯一比对序列的有效信息;
成对扩展区域信息提取模块,用于提取在成对扩展区域内的插入片段大小异常的唯一比对序列的有效信息;
信息注释模块,用于对提取的目标区域信息和成对扩展区域信息进行基因注释以确定序列覆盖的基因;
断点统计打分模块,用于根据基因注释结果将提取的成对读段归类到不同的潜在融合集合中,并统计每个集合的支持数,计算每个潜在断点的簇值,统计每个集合中软剪切的支持数,所述断点的簇值是指将在同一个断点上的软剪切读段的值和PE异常的值累加得到的簇值,所述PE异常是指插入片段大小异常的读段对,但这些读段中不包含软剪切的结果;
局部聚类模块,用于分别对集合中两个基因的潜在断点进行聚类,分别得到两个基因中最多富集的簇区间,若其中一个区间的簇值总和不低于设定阈值,则选取该潜在的基因融合;和
局部拼接模块,用于对分别支持两个基因的软剪切序列两两拼接,若重叠区域同时覆盖到两段序列的软剪切位点,且错配个数不高于设定阈值,视为拼接成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳裕策生物科技有限公司,未经深圳裕策生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711107002.0/1.html,转载请声明来源钻瓜专利网。