[发明专利]一种基于下一代测序的多基因融合检测方法在审
申请号: | 201710650048.0 | 申请日: | 2017-08-02 |
公开(公告)号: | CN107267646A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 郑灏;邓杏飞 | 申请(专利权)人: | 广东国盛医学科技有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F19/12;G06F19/18 |
代理公司: | 北京科家知识产权代理事务所(普通合伙)11427 | 代理人: | 李雪鹃 |
地址: | 510000 广东省广州市高新技*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 下一代 多基因 融合 检测 方法 | ||
技术领域
本发明属于基因检测技术领域,尤其涉及一种基于下一代测序的多基因融合检测方法。
背景技术
嵌合转录物是一些类型癌症(比如肺癌)的标记物,它是由两个以上不相关的基因嵌合产生的一种基因组重组排列的产物,具有新型的功能或与两个融合前基因不同的功能,在基于下一代测序技术的肿瘤检测应用中尤为重要。随着近几年来下一代测序技术的飞速进步,液态活检技术在临床上得到前所未有的青睐,在未来有着巨大的转化医学潜力。从血浆游离DNA(cfDNA)中检测出循环肿瘤DNA是一种相对无创的液体活检方式,基于cfDNA下一代测序数据的嵌合转录物的基因伙伴和断点检测方法是癌症早期检测的关键技术之一。
发明内容
基于现有技术存在的情况,本发明提供一种新的多基因融合嵌合转录物的基因伙伴和断点检测方法MF-PE,该方法基于下一代测序双端读长(Paired End Read)和机器学习序列比对进行多基因融合检测,从而进一步为临床检测癌症提供判断依据。本发明提供的检测方法具有高敏感度和阳性预测值,非常适合用cfDNA的嵌合转录物的基因伙伴和断点检测。
本发明通过以下技术方案达到目的:
一种基于下一代测序的多基因融合检测方法,其包括如下步骤:
步骤S10预处理和映射:将经过测序的原始序列数据通过脚本程序去除低质量读和重复读,再通过按碱基逐一比对对双端序列的计算融合度能量值,使用BWM MEM算法将原始双端读长序列映射到参考序列;
步骤S20建立候选多基因融合数据库:将候选多基因融合,通过程序算法过滤嵌合转录物的高度同源基因伙伴,再建立仿真嵌合转录物参考序列数据库;
步骤S30检测多基因融合断点:通过BWA MEM算法将步骤S10处理后的序列读和步骤S20中建立的仿真嵌合转录物参考序列进行比对,通过CIGAR分析,若有2对读横跨2个基因断点并且具有唯一的映射,且长度不低于8个碱基,则确认融合断点,执行步骤S50;若不能直接比对,则执行步骤S40;
步骤S40仿真嵌合转录物参考序列切割比对检测融合断点:将不能直接比对的读进行3分切割,通过BWA MEM算法进行细微比对,再确认融合断点;
步骤S50确认mapping:根据步骤上S30和步骤室S40的比对值进行mapping优化,取加权mapping质量高为最终mapping。
其中,步骤S10中还包括步骤S11,跟踪监测重复读的重复数。
其中,所述的步骤S20中的候选多基因融合每对基因对至少有2个以上的支持的读对,序列覆盖深度大于20。
其中,步骤S20中的仿真数据库包括所有不同的正付链排列组合。
其中,步骤S20中的仿真数据库的正付链排列组合共有8种组合。
具体实施方式
下面结合具体实施例对本发明作进一步的描述。
采用MultiFusion数据集作为本发明提供的基于下一代测序的多基因融合检测方法的检测对象,其包括如下步骤:
步骤S10预处理和映射:将MultiFusion数据集的序列数据通过脚本程序去除低质量读和重复读,再通过按碱基逐一比对对双端序列的计算融合度能量值,使用BWM MEM算法将原始双端读长序列映射到参考序列;
步骤S11,跟踪监测重复读的重复数;
步骤S20建立候选多基因融合数据库:将候选多基因融合,通过程序算法过滤嵌合转录物的高度同源基因伙伴,再建立仿真嵌合转录物参考序列数据库,候选多基因融合每对基因对至少有2个以上的支持的读对,序列覆盖深度大于20,仿真数据库包括所有不同的正付链排列组合,即是正付链排列组合共8种组合;
步骤S30检测多基因融合断点:通过BWA MEM算法将步骤S10处理后的序列读和步骤S20中建立的仿真嵌合转录物参考序列进行比对,通过CIGAR分析,若有2对读横跨2个基因断点并且具有唯一的映射,且长度不低于8个碱基,则确认融合断点,执行步骤S50;若不能直接比对,则执行步骤S40;
步骤S40仿真嵌合转录物参考序列切割比对检测融合断点:将不能直接比对的读进行3分切割,通过BWA MEM算法进行细微比对,再确认融合断点;
步骤S50确认mapping:根据步骤上S30和步骤室S40的比对值进行mapping优化,取加权mapping质量高为最终mapping。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东国盛医学科技有限公司,未经广东国盛医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710650048.0/2.html,转载请声明来源钻瓜专利网。