[发明专利]突变检测分析的方法、设备、可读介质及装置有效

专利信息
申请号: 202210593582.3 申请日: 2022-05-27
公开(公告)号: CN114898803B 公开(公告)日: 2023-03-24
发明(设计)人: 鲍文娟;戴立忠 申请(专利权)人: 圣湘生物科技股份有限公司
主分类号: G16B20/50 分类号: G16B20/50;G16B30/10;G16B40/00
代理公司: 北京派特恩知识产权代理有限公司 11270 代理人: 胡亮;张颖玲
地址: 410205 湖南省长*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 突变 检测 分析 方法 设备 可读 介质 装置
【说明书】:

发明属于生物信息技术领域,具体地,涉及高通量测序数据分析方法及装置,更具体地,涉及突变检测的分析方法及装置。本突变检测方法实现了一种快速检测突变,且准确判断连锁/复杂突变并将其合并的方法。同时跳过了常规流程中SAM文件转为BAM文件、BAM文件的排序、加头文件、去重、重比对等等处理,大大缩短了分析时间;通过一次读取SAM/BAM文件,即可同时分析SNV和InDel突变;最后,通过逐一扫描SAM文件,结合突变特征筛选,在保证查全率的同时,兼顾对假阳性的甄别,结果更加准确。

技术领域

本发明属于生物信息技术领域,具体地,涉及高通量测序数据分析方法及装置,更具体地,涉及突变检测的分析方法及装置。

背景技术

肿瘤突变检测是通过从肿瘤患者外周血或病灶组织中提取DNA,进行高通量测序和生物信息分析,检测出相关的突变(如遗传变异、体细胞突变),可用来指导用药或后续的治疗方案。因样本中来源于肿瘤的基因组占比通常不高,常常采用测序深度>1000X的高深度测序,考虑到经济性,现行的检测方式大都为目标区域捕获测序,即通过捕获几十、几百,甚至上千个肿瘤相关的基因,再进行高深度测序。常规的分析流程通常是采用BWA比对、GATK重比对、Varscan2/Mutect2等突变检测软件对bam文件分别进行SNV、InDel分析,最后根据多个指标(如:深度、频率、p-value等)进行候选位点的筛选。该分析流程普遍耗时约1~2小时,且随着数据量的增加而增加;同时GATK重比对步骤对计算资源要求较高。而且,目前的软件大多基于理论模型计算,灵敏度和特异性方面难以满足高要求的临床样本。

对于连锁或复杂突变,现有的软件通常是给出多个独立的突变结果,通过频率和深度指标进行判断。但是在某些复杂情况下,仅仅靠频率和深度指标来判别连锁并不准确,常常导致注释错误。

因此,针对目前的分析流程存在耗时长、无法准确解决连锁/复杂突变带来的注释错误问题,急需开发一个更快速、准确的生物信息分析方法。

发明内容

有鉴于此,第一方面,本发明请求保护一种突变检测方法:

获得样本的测序数据和参考基因组序列;

对所述样本的测序数据和参考基因组序列进行比对,得到SNV位点信息和InDel位点信息;

对所述得到的SNV位点信息和InDel位点信息进行过滤,得到过滤之后的数据;

对所述过滤之后的数据进行连锁分析,包括:

对同一个染色体上的位置在40bp内的两个目标突变进行两个特征值字符串化后的Levenshtein相似度计算,当两个相似度均大于0.8时,则认定该两个突变为连锁;所述两个特征值分别为:包括所述目标突变的簇的reads数、包含所述目标突变的簇中支持该目标突变的reads数占比。

进一步地,在一些具体的实施方案中,对所述过滤之后的数据进行连锁分析,包括:

对同一个染色体上的位置在20bp内的两个目标突变进行两个特征值字符串化后的Levenshtein相似度计算,当两个相似度均大于0.8时,则认定该两个突变为连锁;所述两个特征值分别为:包括所述目标突变的簇的reads数、包含所述目标突变的簇中支持该目标突变的reads数占比。

在本发明中,术语“簇(cluster)”指的是将比对到相同位置、相同链、相同比对描述的reads归为一个cluster。每个cluster可认为来源于同一个DNA分子模板,或不同模板但原始序列相似。

在本发明中,术语“包括所述目标突变的簇的reads数”指的是包含某个目标突变的簇组成的reads数,例如:比对位置为chr1染色体、起始位置为100000、CIGAR描述为80M3D70M的簇由15条reads组成,则“15”为该定义所指值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于圣湘生物科技股份有限公司,未经圣湘生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210593582.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top