[发明专利]突变检测分析的方法、设备、可读介质及装置有效
申请号: | 202210593582.3 | 申请日: | 2022-05-27 |
公开(公告)号: | CN114898803B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 鲍文娟;戴立忠 | 申请(专利权)人: | 圣湘生物科技股份有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B30/10;G16B40/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 胡亮;张颖玲 |
地址: | 410205 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 突变 检测 分析 方法 设备 可读 介质 装置 | ||
本发明属于生物信息技术领域,具体地,涉及高通量测序数据分析方法及装置,更具体地,涉及突变检测的分析方法及装置。本突变检测方法实现了一种快速检测突变,且准确判断连锁/复杂突变并将其合并的方法。同时跳过了常规流程中SAM文件转为BAM文件、BAM文件的排序、加头文件、去重、重比对等等处理,大大缩短了分析时间;通过一次读取SAM/BAM文件,即可同时分析SNV和InDel突变;最后,通过逐一扫描SAM文件,结合突变特征筛选,在保证查全率的同时,兼顾对假阳性的甄别,结果更加准确。
技术领域
本发明属于生物信息技术领域,具体地,涉及高通量测序数据分析方法及装置,更具体地,涉及突变检测的分析方法及装置。
背景技术
肿瘤突变检测是通过从肿瘤患者外周血或病灶组织中提取DNA,进行高通量测序和生物信息分析,检测出相关的突变(如遗传变异、体细胞突变),可用来指导用药或后续的治疗方案。因样本中来源于肿瘤的基因组占比通常不高,常常采用测序深度>1000X的高深度测序,考虑到经济性,现行的检测方式大都为目标区域捕获测序,即通过捕获几十、几百,甚至上千个肿瘤相关的基因,再进行高深度测序。常规的分析流程通常是采用BWA比对、GATK重比对、Varscan2/Mutect2等突变检测软件对bam文件分别进行SNV、InDel分析,最后根据多个指标(如:深度、频率、p-value等)进行候选位点的筛选。该分析流程普遍耗时约1~2小时,且随着数据量的增加而增加;同时GATK重比对步骤对计算资源要求较高。而且,目前的软件大多基于理论模型计算,灵敏度和特异性方面难以满足高要求的临床样本。
对于连锁或复杂突变,现有的软件通常是给出多个独立的突变结果,通过频率和深度指标进行判断。但是在某些复杂情况下,仅仅靠频率和深度指标来判别连锁并不准确,常常导致注释错误。
因此,针对目前的分析流程存在耗时长、无法准确解决连锁/复杂突变带来的注释错误问题,急需开发一个更快速、准确的生物信息分析方法。
发明内容
有鉴于此,第一方面,本发明请求保护一种突变检测方法:
获得样本的测序数据和参考基因组序列;
对所述样本的测序数据和参考基因组序列进行比对,得到SNV位点信息和InDel位点信息;
对所述得到的SNV位点信息和InDel位点信息进行过滤,得到过滤之后的数据;
对所述过滤之后的数据进行连锁分析,包括:
对同一个染色体上的位置在40bp内的两个目标突变进行两个特征值字符串化后的Levenshtein相似度计算,当两个相似度均大于0.8时,则认定该两个突变为连锁;所述两个特征值分别为:包括所述目标突变的簇的reads数、包含所述目标突变的簇中支持该目标突变的reads数占比。
进一步地,在一些具体的实施方案中,对所述过滤之后的数据进行连锁分析,包括:
对同一个染色体上的位置在20bp内的两个目标突变进行两个特征值字符串化后的Levenshtein相似度计算,当两个相似度均大于0.8时,则认定该两个突变为连锁;所述两个特征值分别为:包括所述目标突变的簇的reads数、包含所述目标突变的簇中支持该目标突变的reads数占比。
在本发明中,术语“簇(cluster)”指的是将比对到相同位置、相同链、相同比对描述的reads归为一个cluster。每个cluster可认为来源于同一个DNA分子模板,或不同模板但原始序列相似。
在本发明中,术语“包括所述目标突变的簇的reads数”指的是包含某个目标突变的簇组成的reads数,例如:比对位置为chr1染色体、起始位置为100000、CIGAR描述为80M3D70M的簇由15条reads组成,则“15”为该定义所指值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于圣湘生物科技股份有限公司,未经圣湘生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210593582.3/2.html,转载请声明来源钻瓜专利网。