[发明专利]循环肿瘤DNA重复序列的处理方法及装置有效
申请号: | 201810035616.0 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108595918B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 郭昊;于佳宁;韩天澄;宋雪;林小静 | 申请(专利权)人: | 无锡臻和生物科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
地址: | 214500 江苏省无锡市锡山区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 循环 肿瘤 dna 重复 序列 处理 方法 装置 | ||
本发明公开了一种循环肿瘤DNA重复序列的处理方法及装置。其中,该方法包括:获取待检测循环肿瘤DNA的测序数据和参考基因组序列,其中,测序数据为对待检测循环肿瘤DNA进行高通量测序得到的数据,测序数据包括:多对双端序列;将测序数据和参考基因组序列进行比对,得到第一比对结果,其中,第一比对结果至少包括:多对双端序列的基因组位置、碱基序列和对应的碱基质量值序列;基于第一比对结果,得到至少一个一致性序列和每个一致性序列对应的碱基质量值序列。本发明解决了现有技术中测序数据的处理方法对样本测序进行重复序列删除或标记,准确度低的技术问题。
技术领域
本发明涉及遗传工程领域,具体而言,涉及一种循环肿瘤DNA重复序列的处理方法及装置。
背景技术
肿瘤细胞在进行分裂增殖过程当中,会凋亡、死亡、坏死,也会主动向体液中释放携带有肿瘤突变的DNA碎片,也即循环肿瘤DNA(circulating tumor DNA,简称为ctDNA),多存在于血液、滑膜液和脑脊液等体液中,尤其是血浆游离DNA(cell-free DNA,cfDNA)中。通过对ctDNA的测序,检测肿瘤细胞DNA分子上发生碱基序列改变(突变)的基因组区域,能够有效反应病人对治疗的响应;在检测到药物响应之后,肿瘤有可能对药物治疗产生耐药,ctDNA检测也可以追踪耐药突变的产生,定性定量;检测手术后是否存在残余组织,判断预后效果以及早期肿瘤的筛查。不同于常规的基因组DNA,ctDNA片段较短,通常只有100~400bp,而且在血液中含量较少,所以实际中能提取到的ctDNA量含量很低。
由于ctDNA片段较短且含量较低的特点,因此在提取量较少时,需要在建库阶段进行多轮聚合酶链式反应(Polymerase Chain Reaction,简称为PCR),扩大原始提取DNA的含量,以产生足够的DNA分子数目做高通量测序(High-throughput sequencing,简称为NGS测序)和后续生物信息学分析。由于PCR扩增导致对一个分子进行多次镜像复制,产生重复序列(Duplicated reads),这些无效的重复数据对于检测变异极容易引入人工误差。对于最理想的NGS数据分析流程中,都需要尽可能把所有通过PCR获得的测序数据全部去除,还原到没有PCR的状态。
现有技术中,提供了两种重复序列的去重方法,samtools rmdup和Picard’sMarkDuplicates。其中,samtools rmdup的工作原理为:NGS测序得到的序列(read)通过与人类参考基因组比对(mapping),得到这条read的比对位置,如果不同的reads比对到相同的基因组位置,则认为这部分的reads是通过PCR产生的多个重复序列,只保留mapping质量最高的read,删除其余的重复序列。对于PE reads,如果两端的read比多到基因组的不同染色体上或者两者之前的距离过长(即不是Proper Paired),则不作去重考虑。Picard’sMarkDuplicates的基本思路与samtools rmdup相同,通过比较reads中5'端的mapping位置,对于具有相同5'位置的序列,选取测序质量最高的reads作为去重后保留的唯一reads,且对于PE reads不是Proper Paired的情况也会做去重处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡臻和生物科技有限公司,未经无锡臻和生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810035616.0/2.html,转载请声明来源钻瓜专利网。