[发明专利]基于细胞游离DNA的深度测序数据提取生物标记物的方法和装置有效
申请号: | 201711276870.1 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108021788B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 万季;宋麒;潘有东;崔好;韩艳;高峰 | 申请(专利权)人: | 北京新合睿恩生物医疗科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/50;G16B40/20;G16B30/10 |
代理公司: | 北京金信知识产权代理有限公司 11225 | 代理人: | 黄威;范琏 |
地址: | 102206 北京市昌*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 细胞 游离 dna 深度 序数 提取 生物 标记 方法 装置 | ||
提供一种基于细胞游离DNA的深度测序数据提取生物标记物的方法和装置。方法包括由处理器执行的如下步骤:获取不同类别的样本的细胞游离DNA的深度测序数据;计算每个样本数据在每个碱基位置的各变异的频率值;基于所计算的每个碱基位置的各变异的频率值,得到每个类别在所有碱基位置上的变异的频率分布;确定频率分布在类别间具有充分差异的变异;以及基于所确定的变异提取所述生物标记物。该方法可以极大限度地挖掘cfDNA数据中的信息。
技术领域
本发明涉及分子生物学技术领域,具体涉及基于细胞游离DNA的深度测序数据提取生物标记物的方法以及装置。
背景技术
人类的疾病直接或间接与基因有关(文中又称此种类型的疾病为基因疾病),如所有的遗传病,都是由于基因结构异常或基因表达异常所引起的;有些疾病则是环境因素与遗传因素综合作用的结果,如吸烟引起肺癌。基因异常所致疾病(即,基因疾病)大致分为以下三类:1.单基因病:在一个基因位点上存在缺陷,如镰刀红细胞贫血。2.多基因病:涉及一个以上的基因以及基因与环境因素的相互作用,如肿瘤、心血管病、代谢性疾病、神经和精神类疾病、免疫性疾病等。3.获得性基因病:这类疾病由病原微生物感染引起,不符合孟德尔遗传规律,但可发生病原微生物基因组与人类基因组的相互作用,这类疾病多数涉及人类基因组结构及表达功能的改变,如爱滋病、鼻咽癌等。
cfDNA、ctDNA和CTC的检测作为当前比较热门的液体活检的手段,可应用于疾病的诊断。其中,cfDNA(cell-free DNA,细胞游离DNA),即血液或其他体液中游离的DNA片段。在基因病,例如肿瘤的发展过程中,肿瘤细胞会通过各种机制将其DNA释放到循环系统中(如血液、尿液等)。肿瘤DNA上面携带了大量与肿瘤发生发展相关的突变信息。这些来自肿瘤细胞的DNA片段和血液(或者其他体液)里来自各种正常细胞的DNA片段混合即cfDNA,而来自肿瘤的DNA片段被称为ctDNA(circulating tumor DNA, 循环肿瘤DNA)片段。
ctDNA由于其非侵入式的特点,可用于检测多种类型肿瘤的疾病状况。当前ctDNA的检测主要分为数字PCR(digital polymerase chain reaction,数字聚合酶链式反应)和NGS(next-generation sequencing,下一代基因测序) 两大主要分支。数字PCR可以从突变比例极低的样本中检测到指定的突变以及突变的绝对含量信息,具有很高的灵敏度和可靠性,是当前ctDNA检测的金标准。但是这一方法需要预先指定待检测的突变位点,同时检测的位点数目受仪器的承载容量限制。与数字PCR不同,NGS可以对基因组的指定区域进行扫描,检测范围不再局限于指定的具体突变,这样有助于覆盖更多的检测区域和突变。但是,现有的以肿瘤组织突变数据为参照从血液(或者其他体液)中寻找肿瘤DNA生物标记物的方案并不完善。首先,即便是同一肿瘤类型,相关的突变在病人间的重现率并不高。其次,同一病人肿瘤组织与ctDNA突变信息的一致性关系仍有待大规模的实验验证。由于生物上的和检测技术上的诸多因素,在病人肿瘤组织样本中检出的突变无法在(血液或其他体液)ctDNA样本中检出。肿瘤突变的低重现率和ctDNA突变缺失的两大问题,限制了ctDNA在临床,尤其是早期诊断方面的推广。
发明内容
针对ctDNA临床应用中存在的上述问题,本发明综合考虑了血液中游离 DNA的来源和深度测序的数据特点,提出了一套提取cfDNA(而非ctDNA) 特有的生物标记物的方法。
根据本发明的一个方案,提供了一种由计算机实现的基于不同类别的细胞游离DNA的深度测序数据提取生物标记物的方法,包括由处理器执行的如下步骤:获取不同类别的样本的细胞游离DNA的深度测序数据;计算每个样本数据在每个碱基位置的各变异的频率值;基于所计算的每个碱基位置的各变异的频率值,得到每个类别在所有碱基位置上的变异的频率分布;确定频率分布在类别间具有充分差异的变异;以及基于所确定的变异提取所述生物标记物。
优选地,所述样本为体液样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新合睿恩生物医疗科技有限公司,未经北京新合睿恩生物医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711276870.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地铁混凝土裂纹修复装置
- 下一篇:一种装修用墙面漆混料装置