[发明专利]针对第二代肿瘤基因组高通量测序数据的流程校正方法有效
申请号: | 201611264937.5 | 申请日: | 2016-12-30 |
公开(公告)号: | CN106778072B | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 赵仲孟;王嘉寅;耿彧 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 第二代 肿瘤 基因组 通量 序数 流程 校正 方法 | ||
本发明公开了一种针对第二代肿瘤基因组高通量测序数据的流程校正方法。该方法采用一系列32位无符号数为标识量,分别记录对应的每条血系变异或体细胞变异数据,生成体现纯度和不同亚克隆配比的读段数据,根据父子亚克隆继承、兄弟亚克隆互斥的变异关系,得到子代亚克隆及其兄弟亚克隆的体细胞变异的校准数据,用于对所述二代肿瘤基因组高通量测序数据的处理流程进行校正。
技术领域
本发明属于以精准医学为应用背景的数据科学技术领域,是肿瘤精准诊疗的决策支持系统的一套辅助校正系统。
背景技术
近十年来,得益于高通量基因组、转录组测序技术的迅猛发展,肿瘤基因组学和肿瘤精准诊疗无论在医学研究的深度还是在临床应用的广度方面都取得了令人瞩目的成就。肿瘤基因组学研究和肿瘤精准医学都依赖于肿瘤高通量测序数据。从测序仪输出的基因组、转录组测序数据称为读段数据(英文名称是read data),由于短且存在测序误差,所以是不能直接被肿瘤研究人员和临床医师使用的。必须使用一些数据处理流程将读段数据进行处理,简单来说就是通过基因组信息学算法和工具将其中的基因变异信号提取出来,提取后的数据称为变异数据。变异数据是研究人员和医师可以读懂的数据。类似医学检验结果,变异数据是临床诊断的重要参考指标,在肿瘤治疗策略设计、药物筛选或重标定等多个关键步骤中,变异数据都是重要决策依据。
由于目前高通量测序技术和肿瘤基因组信息学技术的局限性,变异数据中不可避免的存在假阳性和假阴性结果。目标是尽可能的减少假阳性和假阴性结果,提高变异数据的精度,以求降低误诊率和低效诊疗的概率,提高用药和诊疗效率。为此,(1)所有针对肿瘤基因组高通量测序数据的处理流程在投入使用前都必须进行流程校正;(2)已经投入使用的流程在遇到特殊病例时也有必要进行个性化再校正。流程校正的主要目的是调整流程中的参数设置,使之与下机的读段数据的特征、病例的肿瘤纯度、肿瘤异质性特征尽量相符,以期获得高精度的变异数据。
目前已有一些针对第二代基因组高通量测序数据的流程校正方法,但是这些方法都没有针对性地考虑肿瘤组织的异质性的问题,所以都不适用于肿瘤基因组数据的处理流程。
已有的校验方法的设计思想是,首先生成一组变异数据,然后基于该组变异数据生成读段数据,最后实施校验。虽然这些方法在生成变异数据和/或读段数据的模型上有所区别,但是其核心思想基本上完全一致。根据这些方法的异同,大体上可以分成三类:第一类关注生成读段数据时模拟测序仪的误差,包括Wgsim、ART、ArtificialFastqGenerator、pIRS和Wessim;第二类关注不同类型的变异,包括SInC和RSVSim[7]能够实现基因组的结构变异;第三类关注种群基因组特征,包括GENOME、FREGene和FIGG。
已有方法不适用于肿瘤基因组数据处理流程的原因如下:
其一,肿瘤组织是正常细胞和不同亚克隆的肿瘤细胞的混合体。现代肿瘤学理论普遍认为,因为肿瘤细胞是从正常细胞演化而来的,所以一般情况下肿瘤细胞继承了正常细胞的变异,同时携带有不同于正常细胞的突变。突变包括两种,一是继承的变异,即肿瘤细胞与正常细胞共有的变异称为血系变异;另一是肿瘤细胞独有的变异称为体细胞变异。不同的肿瘤细胞携带的体细胞变异是不同的。携带相同体细胞变异的肿瘤细胞,如果在肿瘤演化中表现出选择优势,那么就被认为是肿瘤组织的一个亚克隆。肿瘤组织一般都由数个甚至十数个亚克隆组成。因此,针对第二代基因组高通量测序数据的流程校正方法必须根据继承和演化关系依次生成血系变异数据和各个亚克隆的体细胞变异数据。这是已有的方法无法实现的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611264937.5/2.html,转载请声明来源钻瓜专利网。