[发明专利]一种利用基因组数据探究疾病亚型亲缘性的方法有效
申请号: | 202010469680.7 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111653312B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 侯群星;袁卫兰;高军晖;林灵;吴昊天;蒋丽莎;李无霜;王瑶瑶;吴守信;许骋 | 申请(专利权)人: | 上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司;上海张江医学创新研究院 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/50;G16B30/10;G16B40/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 巩克栋 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 基因组 数据 探究 疾病 亲缘 方法 | ||
本发明提供了一种利用基因组数据探究疾病亚型亲缘性的方法,所述方法包括采用超几何分布检验计算基因非沉默突变富集值的步骤;所述基因非沉默突变富集值的计算公式为:其中,nf为基因在疾病亚型中发生非沉默突变的样本数,Nf为基因在所有样本中发生非沉默突变的样本数,n为疾病亚型样本数,N为样本总数;所述疾病亚型的分组数量不小于3。本发明在进行疾病亚型亲缘性分析之前,首先利用超几何分布检验计算基因在各肿瘤亚型中的非沉默突变富集分数,再利用此富集分数进行亲缘性分析,减小了样本总数、疾病亚型样本数等背景因素对分析结果造成的影响,提高了方法的准确性。
技术领域
本发明属于生物信息分析技术领域,涉及一种利用基因组数据探究疾病亚型亲缘性的方法。
背景技术
癌症是一类由于细胞分类和调往机制失常而导致的疾病,通常表现为恶性肿瘤。由于癌症的早期诊断准确性差,复发率和死亡率高,已经成为严重威胁人类健康的疾病之一。近年来人们已经认识到肿瘤的发生和转移是多基因、多步骤相互作用连续发展的结果,对肿瘤进行整体、全面、动态的研究是防治肿瘤的根本途径。不同的肿瘤存在不同的亚型,由于肿瘤的临床异质性,在临床上对于不同的肿瘤亚型需要采用不同的治疗策略。尽管如此,探究肿瘤亚型亲缘性对于肿瘤的临床治疗和预后同样具有重要的意义。
目前,研究肿瘤亚型亲缘性的方法的主要步骤为:1)根据病人样本获取WES测序数据;2)根据测序数据分析病人的体细胞突变情况;3)对突变位点进行注释;4)对注释结果进行格式转换并对突变类型进行注释;5)突变类型筛选;6)统计各基因在各样本中是否存在非沉默突变;7)根据样本的非沉默突变统计结果,使用层次聚类方法计算各疾病亚型之间的亲缘性。
但是现有技术只统计了样本中非沉默突变情况的有或无,并直接根据此统计结果聚类分析疾病亚型的亲缘性,并未考虑样本数量等背景因素对结果造成的影响。因此,现有方法得出的结果可能存在准确性差的问题。
因此,提供一种更加精准的疾病亚型亲缘性的分析方法,在肿瘤的临床治疗和预后监测领域具有重要意义。
发明内容
针对现有技术的不足和实际需求,本发明提供了一种利用基因组数据探究疾病亚型亲缘性的方法,所述方法在进行疾病亚型亲缘性分析之前,首先利用超几何分布检验计算基因在各肿瘤亚型中的非沉默突变富集分数,再利用此富集分数进行亲缘性分析,减小了样本总数、疾病亚型样本数等因素对分析结果造成的影响。
为达此目的,本发明采用以下技术方案:
第一方面,本发明提供了一种疾病亚型亲缘性的分析方法,所述方法包括采用超几何分布检验计算基因非沉默突变富集值的步骤;
所述基因非沉默突变富集值的计算公式为:
其中,nf为基因在疾病亚型中发生非沉默突变的样本数,Nf为基因在所有样本中发生非沉默突变的样本数,n为疾病亚型样本数,N为样本总数;
所述疾病亚型的分组数量不小于3。
本发明中,在进行疾病亚型亲缘性分析之前,首先利用超几何分布检验计算基因在各肿瘤亚型中的非沉默突变富集分数,再利用此富集分数进行亲缘性分析,减小了样本总数、疾病亚型样本数等因素对分析结果造成的影响,提高了方法的准确性。
优选地,所述方法包括以下步骤:
(1)对肿瘤和正常样本进行测序,获取全外显子测序数据;
(2)根据测序数据分析样本的体细胞突变情况;
(3)对突变位点进行注释;
(4)将注释结果进行格式转换,并对突变类型进行注释;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司;上海张江医学创新研究院,未经上海宝藤生物医药科技股份有限公司;上海宝藤医学检验所有限公司;上海张江医学创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010469680.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置