[发明专利]一种基于混合策略的复杂结构变异检测方法有效
申请号: | 201910370728.6 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110010193B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 王妙;王嘉寅;张选平;韩博;刘涛;管彦芳;王旭文;王申杰 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B20/20;G16B40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 策略 复杂 结构 变异 检测 方法 | ||
本发明公开了一种基于混合策略的复杂结构变异检测方法,收集并统计双末端测序生成读对的插入片段长度分布和链向信息,确定读对比对链向、插入片段长度和两端读段比对到的染色体出现异常的读对;采用双末端映射法、局部组装法和分裂读段法的混合策略对断点进行识别;断点是一对参考基因组上的坐标,在样品中相邻,但在参考基因组上分隔;根据比对结果更新断点位置信息,将记录结构变异断点信息的断点间隔变为精确位置;结构变异断点信息包括结构变异类型、断点起始位置和支持读段个数;记录读对的比对质量和支持断点的读对个数,完成精确识别结构变异。本发明提高了变异检出精度,提供复杂结构变异的检出方法。
技术领域
本发明属于以精准医学为应用背景的数据科学技术领域,具体涉及一种基于混合策略的复杂结构变异检测方法。
背景技术
癌症是目前中国发病率、死亡率第一的疾病。近二十年来,现代肿瘤学,特别是肿瘤基因组学快速发展,由此带来的肿瘤精准诊疗使得癌症五年生存率大大提高。精准治疗的基础是以高敏感度、高特异性、高效地分析、检出关键的基因突变,精准治疗的疗效极大的依赖于数据分析的精度。
根据基因组学的定义,基因突变可分为单核苷酸变异(英文名称:singlenucleotide variants,英文缩写:SNV)和结构变异(英文名称:structural variation,英文缩写:SV)。其中SNV是由于脱氧核糖核酸(英文名称:deoxyribonucleic acid,英文缩写:DNA)序列上的单个核苷酸——腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶(英文缩写分别为A、T、C、G)——的改变而引起的变异,能造成生物包括人类在内的物种之间的不同个体的差异,表现为基因的多样性。结构变异是指基因组中部分序列结构的变化。结构变异在广义上指个体间非单核苷酸变异的基因组变化,典型的包括删除插入、倒位、串联重复、易位等五类。单核苷酸变异一直被视为人类遗传变异的主要形式,但这一概念在2004年之后发生了很大改变。研究人员发现在人类基因组上广泛存在着从数千碱基到数百万碱基长度的结构变化,与单核苷酸变异相比,虽然结构变异的频率较低,但累积的碱基数量却大大超过单核苷酸变异,对人类健康和疾病的影响更为显著。精准检测人类全基因组范围的结构变异,对变异形成机制的研究、疾病诊治等具有重要的意义。目前研究已经广泛证明,结构变异和基因拷贝数变异(英文名称:Copy number variations,英文缩写:CNV)在多种疾病中起核心作用。因此,敏感地检出个体基因组缺失变异并检测到其确切的断点位置,即达到碱基解析度(度量单位:bp)意义重大。一方面,确切的断点位置有利于系统地推断变异形成过程,研究变异的形成机理;另一方面,断点位置的精确化是后续一系列数据分析步骤,包括基因分型、变异功能评估等,的重要基础。
高通量测序技术又称下一代测序(英文名称:next-generation sequencing,英文缩写:NGS)技术。NGS技术可以一次性测定几十万甚至几百万条序列,是现今应用最广泛的基因组测序技术。相对于传统的桑格测序技术,NGS技术具有高速、高通量、低价格等优点,但是NGS产生读段长度(简称:读长)较短,普遍介于75bp至500bp之间。短读长对于突变的数据检测技术提出了计算挑战。其原因在于,由于读长度较短,当发生较为复杂的复杂结构变异时,算法的局部寻优空间复杂,不易计算。因此,已有软件普遍只给出一个大致的变异范围,大多不能达到碱基精度。不仅如此,低频、低测序深度的结构变异的精确检出也十分困难。其原因在于,低频、低测序深度的结构变异的支持读段数较低,单一的概率模型难以区分突变和测序、比对错误,需要综合多维度数据判断。低频是指突变频率介于0.1%至10%的变异。测序深度是指测序得到的碱基总量与基因组大小的比值。低测序深度是指深度小于500X(X是测序深度单位)的测序数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910370728.6/2.html,转载请声明来源钻瓜专利网。