[发明专利]一种以断点为中心的染色体结构变异鉴定方法有效
申请号: | 202110268544.6 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112687341B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 韩志军;王杰;张倩倩;梁雷;谢正华 | 申请(专利权)人: | 上海思路迪医学检验所有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 彭昶;李志强 |
地址: | 200120 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 断点 中心 染色体 结构 变异 鉴定 方法 | ||
本发明涉及一种以断点为中心的染色体结构变异鉴定方法。具体而言,本发明涉及一种可由计算机实施的以断点为中心的鉴定染色体结构变异的方法。本发明还涉及用于实施所述方法的计算机系统或装置、以及存储有能够实施所述方法的计算机程序的计算机可读介质。
技术领域
本发明涉及核酸测序领域。本发明涉及一种以断点为中心的染色体结构变异鉴定方法。具体而言,本发明涉及一种可由计算机实施的以断点为中心的鉴定染色体结构变异的方法。本发明还涉及用于实施所述方法的计算机系统或装置、以及存储有能够实施所述方法的计算机程序的计算机可读介质。
背景技术
染色体结构变异是指染色体改变其原有的基因组序列和结构,如发生插入、缺失、倒置、易位等变异,从而产生新的染色体结构。染色体结构变异在肿瘤细胞中经常出现,如EML4-ALK基因融合现象、EGFR激酶结构域重复等,检测染色体结构变异对于指导肿瘤治疗以及用药具有重要临床意义。
染色体结构变异检测的难点在于准确鉴定结构变异断点产生的位置以及方向,进而才能准确分析结构变异的类型、可靠性、功能性以及变异丰度等特征。
检测染色体结构变异断点的难点之一在于目前常用的二代测序技术的读长有限,而断点位置在建库打断的DNA片段中随机分布,使得大部分测序读段都不包含有断点信息或仅包含有限的跨断点的序列,从而导致难以从单一读段中获取染色体结构变异两端的断点信息。
检测染色体结构变异断点的难点之二在于染色体结构变异常发生在基因组的重复序列区域,导致测序读段在断点附近的比对质量较低或测序错误率较高,从而增加了断点检测的难度。
检测染色体结构变异断点的难点之三在于对于低频染色体结构变异,测序产生的数据中包含的支持结构变异的读段数目少,其包含断点的读段更加有限,从而增加了断点检测的难度。
当前染色体结构变异断点的鉴定方法主要有两种,其一是对测序产生的原始读段先组装成更长的序列,进而再比对到基因组上获得准确的断点位置,其二是将测序产生的原始读段直接比对到基因组上,进而从具有二级比对的读段中提取断点位置信息。前者的难点在于组装过程资源耗费多、组装结果准确度低,从而导致检测灵敏性与特异性都较低,后者的难点在于若无具有二级比对结果的读段将无法鉴定结构变异的具体断点,以及该种方法存在遗漏部分支持结构变异的读段,以及由于建库过程中不可避免的会产生大量具有二级比对结果的假阳性读段等,从而导致该种方法的检测灵敏性与特异性依然存在不足。
为解决前述方法中存在的可能遗失支持结构变异的读段、对低频结构变异检测灵敏度低、检出结果中特异性低等问题,本发明提供了一种以结构变异断点为中心的检测方法,可以显著提高基因组结构变异检测性能。
发明内容
本发明通过提供一种以断点为中心的结构变异鉴定算法解决了上述技术问题。具体而言,本发明方法首先提取了所有潜在的结构变异支持读段,避免了其它方法中存在的支持读段丢失的可能;其次,本发明独特的以断点为中心的结构变异支持读段统计算法统计了所有支持该断点的读段同时又避免了假阳性读段,并充分利用了读段的位置信息、正负链信息、软剪切的序列和方向信息,从而保证了本发明敏感性和特异性。
在一个方面,本发明涉及一种可由计算机实施的以断点为中心的鉴定染色体结构变异的方法,所述方法按顺序包括以下步骤:
(1) 将样本DNA文库经双端测序后所产生的成对读段比对到参考基因组上,获得读段比对结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海思路迪医学检验所有限公司,未经上海思路迪医学检验所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268544.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种石膏基泡沫混凝土及其制备方法
- 下一篇:一种家畜养殖粪污脱水分离设备