[发明专利]测序读段的DENOVO组装的方法、系统和过程在审
申请号: | 201580054801.9 | 申请日: | 2015-10-09 |
公开(公告)号: | CN106795568A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | K·康维卡;K·雅各布斯 | 申请(专利权)人: | 因维蒂公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;C12N1/15 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测序读段 denovo 组装 方法 系统 过程 | ||
相关专利申请
本申请要求于2014年10月10日提交的题目为“METHODS,SYSTEMS AND PROCESSES OF DE NOVO ASSEMBLY OF SEQUENCING READS”的临时专利申请号62/062636的权益,其发明人为Karel Knovicka和Kevin Jacobs,并且其由代理档案号055911-0432229指定。包括所有文本、表格和附图的在先专利申请的全部内容通过引用并入本文。
技术领域
本技术涉及核酸操作、分析和高通量测序的方法和过程。
背景技术
生物体(例如,动物、植物、微生物、病毒)的遗传信息被编码在脱氧核糖核酸(DNA)或核糖核酸(RNA)中。遗传信息是表示核酸的一级结构的核苷酸或修饰的核苷酸序列。生物体的核酸含量(例如,DNA)通常被称为基因组。在人体中,完整的基因组通常包括位于二十四条染色体上的大约30,000个基因。大部分基因编码特定的蛋白质,其经由转录和翻译的表达后实现活细胞内的一个或多个生物化学功能。
许多医学病症由基因组内的一个或多个遗传变异引起。一些遗传变异可能使个人容易感染、或导致诸如例如糖尿病、动脉硬化、肥胖症、各种自身免疫性疾病和癌症(例如,结肠直肠癌、乳腺癌、卵巢癌、肺癌)的多种疾病。这种遗传性疾病可以由基因组内的一个或多个核苷酸的添加、取代、插入或缺失引起。
通过分析核酸可以标识遗传变异。基因组的核酸可以通过各种方法(包括例如涉及大规模并行测序的方法)来分析。大规模并行测序方法通常生成数千、数百万甚至数十亿的小测序读段。为了确定基因序列,每个读段通常被映射到参考基因组,同时读段集合被组装成个体基因组或其部分的序列表示。读段的映射和组装过程由一个或多个计算机(例如,硬件微处理器(即,微处理器)和存储器)执行,并由人类双手创建的指令(例如,软件指令和/或算法)集合驱动。当对象的基因组中遇到遗传变异时,这样的映射和组装过程通常失败。现有的软件和程序不正确地映射读段、不能映射读段或不能正确地组装包括遗传变异的基因组的区域。本文的方法、系统和过程提供了对当前核酸分析技术的显著进步和改进。
发明内容
本文提供的一些方面是分析核酸文库的方法,核酸文库包括具有存储在其上的可执行程序的非暂态计算机可读存储介质,该程序被配置为指示微处理器:(a)获得包括多个读段配对物对的双端序列读段的集合,每个对包括两个读段配对物,其中每个对中的两个读段配对物的至少一个被映射到参考基因组的至少一部分,参考基因组包括预先选择的感兴趣的基因组区域,并且其中双端序列读段中的一些没有被映射到参考基因组的该至少一部分,(b)确定序列读段的集合的堆积关系,(c)根据(b)中确定的堆积关系,构建一个或多个重叠群,包括迭代地将至少一个核苷酸添加到一个或多个起始读段的位置3'或5'中,其中位置(例如,前进位置)包括多数共有核苷酸,(d)根据桥接两个或多个重叠群的一个或多个读段配对物对,组装一个或多个超重叠群,(e)根据一个或多个超重叠群,生成基因型似然比,以及(f)根据(e)中生成的基因型似然比,确定遗传变异的存在或不存在。
在某些方面,堆积关系包括集合中的两个或多个读段之间的多个重叠,其中多个重叠中的每一个根据以下项目选择:(i)包括第一重叠的集合的第一读段,第一重叠具有集合的第二读段,(ii)包括大于预定比对得分阈值的比对得分的第一重叠,(iii)第二读段扩展一个或多个核苷酸并经过第一读段的3'端或5'端,以及(iv)第一重叠包括满足(i)、(ii)和(iii)的、所有可能的第一重叠中的最高比对得分。在一些方面,堆积关系包括第二读段,第二读段包括第二重叠,第二重叠具有集合的第三读段,其中(i)第二读段包括第一重叠,(ii)第二重叠包括大于预定比对得分阈值的比对得分,(iii)第三读段扩展一个或多个核苷酸并经过第二读段的3'端或5'端,以及第二读段和第三读段以同样的3'或5'方向扩展第一读段,以及(iv)第二重叠包括满足(i)、(ii)和(iii)的、所有可能的第二重叠中的最高比对得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因维蒂公司,未经因维蒂公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580054801.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可持续提供多种弯矩的抗弯加载装置
- 下一篇:一种岩石直剪及点荷载试验装置