[发明专利]DNA序列的处理方法及设备有效

专利信息
申请号: 201610330331.0 申请日: 2016-05-18
公开(公告)号: CN107403076B 公开(公告)日: 2020-06-02
发明(设计)人: 邓利群;魏建生;张军 申请(专利权)人: 华为技术有限公司
主分类号: G16B30/00 分类号: G16B30/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 冯艳莲
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: dna 序列 处理 方法 设备
【说明书】:

一种DNA序列的处理方法及设备,用以解决现有技术对DNA样本进行变异检测的效率低下的问题。包括:对每个Read集合分别并行执行以下操作:根据染色体的参考序列对Read集合中的每个Read进行比对计算,得到每个Read相对该参考序列的比对结果记录;根据该比对结果记录确定每个Read所处的染色体区域;将处于同一染色体区域的Read的比对结果记录合并成一个中间结果文件;在对N个Read集合分别执行完上述操作后,每个染色体区域分别对应N个中间结果文件;根据每个染色体区域分别对应的N个中间结果文件,确定每个染色体区域的目标序列文件;根据每个该染色体区域的目标序列文件确定每个染色体区域的变异点信息。

技术领域

发明涉及基因工程领域,尤其涉及一种DNA序列的处理方法及设备。

背景技术

基因是DNA(Deoxyribonucleic acid,脱氧核糖核酸)分子上携带有遗传信息的功能片段,基因支持着生命的基本构造和性能,DNA分子不一定都是基因。现有技术对于DNA样本已经有了一套成熟的处理流程,该流程通常由DNA测序、DNA序列定序、基因定位和变异检测三个步骤组成。

其中,DNA测序是指利用DNA测序仪将生物样本的DNA提取并转换成计算机能识别的数据序列Read,具体地,通过化学方法将DNA序列中的由A、C、T和G四种碱基链接而成的碱基序列识别出来,继而转换成由A、C、T、G四个字符组成的计算机可识别的字符串序列,一个Read即为一个长度固定的DNA片段,是后续DNA序列处理的基本单位。例如,一个Read的长度为10BP(Base Pair,碱基对),则读出的数据序列ATCTGTCCTA即为一个Read。

DNA测序的结果是生成一大堆的DNA Read,但是这些Read之间顺序未知。DNA序列的定序的作用就是将这些无序的DNA Read一一同公认的DNA参考序列进行回贴(即比对计算),以得到各Read在参考序列中的最佳匹配位置。

基因定位及变异检测是利用数据库预存的基因信息,确定该DNA序列中的各基因,并计算它们相对于数据库基因模板的变异点以及变异程度。

现有技术中存在多种不同的测序仪,不同测序仪的测序文库可能不同,测序文库可以理解成是一类化学培养试剂,用于帮助测序仪从生物样本中提取和识别DNA,不同的化学培养试剂对于DNA中各碱基的识别精度不同。现有的DNA序列处理流程从DNA序列定序到基因变异检测都是每次只针对一个测序文库的Read集合进行处理,其效率低下。

发明内容

本发明的目的是提供一种DNA序列的处理方法及设备,用以解决现有技术中对DNA样本进行的基因变异检测的效率低下的问题。

为了达到上述目的,本发明采用如下的技术方案:

第一方面,提供一种DNA序列的处理方法,所述方法用于对脱氧核糖核酸DNA样本的N个Read集合进行处理,其中,每个所述Read集合中包括由对应的测序文库对所述DNA样本测序得到的序列片段Read,N为大于1的正整数,所述方法包括:对每个所述Read集合分别并行执行以下操作:根据染色体的参考序列对Read集合中的每个Read进行比对计算,得到每个所述Read相对所述参考序列的比对结果记录;根据所述比对结果记录确定每个所述Read所处的染色体区域;所述染色体包括至少一个所述染色体区域;将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件;其中,用于与每个所述Read集合进行比对计算的染色体的参考序列相同,且所述染色体包括的染色体区域相同,在对每个所述Read集合执行完上述操作后,每个所述染色体区域分别对应N个所述中间结果文件;进一步地,根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件;对每个所述染色体区域的目标序列文件进行变异检测,确定每个所述染色体区域的变异点信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610330331.0/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top