[发明专利]DNA序列的处理方法及设备有效

专利信息
申请号: 201610330331.0 申请日: 2016-05-18
公开(公告)号: CN107403076B 公开(公告)日: 2020-06-02
发明(设计)人: 邓利群;魏建生;张军 申请(专利权)人: 华为技术有限公司
主分类号: G16B30/00 分类号: G16B30/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 冯艳莲
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: dna 序列 处理 方法 设备
【权利要求书】:

1.一种DNA序列的处理方法,其特征在于,所述方法用于对脱氧核糖核酸DNA样本的N个Read集合进行处理,其中,每个所述Read集合中包括由对应的测序文库对所述DNA样本测序得到的序列片段Read,N为大于1的正整数,所述方法包括:

对每个所述Read集合分别并行执行以下操作:

根据染色体的参考序列对Read集合中的每个Read进行比对计算,得到每个所述Read相对所述参考序列的比对结果记录;

根据所述比对结果记录确定每个所述Read所处的染色体区域;所述染色体包括至少一个所述染色体区域;

将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件;

其中,用于与每个所述Read集合进行比对计算的染色体的参考序列相同,且所述染色体包括的染色体区域相同,在对每个所述Read集合执行完上述操作后,每个所述染色体区域分别对应N个所述中间结果文件;

根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件;

对每个所述染色体区域的目标序列文件进行变异检测,确定每个所述染色体区域的变异点信息;

其中,根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件,包括:对每个所述染色体区域对应的N个中间结果文件,进行合并生成所述的目标序列文件。

2.根据权利要求1所述的方法,其特征在于,在对每个所述Read集合分别并行执行所述操作之前,还包括:

将每个所述Read集合分别独立存储到分布式存储系统中。

3.根据权利要求2所述的方法,其特征在于,所述将每个所述Read集合分别独立存储到分布式存储系统中,包括:

将每个所述Read集合划分为至少一个数据块进行存储;

所述根据染色体的参考序列对Read集合中的每个Read进行比对计算,包括:

针对每个所述Read对应的数据块,并行执行与所述参考序列的比对计算。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述比对结果记录包括每个所述Read所处染色体的标识以及所述Read在所述染色体上的位置信息,所述根据所述比对结果记录确定每个所述Read所处的染色体区域,包括:

根据所述染色体的标识以及所述位置信息确定每个所述Read在所述染色体上的染色体区域。

5.根据权利要求4所述的方法,其特征在于,所述将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件,包括:

对处于同一染色体区域的所述Read的比对结果记录进行至少包括排序和去重的操作,得到所述中间结果文件。

6.一种计算设备,其特征在于,所述计算设备用于对脱氧核糖核酸DNA样本的N个Read集合进行处理,其中,每个所述Read集合中包括由对应的测序文库对所述DNA样本测序得到的序列片段Read,N为大于1的正整数,所述计算设备包括:

回帖处理单元,对每个所述Read集合分别并行执行以下操作:

根据染色体的参考序列对Read集合中的每个Read进行比对计算,得到每个所述Read相对所述参考序列的比对结果记录;

根据所述比对结果记录确定每个所述Read所处的染色体区域;所述染色体包括至少一个所述染色体区域;

将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件;

其中,用于与每个所述Read集合进行比对计算的染色体的参考序列相同,且所述染色体包括的染色体区域相同,在对每个所述Read集合执行完上述操作后,每个所述染色体区域分别对应N个所述中间结果文件;

合并单元,用于根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件;

变异检测单元,用于对每个所述染色体区域的目标序列文件进行变异检测,确定每个所述染色体区域的变异点信息;

其中,所述合并单元具体用于:对每个所述染色体区域对应的N个中间结果文件,进行合并生成所述的目标序列文件。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610330331.0/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top