[发明专利]DNA序列的处理方法及设备有效
申请号: | 201610330331.0 | 申请日: | 2016-05-18 |
公开(公告)号: | CN107403076B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 邓利群;魏建生;张军 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 冯艳莲 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | dna 序列 处理 方法 设备 | ||
1.一种DNA序列的处理方法,其特征在于,所述方法用于对脱氧核糖核酸DNA样本的N个Read集合进行处理,其中,每个所述Read集合中包括由对应的测序文库对所述DNA样本测序得到的序列片段Read,N为大于1的正整数,所述方法包括:
对每个所述Read集合分别并行执行以下操作:
根据染色体的参考序列对Read集合中的每个Read进行比对计算,得到每个所述Read相对所述参考序列的比对结果记录;
根据所述比对结果记录确定每个所述Read所处的染色体区域;所述染色体包括至少一个所述染色体区域;
将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件;
其中,用于与每个所述Read集合进行比对计算的染色体的参考序列相同,且所述染色体包括的染色体区域相同,在对每个所述Read集合执行完上述操作后,每个所述染色体区域分别对应N个所述中间结果文件;
根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件;
对每个所述染色体区域的目标序列文件进行变异检测,确定每个所述染色体区域的变异点信息;
其中,根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件,包括:对每个所述染色体区域对应的N个中间结果文件,进行合并生成所述的目标序列文件。
2.根据权利要求1所述的方法,其特征在于,在对每个所述Read集合分别并行执行所述操作之前,还包括:
将每个所述Read集合分别独立存储到分布式存储系统中。
3.根据权利要求2所述的方法,其特征在于,所述将每个所述Read集合分别独立存储到分布式存储系统中,包括:
将每个所述Read集合划分为至少一个数据块进行存储;
所述根据染色体的参考序列对Read集合中的每个Read进行比对计算,包括:
针对每个所述Read对应的数据块,并行执行与所述参考序列的比对计算。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述比对结果记录包括每个所述Read所处染色体的标识以及所述Read在所述染色体上的位置信息,所述根据所述比对结果记录确定每个所述Read所处的染色体区域,包括:
根据所述染色体的标识以及所述位置信息确定每个所述Read在所述染色体上的染色体区域。
5.根据权利要求4所述的方法,其特征在于,所述将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件,包括:
对处于同一染色体区域的所述Read的比对结果记录进行至少包括排序和去重的操作,得到所述中间结果文件。
6.一种计算设备,其特征在于,所述计算设备用于对脱氧核糖核酸DNA样本的N个Read集合进行处理,其中,每个所述Read集合中包括由对应的测序文库对所述DNA样本测序得到的序列片段Read,N为大于1的正整数,所述计算设备包括:
回帖处理单元,对每个所述Read集合分别并行执行以下操作:
根据染色体的参考序列对Read集合中的每个Read进行比对计算,得到每个所述Read相对所述参考序列的比对结果记录;
根据所述比对结果记录确定每个所述Read所处的染色体区域;所述染色体包括至少一个所述染色体区域;
将处于同一染色体区域的所述Read的比对结果记录合并成一个中间结果文件;
其中,用于与每个所述Read集合进行比对计算的染色体的参考序列相同,且所述染色体包括的染色体区域相同,在对每个所述Read集合执行完上述操作后,每个所述染色体区域分别对应N个所述中间结果文件;
合并单元,用于根据每个所述染色体区域分别对应的N个所述中间结果文件,确定每个所述染色体区域的目标序列文件;
变异检测单元,用于对每个所述染色体区域的目标序列文件进行变异检测,确定每个所述染色体区域的变异点信息;
其中,所述合并单元具体用于:对每个所述染色体区域对应的N个中间结果文件,进行合并生成所述的目标序列文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610330331.0/1.html,转载请声明来源钻瓜专利网。