[发明专利]变异检测方法及装置、存储介质及电子设备有效
申请号: | 201911192425.6 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110648718B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 刘兵;张凯 | 申请(专利权)人: | 南京医基云医疗数据研究院有限公司 |
主分类号: | G16B5/20 | 分类号: | G16B5/20;G16B20/20;G16B30/10 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 210000 江苏省南京市江北新区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 变异 检测 方法 装置 存储 介质 电子设备 | ||
本公开涉及数据处理技术领域,具体涉及一种变异检测方法及装置、计算机可读存储介质及电子设备,所述方法包括:将基础数据加入于概率计算队列;获取概率计算队列中的一组基础数据组,以并行的方式基于基础数据组中各基础数据计算各激活区域内的各待测序片段是单倍型的概率值,并将基础数据和对应的概率值加入概率输出队列;获取概率输出队列中的基础数据和对应的概率值,根据基础数据和概率值计算所述激活区域中的变异信息。本公开实施例的技术方案能够通过并行的方式同时获取并计算多个基础数据对应的概率值,避免依次计算概率值导致的概率值计算速度低的问题,进而加快变异检测的速度。
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种变异检测方法及装置、计算机可读存储介质及电子设备。
背景技术
在治疗疾病的过程中往往会出现相同用药,效果差异较大的情况,这种情况的出现很大程度上是由于个体之间的遗传基因不同。为了能够更好的针对不同个体进行治疗,研究者不断研究如何在大量的遗传数据中进行变异检测。
变异检测是指通过高通量测序手段检测物种个体或群体水平上的遗传变异信息。GATK(Genome Analysis ToolKit) HaplotypeCaller工具作为一种常用的变异检测工具,能够减少由于排序错误导致的假阳性,因此具有准确率较高的优点。然而,在样品较多时,由于需要针对每个激活区域逐个进行计算,因此导致变异检测的速度较慢,效率较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种变异检测方法及装置、计算机可读存储介质及电子设备,进而至少在一定程度上克服变异检测的速度较慢,效率较低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供了一种变异检测方法,包括:
将基础数据加入于概率计算队列;其中,所述基础数据包括一个激活区域内的待测序片段和单倍型;
获取概率计算队列中的一组基础数据组,以并行的方式基于所述基础数据组中各所述基础数据计算各所述激活区域内的各所述待测序片段是所述单倍型的概率值,并将所述基础数据和对应的概率值加入概率输出队列;
获取所述概率输出队列中的所述基础数据和对应的概率值,根据所述基础数据和所述概率值计算所述激活区域中的变异信息。
在本公开的一种示例性实施例中,基于前述方案,在所述将基础数据加入于概率计算队列之前,所述方法还包括:
根据待测序片段和预设遗传数据生成至少一个所述基础数据。
在本公开的一种示例性实施例中,基于前述方案,所述根据待测序片段和预设遗传数据生成至少一个所述基础数据,包括:
将所述待测序片段和所述预设遗传数据进行比对以获取比对数据,根据所述比对数据识别至少一个所述激活区域;
根据各所述激活区域内的所述待测序片段和所述预设遗传数据确定各所述激活区域内的所述单倍型;
根据各所述激活区域内的待测序片段和单倍型生成基础数据。
在本公开的一种示例性实施例中,基于前述方案,所述根据各所述激活区域内的所述待测序片段和所述预设遗传数据确定各所述激活区域内的所述单倍型,包括:
对各所述激活区域内的所述待测序片段和所述预设遗传数据进行局部组装,根据所述局部组装的结果确定所述激活区域内的所述单倍型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医基云医疗数据研究院有限公司,未经南京医基云医疗数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911192425.6/2.html,转载请声明来源钻瓜专利网。