[发明专利]一种构建病原生物基因组数据库的方法及装置有效
| 申请号: | 202210743555.X | 申请日: | 2022-06-27 |
| 公开(公告)号: | CN115346608B | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 黄毅;杨振宇;刘久成;黄靖传;易鑫;杨玲 | 申请(专利权)人: | 北京吉因加科技有限公司;深圳吉因加医学检验实验室 |
| 主分类号: | G16B50/30 | 分类号: | G16B50/30;G06F16/21 |
| 代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 周建军;彭家恩 |
| 地址: | 102206 北京市昌平区回龙观镇生命园路8号院*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 病原 生物 基因组 数据库 方法 装置 | ||
一种构建病原生物基因组数据库的方法及装置,该方法包括:获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。该方法构建的数据库具有准确度高,分析时间短的优点。
技术领域
本发明涉及生物信息学领域,具体涉及一种构建病原生物基因组数据库的方法及装置。
背景技术
mNGS是一种可以应用于临床检测病原微生物的一项新技术,在不需要先验知识的情况下可以很好地检测罕见的、新的和共感染的病原体,并且在耐药性预测方面具有优势,从而为危重病或免疫缺陷患者的难诊断感染提供了新的诊断线索。而mNGS的微生物数据库是其技术核心之一,数据库直接影响了mNGS检测的物种数和准确度。
构建病原生物数据库中的数据大部分来自公共数据库,而公共数据库中每个物种都可能有多个组装版本或者菌株,并且公共数据库中对于细菌、病毒等类型的物种,增加新的组装版本和新菌株的速度非常快,以肺炎克雷伯菌为例,仅2021年就增加了4732个肺炎克雷伯菌的基因组,占总数的16.5%。所以如何构建一个全面、时效性高的病原生物数据库是一个很大的难题。
发明内容
根据第一方面,一种实施例中提供一种构建病原生物基因组数据库的方法,包括:
获取基因组数据步骤,包括从数据库获取选定的病原生物的基因组数据;
同源区域屏蔽步骤,包括对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;
融合基因组构建步骤,包括对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;
组库步骤,包括重复所述获取基因组数据步骤、同源区域屏蔽步骤、融合基因组构建步骤,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。
根据第二方面,在一实施例中,提供第一方面任意一项的方法构建得到的数据库。
根据第三方面,在一实施例中,提供一种构建病原生物基因组数据库的装置,包括:
获取基因组数据模块,用于从数据库获取选定的病原生物的基因组数据;
同源区域屏蔽模块,用于对基因组数据进行质粒同源区域屏蔽、宿主源同源区域屏蔽,获得屏蔽同源区域后的基因组数据;
融合基因组构建模块,用于对屏蔽同源区域序列后的基因组数据中的各个基因组构建融合基因组;
组库模块,用于重复所述获取基因组数据模块、同源区域屏蔽模块、融合基因组构建模块的方法,遍历所选定的所有病原生物的基因组数据,汇总所有融合基因组,得到病原生物基因组数据库。
根据第四方面,在一实施例中,提供一种构建生物基因组数据库的装置,包括:
存储器,用于存储程序;
处理器,用于通过执行所述存储器存储的程序以实现如第一方面任意一项的方法。
根据第五方面,在一实施例中,提供一种计算机可读存储介质,所述介质上存储有程序,所述程序能够被处理器执行以实现如第一方面任意一项的方法。
依据上述实施例的一种构建病原生物基因组数据库的方法及装置,该方法构建的数据库具有准确度高,分析时间短的优点。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京吉因加科技有限公司;深圳吉因加医学检验实验室,未经北京吉因加科技有限公司;深圳吉因加医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210743555.X/2.html,转载请声明来源钻瓜专利网。





