[发明专利]基因组序列中潜在BGC的预测方法、装置、设备及介质有效
申请号: | 202110888145.X | 申请日: | 2021-08-03 |
公开(公告)号: | CN113764034B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 杨子翊;廖奔犇;张胜誉;梁恒宇;幸志伟 | 申请(专利权)人: | 腾讯科技(深圳)有限公司;河南省健康元生物医药研究院有限公司 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B15/30;G16B30/10;G16B40/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 序列 潜在 bgc 预测 方法 装置 设备 介质 | ||
本申请公开了一种基因组序列中潜在BGC的预测方法、装置、设备及介质,涉及人工智能领域。方法包括:对基因组序列中的各个基因进行结构域预测,得到各个基因中包含的Pfam结构域;确定各个Pfam结构域的Pfam得分,Pfam得分用于表征Pfam结构域属于BGC的概率;基于各个Pfam结构域的Pfam得分,确定基因组序列中的候选BGC;对候选BGC进行BGC类别预测,并基于类别预测结果确定候选BGC中的潜在BGC。本申请实施例采用双重串行预测机制,先根据Pfam得分实现BGC的一级过滤,然后在一级过滤结果的基础上通过类别预测实现BGC的二级过滤,有助于降低BGC预测结果的假阳率。
技术领域
本申请实施例涉及人工智能领域,特别涉及一种基因组序列中潜在BGC的预测方法、装置、设备及介质。
背景技术
生物合成基因簇(Biosynthetic Gene Clusters,BGC)是指具有生物合成功能的一组基因,能够编码合成次级代谢产物(小分子化合物),而微生物的次级代谢产物则是药物开发的重要源泉。
相关技术中,药物研发人员采用机器学习方法对细菌或真菌的基因组序列进行检测,以此发掘与新颖结构的小分子化合物相关的潜在BGC。后续研发过程中,即可基于发掘出的潜在BGC进行针对性实验。
然而,目前利用机器学习方法进行BGC预测时,BGC预测结果的假阳率较高,即BGC预测结果中包含大量非BGC,不利于后续药物研发。
发明内容
本申请实施例提供了一种基因组序列中潜在BGC的预测方法、装置、设备及介质,能够降低BGC预测的假阳率,提高BGC预测的准确性。所述技术方案如下:
一方面,本申请实施例提供了一种基因组序列中潜在BGC的预测方法,所述方法包括:
对基因组序列中的各个基因进行结构域预测,得到各个基因中包含的蛋白质家族数据库(Proteinfamily,Pfam)结构域;
确定各个所述Pfam结构域的Pfam得分,所述Pfam得分用于表征所述Pfam结构域属于BGC的概率;
基于各个所述Pfam结构域的所述Pfam得分,确定所述基因组序列中的候选BGC,所述候选BGC由至少一个基因构成;
对所述候选BGC进行BGC类别预测,并基于类别预测结果确定所述候选BGC中的潜在BGC。
另一方面,本申请实施例提供了一种基因组序列中潜在BGC的预测装置,所述装置包括:
第一预测模块,用于对基因组序列中的各个基因进行结构域预测,得到各个基因中包含的Pfam结构域;
评分模块,用于确定各个所述Pfam结构域的Pfam得分,所述Pfam得分用于表征所述Pfam结构域属于BGC的概率;
第一确定模块,用于基于各个所述Pfam结构域的所述Pfam得分,确定所述基因组序列中的候选BGC,所述候选BGC由至少一个基因构成;
第二确定模块,用于对所述候选BGC进行BGC类别预测,并基于类别预测结果确定所述候选BGC中的潜在BGC。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述方面所述的基因组序列中潜在BGC的预测方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述方面所述的基因组序列中潜在BGC的预测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司;河南省健康元生物医药研究院有限公司,未经腾讯科技(深圳)有限公司;河南省健康元生物医药研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110888145.X/2.html,转载请声明来源钻瓜专利网。