[发明专利]一种病毒亚型识别方法、装置、电子设备及存储介质有效
申请号: | 201911146286.3 | 申请日: | 2019-11-19 |
公开(公告)号: | CN111048151B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 李鹏;刘宇奇;宋宏彬 | 申请(专利权)人: | 中国人民解放军疾病预防控制中心 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G16B50/30;G06N3/0464;G06N3/048;G06N3/084;G06F18/2415 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张磊 |
地址: | 100071 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 病毒 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供一种病毒亚型识别方法、装置、电子设备及存储介质,方法包括:对待识别病毒的至少一基因序列进行拆分处理,得到至少一基因序列中每个基因序列对应的目标基因序列;利用预设的基因向量库对目标基因序列进行索引,得到至少一基因序列中每个基因序列对应的序列向量;将所有序列向量输入预设的病毒分类神经网络模型,根据病毒分类神经网络模型的输出结果确定待识别病毒的亚型。通过对病毒基因进行拆分处理来增加基因序列的特征有效性,利用向量序列来表征基因序列可以降低亚型识别过程的误差率,使用病毒分类神经网络模型对序列向量进行识别,可以更加准确地得到待识别病毒的亚型,并且根据病毒的亚型对该病毒进行针对性的防护。
技术领域
本申请涉及生物基因领域,具体而言,涉及一种病毒亚型识别方法、装置、电子设备及存储介质。
背景技术
流感是由流感病毒引起的人畜共患急性呼吸道传染病,每年在全球范围内造成25~50万人死亡,其中威胁最大的是甲型流感,病毒具有变异快、宿主种类丰富等特点,且常出现跨宿主传播,难以有效预防。而病毒根据血凝素(Hemagglutinin,HA)和神经氨酸酶(Neuraminidase,NA)抗原特性的不同,可分为多种亚型,不同亚型的病毒具有不同的致病性和传染性,部分亚型对公共健康构成了巨大威胁。
而现有的病毒识别方法是通过采用特异性抗体对病毒的抗原进行检测,而由于特异性抗体的特殊性,传统的病毒识别方法难以准确地确定新的病毒变异体的亚型。
发明内容
本申请实施例的目的在于提供一种病毒亚型识别方法、装置、电子设备及存储介质,以改善传统的病毒识别方法检测病毒的亚型不够准确的问题。
第一方面,本申请实施例提供了一种病毒亚型识别方法,包括:对待识别病毒的至少一基因序列进行拆分处理,得到所述至少一基因序列中每个基因序列对应的目标基因序列;利用预设的基因向量库对所述目标基因序列进行索引,得到所述至少一基因序列中每个基因序列对应的序列向量;将所有序列向量输入预设的病毒分类神经网络模型,根据所述病毒分类神经网络模型的输出结果确定所述待识别病毒的亚型。
本申请实施例通过对病毒基因进行拆分处理来增加基因序列的特征有效性,利用向量序列来表征基因序列可以降低亚型识别过程的误差率,使用病毒分类神经网络模型对序列向量进行识别,由此可以更加准确地得到待识别病毒的亚型,并且根据病毒的亚型对该病毒进行针对性的防护。
进一步地,所述对待识别病毒的至少一基因序列进行拆分处理,得到所述至少一基因序列中每个基因序列对应的目标基因序列,包括:获取所述待识别病毒的至少一基因序列;根据三联碱基将每个基因序列拆分,得到每个基因序列对应的预设数目的目标基因序列。
本申请实施例根据三联碱基将基因序列拆分成预设数目的目标基因序列,来增加基因序列的特征的有效性,使得后续可以更加准确地利用序列向量表征基因序列。
进一步地,所述预设数目的目标基因序列包括第一目标基因序列、第二目标基因序列和第三目标基因序列;所述根据三联碱基将每个基因序列拆分,得到每个基因序列对应的预设数目的目标基因序列,包括:从每个基因序列的第一个碱基、第二个碱基和第三个碱基开始,以三联碱基为单位,将每个基因序列拆分成对应的第一目标基因序列、第二目标基因序列和第三目标基因序列。
本申请实施例通过从基因序列的第一个碱基、第二个碱基和第三个碱基开始将基因序列拆分成三条目标基因序列,来增加基因序列的特征的有效性,使得后续可以更加准确地利用序列向量表征基因序列。
进一步地,所述利用预设的基因向量库对所述目标基因序列进行索引,得到所述至少一基因序列中每个基因序列对应的序列向量,包括:利用所述基因向量库对每个基因序列对应的各目标基因序列分别进行索引,得到各目标基因序列对应的序列矩阵,所述序列矩阵包括多个子序列向量;分别将各序列矩阵中的多个子序列向量对应进行加和平均,得到各目标基因序列对应的目标序列向量;将每个基因序列对应的所有目标序列向量进行加和平均,得到每个基因序列对应的序列向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军疾病预防控制中心,未经中国人民解放军疾病预防控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911146286.3/2.html,转载请声明来源钻瓜专利网。