[发明专利]基于遗传算法集成深度学习网络的药物推荐系统、计算机设备、存储介质在审
| 申请号: | 202110752111.8 | 申请日: | 2021-06-30 |
| 公开(公告)号: | CN113488102A | 公开(公告)日: | 2021-10-08 |
| 发明(设计)人: | 宋弢;钟悦;田庆雨 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G16B15/30 | 分类号: | G16B15/30;G16C20/50;G16H50/70;G16H70/40;G06N3/04;G06N3/08;G06N3/12 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 遗传 算法 集成 深度 学习 网络 药物 推荐 系统 计算机 设备 存储 介质 | ||
本发明公开了一种基于遗传算法集成深度学习网络的药物推荐系统,属于药物重定位、深度学习、集成学习模型预测技术领域。该系统包括基于遗传算法集成深度学习网络,所述的基于遗传算法集成深度学习网络包括特征提取网络、遗传算法优化权重和全连接网络组成的序列处理模型。所述的基于遗传算法集成深度学习网络将药物分子SMILES序列和靶点蛋白FASTA序列输入特征提取网络进行充分的特征提取以获得特征向量,使用遗传算法为多个特征向量分配权重,将特征向量乘以各自权重后将其“拼接”一起形成拼接向量,将拼接向量和药物‑靶点结合亲和力真实值输入到全连接网络中进行回归分析,输出药物‑靶点结合亲和力预测值,将预测值排序,最终得到集成多种特征表示方式的针对特定靶点的药物分子推荐列表。
技术领域
本发明涉及遗传算法、深度学习模型预测技术领域,特别涉及基于遗传算法集成深度学习网络的药物推荐系统、计算机设备、存储介质。
背景技术
药物-靶点结合亲和力的预测是药物重定位的关键,将药物分子序列、靶点蛋白氨基酸序列和药物-靶点结合亲和力值输入到深度学习网络中训练,利用训练好的网络预测未知的药物-靶点结合亲和力值已经成为目前预测准确率最高的方法之一。
但是,每个深度学习模型的预测结果各不相同,不同的深度学习模型预测结果重合率较低,在选择药物分子进行生物实验验证时仍然面临过多的选择,有较高的失败率。因此,将多个深度学习网络进行集成,考虑不同网络对最终预测结果的影响,是解决这一现状的方法之一。
发明内容
本发明实施例提供了一种基于遗传算法集成深度学习网络的药物推荐系统、计算机设备、存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本发明实施例的第一方面,提供了基于遗传算法集成深度学习网络的药物推荐系统。
在实施例中,所述系统包括基于遗传算法集成深度学习网络,所述基于遗传算法集成深度学习网络模型包括特征提取网络、遗传算法优化权重和全连接网络,模型的输入为药物分子SMILES序列和靶点蛋白氨基酸序列,输出为药物-靶点的结合亲和力预测值。
可选的,所述的特征提取网络对药物分子SMILES序列和靶点蛋白氨基酸序列进行充分的特征提取,不断学习分子结构信息和靶点序列信息,其具体包括卷积神经网络和多层感知机。所述卷积神经网络用于提取药物分子和靶点蛋白序列信息,包括嵌入层、三个卷积层和一个最大池化层,输入是药物分子序列、靶点蛋白序列。首先,药物分子序列、靶点蛋白序列经嵌入层的标签编码和“独热”(one-hot)编码转化为二进制矩阵,之后,将矩阵输入卷积层学习其特征表示,最大池化层用于降维处理,输出为药物分子、靶点蛋白的特征向量。所述多层感知机用于处理药物分子序列信息,包括嵌入层和四层深度神经网络,药物分子序列经嵌入层转化为分子指纹,将分子指纹输入到深度神经网络中学习其特征表示,输出为药物分子的特征向量。
可选的,所述的遗传算法优化权重为每个深度学习网络得到的特征向量分配权重,并将乘以各自权重的特征向量“拼接”一起,其具体包括遗传算法。所述遗传算法用于优化特征向量的权重,使得特征向量乘以各自的权重后,以最优比例考虑不同因素对结果的影响,预测更准确。
可选的,所述的全连接网络对拼接向量进行非线性处理,并进行药物-靶点结合亲和力的预测,其具体包括全连接层。所述全连接层将拼接向量输入三个dropout率为0.1的全连接层进行非线性处理,dropout用于防止模型过拟合,输出为药物-靶点的结合亲和力预测值。
可选的,所述系统的输入为药物分子SMILES序列和靶点蛋白序列。
可选的,对所述的基于遗传算法集成深度学习网络利用Davis数据集进行训练,并获得了完善的模型参数。
根据本发明实施的第二方面,提供一种计算机设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110752111.8/2.html,转载请声明来源钻瓜专利网。





