[发明专利]基于自监督学习的药物小分子性质预测方法、装置及设备有效
申请号: | 202111005170.5 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113707235B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 王俊 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/20;G16C20/70;G06N3/0464;G06N3/0895 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 刘敏 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 药物 分子 性质 预测 方法 装置 设备 | ||
1.一种基于自监督学习的药物小分子性质预测方法,其特征在于,包括:
依据目标药物小分子的化学分子结构生成分子图结构,其中,所述分子图结构中携带有邻接矩阵以及属性信息,所述属性信息包含节点初始特征向量和边初始特征向量,所述节点初始特征向量和所述边初始特征向量是依据预设向量生成规则确定的;
将所述分子图结构和所述邻接矩阵、所述属性信息输入目标图神经网络模型,获取所述分子图结构中各个节点的节点隐向量;利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量;
提取所述目标药物小分子对应的第一分子线性输入规范数据,以及与所述目标药物小分子不同化学分子结构的药物小分子对应的第二分子线性输入规范数据,并利用预设语言模型确定所述第一分子线性输入规范数据对应的第二特征向量以及所述第二分子线性输入规范数据对应的第三特征向量;
利用所述第一特征向量、所述第二特征向量和所述第三特征向量计算对比损失函数;依据所述对比损失函数调整所述目标图神经网络模型的模型参数,直至所述目标图神经网络模型输出所述目标药物小分子对应的目标特征向量和所述第二特征向量的特征距离小于第一预设距离阈值且所述目标特征向量和任一所述第三特征向量的特征距离大于第二预设距离阈值;
将所述目标特征向量输入训练完成的性质预测模型中,确定所述目标药物小分子的性质预测结果。
2.根据权利要求1所述的方法,其特征在于,所述利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量,包括:
计算所述节点隐向量的隐向量平均值,将所述隐向量平均值确定为所述目标药物小分子的第一特征向量;或,
在所述节点隐向量提取对应隐向量值最大的第一节点隐向量,将所述第一节点隐向量确定为所述第一特征向量。
3.根据权利要求1所述的方法,其特征在于,所述提取所述目标药物小分子对应的第一分子线性输入规范数据,以及与所述目标药物小分子不同化学分子结构的药物小分子对应的第二分子线性输入规范数据,包括:
按照预设药物小分子标识,在分子线性输入规范数据库中提取与所述目标药物小分子匹配的第一分子线性输入规范数据以及预设数量个与所述目标药物小分子不同化学分子结构的药物小分子对应的第二分子线性输入规范数据,其中,所述第一分子线性输入规范数据和所述第二分子线性输入规范数据是预先基于分子线性输入规范生成并存储至所述分子线性输入规范数据库中的。
4.根据权利要求1所述的方法,其特征在于,在所述利用预设语言模型确定所述第一分子线性输入规范数据对应的第二特征向量以及所述第二分子线性输入规范数据对应的第三特征向量之前,包括:
获取样本分子线性输入规范数据,以及相应的样本特征向量;
对所述样本分子线性输入规范数据随机进行部分数据遮盖后,输入初始BERT模型,以输出训练结果;
计算所述训练结果与所述样本特征向量的损失值;
若所述损失值达到模型收敛要求,则将所述初始BERT模型确定为所述预设语言模型;
若否,则更新所述初始BERT模型的模型参数,并对更新后的初始BERT模型进行迭代训练,直至所述损失值符合模型收敛要求。
5.根据权利要求1所述的方法,其特征在于,在利用目标图神经网络模型确定所述分子图结构对应的第一特征向量之前,还包括:
获取未标记图数据集和第一标记图数据集,所述第一标记图数据集的训练任务与预设性质预测任务不同;
将所述未标记图数据集作为训练样本,通过对预设的图神经网络模型进行训练,调整所述图神经网络模型的参数,得到第一图神经网络模型;
将所述第一标记图数据集作为训练样本,通过对所述第一图神经网络模型进行训练,调整所述第一图神经网络模型的参数,得到第二图神经网络模型;
将所述预设性质预测任务对应的第二标记图数据集作为训练样本,通过对所述第二图神经网络模型进行训练,调整所述第二图神经网络模型的参数,得到目标图神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111005170.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及显示面板
- 下一篇:一种通信网时延监测系统及方法