[发明专利]基于图神经网络的人体口服生物利用度预测方法在审
| 申请号: | 202210306054.5 | 申请日: | 2022-03-25 |
| 公开(公告)号: | CN114822718A | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 杨云;于明浩 | 申请(专利权)人: | 云南大学 |
| 主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70;G06N3/04 |
| 代理公司: | 昆明金科智诚知识产权代理事务所(普通合伙) 53216 | 代理人: | 杨钊霞 |
| 地址: | 650091 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 神经网络 人体 口服 生物 利用 预测 方法 | ||
1.基于图神经网络的人体口服生物利用度预测方法,其特征在于,包括初始原子、化学键特征抽取模块和图神经网络模块;
所述初始原子、化学键特征抽取模块,图神经网络需要将分子结构信息转化为分子图,需要定义原子和化学键的初始特征以供图神经网络使用,利用原子结构信息,构建原子邻接矩阵代表分子的拓扑结构;
所述图神经网络模块,图神经网络的前向传播包含两个步骤,包括消息传递和读出,消息传递需要进行多次以生成好的原子、化学键的隐藏表示,读出操作将原子、化学键的隐藏表示生成分子的隐藏表示,随后使用全连接网络进行预测,得到预测结果;
S1:消息传递,消息传递包括原子消息传递、化学键消息吸收、缩放自注意力三个阶段;
在原子消息传递阶段,分子图中的每个原子会吸收与其相连的原子和化学键的信息根据:
其中,和均为学习矩阵,dt和ct分别是在第t次更新中,原子状态向量和化学键状态向量的维度;dt+1是第t+1次更新中原子状态向量的维度;σ(·)是ReLU非线性激活函数;此过程用其周围邻居原子和与之相连的化学键的信息更新中心原子i自身信息;
在化学键消息吸收阶段,化学键会吸收与之相连的两个原子的信息用于更新其自身,根据:
其中,和均为学习矩阵,将与eij相连的两个原子的状态向量拼接;
通过原子消息传递和化学键消息吸收,使得原子的信息流向与其相连的原子和化学键,化学键也将吸收到周围原子信息,多次更新后,分子信息将流过所有原子和化学键,使得原子和化学键都具备其邻域的拓扑信息;
在缩放自注意力阶段,模型将聚焦于原子和化学键特征中,根据:
其中,Vt+1和Et+1分别为在第t次更新中,完成原子消息传递和化学键消息吸收时的原子和化学键的状态矩阵,和均为学习矩阵,为矩阵的哈达玛积(HadamardProduct),Wva1用于将原子状态矩阵中的信息嵌入到高维空间中,激活后,Wva2将信息提取出,再通过SoftMax(·)函数将数值转化为注意力权重,得到原子注意力权重向量,当直接使用此注意力权重向量与原子状态矩阵做哈达玛积,则会将所有特征的数值都缩小,即使是重要的特征,缩小幅度与dt+1的大小有关,dt+1越大,特征数值缩小的程度越大,将注意力权重向量放大dt+1倍,使得注意力权重向量的平均值放大到1,不受特征向量长度dt+1的影响,使模型更容易训练;
S2:读出,在读出阶段,使用多种读出函数同时处理原子和化学键,以获取到更好的分子隐藏表示,根据:
vall=Set2Set(VT)||Mean(VT)||Max(VT) (8)
eall=Set2Set(ET)||Mean(ET)||Max(ET) (9)
z=vall||eall (10)
其中,Mean(·)、Max(·)分别为全局平均池化和全局最大池化。
2.根据权利要求1所述的基于图神经网络的人体口服生物利用度预测方法,其特征在于:所述抽取原子初始特征包括原子类型、原子序数、芳香性、杂化方式特征作为原子表示;抽取化学键初始特征包括键类型、是否为共价键、立体异构类型特征作为化学键表示,。
3.根据权利要求1所述的基于图神经网络的人体口服生物利用度预测方法,其特征在于:所述S1中,嵌入矩阵和分别用于将原子和化学键的信息嵌入到隐空间中,该空间维度为h;降维矩阵用于将隐空间中的信息转化为下层图神经网络所需的维度,用于收集原子i自身信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210306054.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小龙虾头尾分离装置
- 下一篇:一种飞灰处理设备





