[发明专利]基于数据增强与多级信息最大化的图关系数据的分类方法在审

专利信息
申请号: 202310002337.5 申请日: 2023-01-03
公开(公告)号: CN115938504A 公开(公告)日: 2023-04-07
发明(设计)人: 张瀚;赵青青;何孟遥;全雄文 申请(专利权)人: 南开大学
主分类号: G16C20/40 分类号: G16C20/40;G16C20/30;G16C20/70;G06F18/24;G06N3/0464;G06N3/047;G06N3/048;G06N3/09
代理公司: 北京细软智谷知识产权代理有限责任公司 11471 代理人: 梁亚静
地址: 300110*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 增强 多级 信息 最大化 关系 分类 方法
【权利要求书】:

1.一种基于数据增强与多级信息最大化的图关系数据的分类模型训练方法,其特征在于,包括:

确定数据集,以所述数据集中每个样本的基本单元为节点,以符合预设关系的基本单元之间的预设关系为边,构建每个样本的结构图;

按照预设比例随机去除所述结构图的部分边后,将剩余图作为增强结构图,所述结构图和所述增强结构图构成双视图;

对于每个视图,分别使用全连接神经网络和图卷积神经网络对全图关系数据进行学习,得到每个视图的节点特征信息和拓扑信息;

融合所述拓扑信息和特征信息,并获取对应视图的局部表示和全局表示;

考虑结构图和增强结构图的全局表示和局部表示之间的约束,基于多级信息最大化规则,得到损失函数;

将图卷积神经网络中每层的表示进行相加,并将相加后的表示输入分类器,输出所述结构图的分类结果;

根据所述分类结果和标签计算交叉熵分类损失函数,其中,所述标签为根据结构图的分类预先标注;根据所述交叉熵分类损失函数对模型进行监督训练,当所述交叉熵分类损失函数稳定时,得到训练好的目标模型。

2.根据权利要求1所述的方法,其特征在于,所述数据集包括化合物集,所述基本单元包括预设原子组;以所述化合物中的预设原子组为节点,以两个预设原子组为边,构建每个化合物的结构图;其中,所述预设原子组中包括至少一个原子;或,

所述数据集包括对象实体集,所述基本单元包括事物;以所述事物为节点,以两个事物之间的关系为边,构建每个对象实体的结构图。

3.根据权利要求2所述的方法,其特征在于,所述化合物包括高分子化合物和普通化合物,其中,所述普通化合物为非高分子化合物;所述高分子化合物包括蛋白质和非蛋白质高分子化合物。

4.根据权利要求3所述的方法,其特征在于,当所述高分子化合物为蛋白质时,所述预设原子组为氨基酸,以蛋白质中的氨基酸作为节点,以空间距离小于或等于预设距离阈值的两个氨基酸为边,构建蛋白质结构图;或,

当所述化合物为非蛋白质高分子化合物时,所述预设原子组为类氨基酸,以所述非蛋白质中的类氨基酸作为节点,以空间距离小于等于预设距离阈值的两个类氨基酸为边,构建非蛋白质高分子化合物结构图;或,

当所述化合物为普通化合物时,以所述普通化合物中的原子作为节点,以两个原子之间的键作为边,构建普通化合物结构图。

5.根据权利要求1所述的方法,其特征在于,所述对于每个视图,分别使用全连接神经网络和图卷积神经网络对全图关系数据进行学习,得到每个视图的节点特征信息和拓扑信息,包括:

通过全连接神经网络对于每个视图的全图关系数据进行学习,得到对应视图的节点特征信息;以及,通过图卷积神经网络对每个视图的全图关系数据进行学习,得到对应视图的拓扑信息。

6.根据权利要求1所述的方法,其特征在于,所述融合所述拓扑信息和特征信息,并获取对应视图的局部表示和全局表示,包括:

融合所述拓扑信息和所述特征信息,得到自注意力得分;

根据所述自注意力得分筛选出对应视图中的重要节点,确定对应视图的局部表示;

通过最大池化层和平局池化层相加的方式,得到对应视图的全局表示。

7.根据权利要求1所述的方法,其特征在于,所述考虑结构图和增强结构图的全局表示和局部表示之间的约束,基于多级信息最大化规则,得到损失函数,包括:

考虑结构图的局部表示与增强结构图的局部表示之间的约束,基于信息最大化规则,得到第一损失函数;

考虑结构图的全局表示与增强结构图的局部表示之间的约束,基于信息最大化规则,得到第二损失函数;

考虑结构图的全局表示与增强结构图的全局表示之间的约束,基于信息最大化规则,得到第三损失函数;

根据所述第一损失函数、第二损失函数、第三损失函数以及对应的系数,以求和的方式得到所述损失函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310002337.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top