[发明专利]基于数据增强与多级信息最大化的图关系数据的分类方法在审
申请号: | 202310002337.5 | 申请日: | 2023-01-03 |
公开(公告)号: | CN115938504A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张瀚;赵青青;何孟遥;全雄文 | 申请(专利权)人: | 南开大学 |
主分类号: | G16C20/40 | 分类号: | G16C20/40;G16C20/30;G16C20/70;G06F18/24;G06N3/0464;G06N3/047;G06N3/048;G06N3/09 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 梁亚静 |
地址: | 300110*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 增强 多级 信息 最大化 关系 分类 方法 | ||
1.一种基于数据增强与多级信息最大化的图关系数据的分类模型训练方法,其特征在于,包括:
确定数据集,以所述数据集中每个样本的基本单元为节点,以符合预设关系的基本单元之间的预设关系为边,构建每个样本的结构图;
按照预设比例随机去除所述结构图的部分边后,将剩余图作为增强结构图,所述结构图和所述增强结构图构成双视图;
对于每个视图,分别使用全连接神经网络和图卷积神经网络对全图关系数据进行学习,得到每个视图的节点特征信息和拓扑信息;
融合所述拓扑信息和特征信息,并获取对应视图的局部表示和全局表示;
考虑结构图和增强结构图的全局表示和局部表示之间的约束,基于多级信息最大化规则,得到损失函数;
将图卷积神经网络中每层的表示进行相加,并将相加后的表示输入分类器,输出所述结构图的分类结果;
根据所述分类结果和标签计算交叉熵分类损失函数,其中,所述标签为根据结构图的分类预先标注;根据所述交叉熵分类损失函数对模型进行监督训练,当所述交叉熵分类损失函数稳定时,得到训练好的目标模型。
2.根据权利要求1所述的方法,其特征在于,所述数据集包括化合物集,所述基本单元包括预设原子组;以所述化合物中的预设原子组为节点,以两个预设原子组为边,构建每个化合物的结构图;其中,所述预设原子组中包括至少一个原子;或,
所述数据集包括对象实体集,所述基本单元包括事物;以所述事物为节点,以两个事物之间的关系为边,构建每个对象实体的结构图。
3.根据权利要求2所述的方法,其特征在于,所述化合物包括高分子化合物和普通化合物,其中,所述普通化合物为非高分子化合物;所述高分子化合物包括蛋白质和非蛋白质高分子化合物。
4.根据权利要求3所述的方法,其特征在于,当所述高分子化合物为蛋白质时,所述预设原子组为氨基酸,以蛋白质中的氨基酸作为节点,以空间距离小于或等于预设距离阈值的两个氨基酸为边,构建蛋白质结构图;或,
当所述化合物为非蛋白质高分子化合物时,所述预设原子组为类氨基酸,以所述非蛋白质中的类氨基酸作为节点,以空间距离小于等于预设距离阈值的两个类氨基酸为边,构建非蛋白质高分子化合物结构图;或,
当所述化合物为普通化合物时,以所述普通化合物中的原子作为节点,以两个原子之间的键作为边,构建普通化合物结构图。
5.根据权利要求1所述的方法,其特征在于,所述对于每个视图,分别使用全连接神经网络和图卷积神经网络对全图关系数据进行学习,得到每个视图的节点特征信息和拓扑信息,包括:
通过全连接神经网络对于每个视图的全图关系数据进行学习,得到对应视图的节点特征信息;以及,通过图卷积神经网络对每个视图的全图关系数据进行学习,得到对应视图的拓扑信息。
6.根据权利要求1所述的方法,其特征在于,所述融合所述拓扑信息和特征信息,并获取对应视图的局部表示和全局表示,包括:
融合所述拓扑信息和所述特征信息,得到自注意力得分;
根据所述自注意力得分筛选出对应视图中的重要节点,确定对应视图的局部表示;
通过最大池化层和平局池化层相加的方式,得到对应视图的全局表示。
7.根据权利要求1所述的方法,其特征在于,所述考虑结构图和增强结构图的全局表示和局部表示之间的约束,基于多级信息最大化规则,得到损失函数,包括:
考虑结构图的局部表示与增强结构图的局部表示之间的约束,基于信息最大化规则,得到第一损失函数;
考虑结构图的全局表示与增强结构图的局部表示之间的约束,基于信息最大化规则,得到第二损失函数;
考虑结构图的全局表示与增强结构图的全局表示之间的约束,基于信息最大化规则,得到第三损失函数;
根据所述第一损失函数、第二损失函数、第三损失函数以及对应的系数,以求和的方式得到所述损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310002337.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置