[发明专利]基于注意力的宽度图卷积神经网络模型系统及训练方法有效
| 申请号: | 202011642705.5 | 申请日: | 2020-12-30 |
| 公开(公告)号: | CN112598080B | 公开(公告)日: | 2023-10-13 |
| 发明(设计)人: | 刘勋;宗建华;夏国清;叶和忠;刘强 | 申请(专利权)人: | 广州大学华软软件学院 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/25;G06F18/2415;G06N3/0464;G06N3/084 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;颜希文 |
| 地址: | 510990 广东省广州市从*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 注意力 宽度 图卷 神经网络 模型 系统 训练 方法 | ||
1.一种基于注意力的宽度图卷积神经网络模型,其特征在于,所述宽度图卷积神经网络模型模型依次包括输入层、注意力高阶图卷积层、信息融合池化层和输出层;
所述输入层,用于接收训练数据集的图特征;
所述注意力高阶图卷积层,用于根据所述图特征进行零阶到k阶的注意力图卷积运算,得到图卷积数据;
所述信息融合池化层,用于根据所述图卷积数据进行零阶到k阶的特征融合,得到融合数据;
所述输出层,用于根据所述融合数据输出模型结果。
2.如权利要求1所述的基于注意力的宽度图卷积神经网络模型,其特征在于,所述注意力高阶图卷积层由在不同阶数图卷积都引入注意力机制得到。
3.如权利要求2所述的基于注意力的宽度图卷积神经网络模型,其特征在于,在所述注意力高阶图卷积层的任一阶数图卷积引入新的自连接。
4.如权利要求3所述的基于注意力的宽度图卷积神经网络模型,其特征在于,所述注意力高阶图卷积层包括基于权重共享的零阶图卷积到k阶图卷积,表示为:
其中,X是图的输入矩阵,w是参数矩阵,是图的正则化邻接矩阵,k是图卷积的最高阶数,a0,a1,a2,…,ak为对应阶图卷积的注意力分数。
5.如权利要求4所述的基于注意力的宽度图卷积神经网络模型,其特征在于,所述宽度图卷积神经网络模型模型的输出层HGCNCM表示为:
其中,σ(·)为激活函数,SP(·)为信息融合函数,softmax(·)为多分类输出函数。
6.如权利要求5所述的基于注意力的宽度图卷积神经网络模型,其特征在于,所述σ激活函数为ReLU非线性激活函数。
7.如权利要求5所述的基于注意力的宽度图卷积神经网络模型,其特征在于,所述信息融合池化层采用SP求和信息融合池化,其计算公式如下:
8.如权利要求1-7所述任一所述的基于注意力的宽度图卷积神经网络模型的训练方法,其特征在于,所述训练方法的步骤包括:
根据训练数据集进行预处理,得到预处理特征;
将所述预处理特征输入所述宽度图卷积神经网络模型,进行特征训练,得到训练结果。
9.如权利要求8所述的基于注意力的宽度图卷积神经网络模型的训练方法,其特征在于,所述根据训练数据集进行预处理,得到预处理特征的步骤包括:
获取所述训练数据集,并确定所述训练数据集的类型;
根据所述训练数据集的类型,选取特定方法得到所述图的输入矩阵和正则化邻接矩阵;
将所有不同阶数的所述图的正则化邻接矩阵加权作和,得到预处理邻接矩阵;
将所述预处理邻接矩阵和所述图的输入矩阵作积,得到预处理特征。
10.如权利要求8所述的基于注意力的宽度图卷积神经网络模型的训练方法,其特征在于,所述将所述预处理特征输入所述宽度图卷积神经网络模型,进行特征训练,得到训练结果的步骤包括:
将所述宽度图卷积神经网络模型的参数矩阵进行随机初始化,并将所述注意力分数初始化为特定值;
将所述预处理特征输入所述宽度图卷积神经网络模型,根据学习率优化结合所述训练数据集属性调整所述注意力分数,并采用损失函数和梯度下降法进行训练,得到收敛的参数矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学华软软件学院,未经广州大学华软软件学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011642705.5/1.html,转载请声明来源钻瓜专利网。





