[发明专利]基于异构图神经网络的文献推荐方法及推荐系统在审
申请号: | 202011278839.3 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112380435A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 孙圣力;赵玉媛;李青山;司华友 | 申请(专利权)人: | 北京大学;南京博雅区块链研究院有限公司;北京国信云服科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 无锡永乐唯勤专利代理事务所(普通合伙) 32369 | 代理人: | 孙际德 |
地址: | 100000*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 构图 神经网络 文献 推荐 方法 系统 | ||
1.一种基于异构图神经网络的文献推荐方法,其特征在于,所述推荐方法包括以下步骤:
S100,原始数据获取步骤,获取用户特征数据以及文献特征数据;
S200,文献引文特征数据获取步骤,从所述文献特征数据中提取文献属性数据以及文献引文数据,根据所述文献属性数据以及所述文献引文数据通过图卷积神经网络获取文献引文特征数据;
S300,结构特征数据获取步骤,根据预设元路径提取结构数据,根据所述结构数据构建异构信息网络,并通过自注意力机制学习网络获取结构特征数据;
S400,推荐模型训练及推荐结果获取步骤,将源数据进行规范化处理获得样本集,将所述样本集划分为训练集以及测试集,将所述训练集以及所述测试集输入至推荐模型中对所述推荐模型进行训练并获取推荐结果。
2.根据权利要求1所述的基于异构图神经网络的文献推荐方法,其特征在于,在所述步骤S100中,所述用户特征数据包括用户身份信息;所述文献特征数据包括文献身份信息、文献标签、文献引文以及文献单词包集合中的任意一种或几种。
3.根据权利要求2所述的基于异构图神经网络的文献推荐方法,其特征在于,在所述步骤S200中,所述根据所述文献属性数据以及所述文献引文数据通过图卷积神经网络获取文献引文特征数据包括以下步骤:
根据所述文献属性数据构建文献属性特征矩阵;
根据所述文献引文数据创建文献引文图,所述文献引文图包括邻接矩阵和度矩阵;
将所述邻接矩阵与self-loop相加,获得self-loop-邻接矩阵;
对所述self-loop-邻接矩阵依据进行归一化特征表示,对应更改度矩阵获得self-loop-度矩阵;
将所述文献属性特征矩阵、所述self-loop-邻接矩阵以及所述self-loop-度矩阵输入到所述图卷积神经网络进行半监督训练,直至所述半监督训练的输出结果与所述文献属性数据差别最小结束训练,输出所述输出结果作为文献引文特征数据。
4.根据权利要求3所述的基于异构图神经网络的文献推荐方法,其特征在于,在所述S300中,所述预设元路径包括“用户-文献-用户”元路径以及“文献-用户-文献”元路径;
所述“用户-文献-用户”元路径为对同一文献打标签的用户,按照所述“用户-文献-用户”元路径获取的矩阵数据作为用户结构特征源数据;
所述“文献-用户-文献”元路径为被同一用户打标签的文献,按照所述“文献-用户-文献”元路径获取的矩阵数据作为文献结构特征源数据;
将所述用户结构特征源数据以及所述献结构特征源数据通过类型转换矩阵映射到相同空间中,获得结构数据。
5.根据权利要求4所述的基于异构图神经网络的文献推荐方法,其特征在于,在所述步骤S300中,所述通过自注意力机制获取结构特征数据包括以下步骤:
依据进行自注意力机制学习网络处理获得邻居节点对本地节点的重要程度
依据对所述邻居节点对本地节点的重要程度进行归一化处理,获得归一化的邻居节点对本地节点的重要程度;
依据整合所述本地节点的全部归一化的邻居节点对本地节点的重要程度及其权重系数并与所述本地节点的属性向量进行拼接,获得所述结构特征数据。
6.根据权利要求1至5任意一项所述的基于异构图神经网络的文献推荐方法,其特征在于,在所述步骤S400中,所述源数据包括所述用户特征数据、所述文献特征数据、所述文献引文特征数据以及所述结构特征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;南京博雅区块链研究院有限公司;北京国信云服科技有限公司,未经北京大学;南京博雅区块链研究院有限公司;北京国信云服科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011278839.3/1.html,转载请声明来源钻瓜专利网。