[发明专利]基于异构图神经网络的文献推荐方法及推荐系统在审

专利信息
申请号: 202011278839.3 申请日: 2020-11-16
公开(公告)号: CN112380435A 公开(公告)日: 2021-02-19
发明(设计)人: 孙圣力;赵玉媛;李青山;司华友 申请(专利权)人: 北京大学;南京博雅区块链研究院有限公司;北京国信云服科技有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06K9/62;G06N3/04;G06N3/08
代理公司: 无锡永乐唯勤专利代理事务所(普通合伙) 32369 代理人: 孙际德
地址: 100000*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 构图 神经网络 文献 推荐 方法 系统
【说明书】:

发明提出的一种基于异构图神经网络的文献推荐方法,包括以下步骤:获取用户特征数据以及文献特征数据;从文献特征数据中提取文献属性数据以及文献引文数据,根据文献属性数据以及文献引文数据通过图卷积神经网络获取文献引文特征数据;根据预设元路径提取结构数据,根据结构数据构建异构信息网络,并通过自注意力机制学习网络获取结构特征数据;将源数据进行规范化处理获得样本集,将样本集划分为训练集以及测试集,将训练集以及测试集输入至推荐模型中对推荐模型进行训练并获取推荐结果。通过图卷积神经网络和图注意力网络挖掘用户的结构特征数据及文献的结构特征数据,对用户进行多元化的兴趣表示,实现对用户进行个性化的推荐的目的。

技术领域

本发明涉及数据推荐技术领域,特别是涉及一种基于异构图神经网络的文献推荐方法及推荐系统。

背景技术

随着互联网时代的到来,信息共享呈现普遍化、细微化的发展趋势,科技文献也越来越多,如何帮助用户从海量的科技文献中快速找到用户感兴趣的内容成为推荐算法领域研究的热门问题。在传统的推荐方法中,最为主流的是协同过滤技术,它假设:用户对过去感兴趣的项目一直感兴趣,而协同过滤技术整体可分类为基于用户的协同过滤、基于项目的协同过滤和基于模型的协同过滤。基于用户的协同过滤的原理是根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,然后,基于这K个邻居的历史偏好信息,为当前用户进行推荐。基于项目的协同过滤的原理是使用所有用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。基于模型的协同过滤以矩阵分解为主流技术,矩阵分解的主要目的是学习一种有效的预测功能来表征用户-项目交互记录(例如用户项目评分矩阵),挖掘用户潜在兴趣表示。

随着推荐技术的发展,深度学习方法成为热门研究方向,深度兴趣网络(DeepInterset Network,DIN)是一种推荐技术在深度学习方向的最新模型,该模型是第一个将注意力机制应用到推荐技术的方法。在经典的推荐网络中,用户兴趣一般映射到固定长度向量,这在用户多元兴趣表达上具有很大的局限性,DIN模型则通过局部激活单元,根据用户历史行为自适应学习不同的兴趣向量表示,更好的捕捉用户的多元兴趣进行个性化推荐。但即使构建了多方面的用户特征,DIN模型在向量嵌入方面的工作明显不足,仅对用户ID和商品ID以及商品所属的商店ID等信息进行向量表示,未深入挖掘用户和商品的辅助数据在用户兴趣的表示的影响。

当前用于建模和利用异构复杂信息的热门方法是搭建异构信息网络(Heterogeneous Information Network,HIN),它由多种类型的节点和链接组成,具备建模数据异质性的灵活性,被运用在推荐系统中表征丰富的辅助信息。大多数文献表明,现有的基于HIN的推荐方法的基本思想是利用HIN上用户和项之间基于路径的语义相关性进行推荐,例如基于元路径的相似性。虽然基于HIN的方法在某种程度上提高了效果,但是由于基于元路径的相似性依赖于显式的路径可达性,并且当路径连接稀疏或嘈杂时,将其用于推荐可能并不可靠;而且,基于元路径的相似性主要表征了基于HIN定义的语义关系,并不直接适用于推荐系统。

随着深度学习的进一步发展,图神经网络(Graph Neural Networks,GNN)成为一种基于深度学习的强大图表示技术。文献表明,基于层次注意力机制的GNN通过关注节点与其基于元路径的邻居之间的重要性和不同元路径的重要性,并利用分层方式来聚合来自元路径的邻居的特征形成节点嵌入,较好表示了异质图神经网络的潜在内容,具有较好的鲁棒性,但仍未能直接适用于推荐系统中。

发明内容

基于此,有必要针对传统的异构神经网络以及图神经网络不能直接适用于推荐系统的技术问题,提出了一种基于异构图神经网络的文献推荐方法及推荐系统。

本发明提出的一种基于异构图神经网络的文献推荐方法,所述推荐方法包括以下步骤:

S100,原始数据获取步骤,获取用户特征数据以及文献特征数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;南京博雅区块链研究院有限公司;北京国信云服科技有限公司,未经北京大学;南京博雅区块链研究院有限公司;北京国信云服科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011278839.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top