[发明专利]一种基于自监督学习和知识图谱的推荐系统及其推荐方法在审
申请号: | 202310584578.5 | 申请日: | 2023-05-23 |
公开(公告)号: | CN116521999A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 袁友伟;周威炜;郑超;姜添;金晓刚;鄢腊梅 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/36;G06N3/0895 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 知识 图谱 推荐 系统 及其 方法 | ||
本发明公开一种基于自监督学习和知识图谱的推荐系统及其推荐方法。本发明通过自监督学习方式对知识图谱进行数据增强,采用高效的负采样方法构造正负样本对,并通过定义相对相似性损失函数来判断两个样本之间的相似程度,随后构建了一个基于知识图谱的图神经网络模型,结合多头注意力机制计算实体特征,最后根据相对相似性度量动态调节实体评分,提升推荐系统的性能,缓解数据稀疏问题。
技术领域
本发明属于推荐系统技术领域,具体涉及一种基于自监督学习和知识图谱的推荐系统及其推荐方法。
背景技术
随着推荐系统在大数据时代的蓬勃发展,现有的推荐系统在准确率和多样性上已经取得了不俗的成绩,但是其仍然在可解释性上存在不足,而知识图谱作为强可解释性的认知工具,已经成为当前智能认知领域的热点方向,将知识图谱结合推荐系统也成为一个热点的研究方向。由于推荐系统存在大量的未标注数据,同时知识图谱因为本身作为图的特性和当前知识提取存在不足,数据稀疏问题日益凸显。数据稀疏问题是指在推荐系统中相较于海量的物品数量,与用户存在交互的物品数量在数据集中占比非常小,导致行为矩阵十分稀疏的问题。数据稀疏问题的会导致新上架的物品、低交互甚至无交互的物品受到推荐的可能性过低,加剧长尾效应的发生。一个有效的解决方案是通过人工进行数据标注,但是这种解决方案需要消耗大量的人力资源,同时由于人工标注存在误差和噪声,也会影响到推荐系统的推荐效果。
针对以上问题,本发明在基于知识图谱特征提取的基础之上,提出了一种基于自监督学习和知识图谱的推荐系统及其推荐方法,以缓解数据稀疏问题。
发明内容
为了克服现有推荐系统存在的缺陷,本发明提出一种基于自监督学习和知识图谱的推荐系统及其推荐方法,通过自监督学习方式对知识图谱进行数据增强,采用高效的负采样方法构造正负样本对,并通过定义相对相似性损失函数来判断两个样本之间的相似程度,随后构建了一个基于知识图谱的图神经网络模型,结合多头注意力机制计算实体特征,最后根据相对相似性度量动态调节实体评分,提升推荐系统的性能,缓解数据稀疏问题。
为了解决现有技术的问题,本发明采用以下技术方案:
第一方面,本发明提供一种基于自监督学习和知识图谱的推荐方法,包括以下步骤:
步骤(1):构建知识图谱;
步骤1.1:获取用户行为数据;
步骤1.2:将用户行为数据中用户、物品、用户固有属性特征和物品固有属性特征作为实体,并提炼上述实体关系,最终得到实体-关系-实体的三元组知识图谱;
步骤(2):通过自监督学习模块对原知识图谱进行数据增强,得到经过数据增强的知识图谱D;
步骤(3):通过基于知识图谱的图神经网络模块学习实体的最佳特征表示;
3.1:在知识图谱D上进行特征提取,得到头实体h、尾实体t在关系r的关系空间内的相似性评分;
3.2:构建一个基于知识图谱的图注意力网络层,该层包括C个注意力通道,每个注意力通道中包含M个注意力机制;将图注意力网络层中节点的特征赋值给知识图谱D中对应的头实体h、尾实体t;
步骤(4):通过动态评分模块动态调节三元组的评分,依据评分获取最终推荐结果。
第二方面,本发明提供一种推荐系统,包括:
数据获取模块,获取用户行为数据;
知识图谱构建模块,对用户行为数据构建实体-关系-实体的三元组知识图谱;
自监督学习模块,对原知识图谱进行数据增强,得到知识图谱D;
图神经网络模块,通过基于知识图谱的图神经网络学习实体的最佳特征表示,然后将特征赋值给知识图谱D中对应的头实体、尾实体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310584578.5/2.html,转载请声明来源钻瓜专利网。