[发明专利]基于自注意力的融合三元组信的短序列扩充电影推荐方法在审
申请号: | 202210588407.5 | 申请日: | 2022-05-26 |
公开(公告)号: | CN114943010A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 李永强;李文伟;冯远静;范陈强;赵永智;吴毕亮;林栋;叶衍统;汤家睿;薛志豪 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/735;G06F16/36 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 赵芳 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 融合 三元 序列 扩充 电影 推荐 方法 | ||
一种基于自注意力的融合三元组信息的短序列扩充电影推荐方法,包括以下步骤:1)原始数据处理:处理用户观看电影的历史数据,并根据预先设定好的电影关系为每部电影制作知识图谱;2)根据时间戳为每个用户制作观看的历史电影序列,使用单向Transformer模型反向训练模型,得到反向的预训练模型,使用反向的预训练模型生成扩充的增强数据;3)将扩充后的数据送入预训练模型进行正向模型的微调,得到正向的预训练模型;4)使用正向微调后的模型预测用户下一部即将观看的电影。本发明对短序列进行扩充,增强了数据,解决部分冷启动问题,对电影的推荐提供有力的帮助。
技术领域
本发明涉及推荐系统、电影推荐、深度学习,知识图谱,提供了一种基于自注意力的融合知识图谱信息短序列扩充电影推荐方法。
背景技术
随着互联网技术的不断发展,数据量越来越大,网络中各种各样的信息越来越多,人们在生活中接触到的信息也越来越多,这使得人们在网络中找到自己想要的信息变得很难。即产生了信息过载,所谓的信息过载。指的是用户的知识水平,认知能力有限,在面对海量的互联网信息时,不能快速准确的找到自己需要的信息,甚至无法理解和使用信息。所以面对海量是数据时,如何从中提取到对用户有用的数据成为焦点。
为了解决信息过载的问题,搜索引擎和推荐系统就孕育而生,搜索引擎是一种能根据用户输入自己想查找的信息从而能展示用户想要的结果的工具,不过搜索引擎有个缺点,当用户不确定自己想要输入的关键词时,搜索引擎就无能为力了。这时候推荐系统就派上用场了,推荐系统不需要用户提供明确的兴趣和需求信息,只要通过分析用户与物品的历史行为为用户和物品建模,就能为用户推荐其可能感兴趣的物品。
发明内容
为了克服现有技术的不足,为了针对电影的推荐问题,本发明提出了一种基于自注意力的融合知识图谱信息短序列扩充电影推荐方法,在以往的电影推荐系统方案中,很难解决用户历史数据的稀少、冷启动、推荐的效果不好等问题。
为了解决上述技术问题,本发明提供如下的技术方案:
一种基于自注意力的融合三元组信息短序列扩充电影推荐方法,所述方法包括以下步骤:
1)原始数据处理:把原始的用户观看电影的历史数据处理成[用户id、电影id、评分、时间戳]的格式,针对每部电影根据预先设定好的电影的关系schema 为每部电影制作知识图谱作为电影的外部信息;
2)根据时间戳为每个用户制作观看的历史电影序列,以序列中第一个电影item 0作为下一项将要预测的item,以[item 1,item 2......item n]作为输入序列,使用单向Transformer模型反向训练模型;得到反向的预训练模型,用来生成增强数据,实现过程如下所述:
2.1)对于每个输入的电影item当作头实体,使用图卷积网络获取到它们的关系和尾实体的聚合信息kg_embedding作为该item的外部信息,其GCN公式定义为:
πir=g(i,r)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210588407.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种普外科术后护理用固定装置
- 下一篇:一种转炉炉底控制方法