[发明专利]针对数据不均匀及数据稀疏的topN推荐系统及方法有效
申请号: | 201611189954.7 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106649714B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 肖云鹏;张克毅;刘宴兵;柳靓云;李茜曦;孙华超 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 数据 不均匀 稀疏 topn 推荐 系统 方法 | ||
本发明请求保护一种针对数据不均匀及数据稀疏的topN推荐系统及方法,属于数据挖掘和信息检索领域。基于用户以及社交网络信息好友关系,考虑评分与用户个人活跃度、物品流行度以及用户对物品感兴趣程度的隐性关系,通过时间离散化及时间切片的方法,加入三方面时间效应影响,同时针对用户评分数据分布不均匀以及数据稀疏性问题,构建基于灰色理论改进GM(1,N)预测模型,挖掘评分与三方面的显性动态关系。输入数据到预测模型即可预测用户对物品的评分,根据用户评分情况,将用户感兴趣的物品推荐给用户,实现topN推荐。
技术领域
本发明属于数据挖掘和信息检索领域,涉及推荐系统的个性化推荐,是一种面向社交网络基于灰色系统解决数据不均匀及数据稀疏的个性化推荐方案。
背景技术
随着信息技术的迅猛发展,网络上的各种信息随之急剧增长,信息过载问题随之而来。为解决海量信息带来的难题,无数科学家和工程师不断提出新的解决方案,如强化搜索引擎和优化推荐系统等。
近年来,随着互联网规模的不断扩大,推荐系统越来越被受到青睐。个性化推荐技术的发展,对改善用户体验和提高服务质量起到了重要的作用。推荐系统研究的方向可以分为两类:预测和topN推荐。前者是评分估计,通过已知的用户历史评分记录预测未知的用户评分记录。后者就是给定一个用户,给他提供一个包括N个物品的个性化推荐列表。而现有的推荐方案可以分为基于内容的推荐方案和基于协同过滤的推荐方案。基于内容的推荐通过计算已知用户偏好与项目属性所刻画内容之间的匹配度,给用户推荐可能感兴趣的项目。基于协同过滤的算法利用用户历史行为,参考近邻用户兴趣特征寻找当前用户潜在感兴趣的对象,进而进行个性化推荐。由于基于内容的系统难以区分资源内容的品质和风格,不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源,因此基于协同过滤的系统在业界得到了广泛的研究与应用。
基于协同过滤的推荐系统能够为用户发现新的感兴趣的信息,但存在两个很难解决的问题,一个是由于用户数目和项目数量急剧增加导致的稀疏性问题,另一个是随着用户和资源的增多系统性能降低的可扩展性问题。在用户评分数据极端稀疏的情况下,传统推荐系统的推荐质量急剧下降。另外,在推荐系统中用户兴趣和物品都具有时效性,将时间效应建模到推荐系统的模型中能够极大的提高推荐的准确率。然而由于用户行为的不确定性,用户对项目的评分时间也是不均匀的,这对用户评分进行时间序列分析造成了一定困难。因此解决数据不均匀及稀疏问题对topN推荐的质量显得十分重要。
由于推荐系统的数据不均匀及数据稀疏问题,基于传统协同过滤算法不能取得良好的推荐效果。而灰色系统理论模型的研究对象为小数据、贫信息为特征的不确定系统,可以描述多变量系统的动态模型,能够挖掘出系统变量与相关因素变量的显性关系。灰色预测模型使用少量数据就能构建系统模型,并可以取得不错的预测精度,因此使用灰色预测模型能在一定程度上缓解数据稀疏问题。但如何构建基于灰色系统理论的评分预测模型及如何处理不均匀时间序列是本研究的难点所在。
发明内容
本发明所要解决的问题:针对用户评分不确定及用户数目和项目数据急剧增加所导致的数据不均匀及数据稀疏问题。本发明提出一种基于改进的灰色理论模型的topN推荐方案。该方案从用户和物品的相关属性出发,探索用户评分与用户活跃度、物品流行度和用户对物品的兴趣的显性关系,并且考虑了他们的时效性因素以及用户社交网络信息,提高预测的准确度及推荐的质量。提出了一种提高预测的准确度及推荐的质量的针对数据不均匀及数据稀疏的推荐系统及方法。本发明的技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611189954.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置