[发明专利]一种融合协同过滤和用户属性过滤的混合推荐方法在审
申请号: | 201710599815.X | 申请日: | 2017-07-21 |
公开(公告)号: | CN107391670A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 曹俊豪;李泽河;江龙;张德刚;王达达 | 申请(专利权)人: | 云南电网有限责任公司教育培训评价中心 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650000 云南省昆明市滇池度*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 协同 过滤 用户 属性 混合 推荐 方法 | ||
技术领域
本发明涉及一种融合协同过滤和用户属性过滤的混合推荐方法,属于信息技术领域。
背景技术
目前,云南电网每年的培训达到6万人次,具有培训规模大、培训内容覆盖面广、专业多、专业性强等特点,如何根据每个用户的行为数据对用户推送其感兴趣的项目(如设备知识点)成为了培训中的一个难题。其中,推荐系统的主体部分是个性化推荐算法,研究推荐系统其实就是研究个性化推荐算法,因为推荐系统的性能就取决于个性化推荐算法的性能。目前各类推荐系统中使用的推荐算法有很多种,其中协同过滤算法是目前应用范围最广、研究最多的个性化推荐算法。协同过滤算法首先找出当前用户的相似用户并利用相似用户进行推荐,而不考虑项目的自身属性,主要依赖于最近邻居用户的意见进行推荐,偏向于个性化推荐。
协同过滤算法最大的优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,协同过滤的主要缺点是数据稀疏性问题,即在用户评分矩阵数据比较稀疏的情况下,用户的相似度计算是不准确的,由此将导致推荐的效果无法满足系统要求。研究者为了进一步提高协同过滤算法的推荐质量,针对其缺点,采用了一系列的处理方法,如《基于奇异值分解的协同过滤推荐算法研究》阐述了如何利用奇异值分解的方式降低评分矩阵的维数,获取有用信息,但该方法却缺失了部分数据,在数据稀疏时,其预测误差会大于传统的协同过滤算法。《基于填充和相似性信任因子的协同过滤推荐算法》阐述了一种进行评分矩阵填充的数据挖掘算法,该算法部分改进了协同过滤算法,但该算法过于依赖活跃用户,在评分稀疏时,不利于对用户进行个性化推荐。而且传统的协同过滤推荐算法是依据用户评分矩阵向用户推荐,存在着因数据稀疏而导致推荐信息不准确的问题。
在推荐领域,协同过滤算法是比较实用的推荐算法,该算法分两种:一种是基于用户的协同过滤算法(UserCF);还有一种是基于项目的协同过滤算法(ItemCF)。基于用户的协同过滤推荐的基本原理是:根据所有用户对物品的偏好,发现与当前用户口味和偏好相似的邻居用户群,然后基于邻居群的历史偏好信息,为当前用户进行推荐。基于项目的协同过滤推荐的基本原理是:根据所有用户对物品偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。
本发明的融合协同过滤和用户属性过滤的混合推荐算法的优势主要体现在将用户属性过滤应用在协同过滤可信邻居的寻找中,这样可以有效地缓解由于评分矩阵数据稀疏带来的寻找相似用户不准的缺陷,同时,通过对协同过滤算法中Pearson相关系数进行优化,也增加了寻找相似用户的可信度,可以有效提高推荐准确率。
发明内容
为实现上述目的,本发明提供如下技术方案:一种融合协同过滤和用户属性过滤的混合推荐方法,其包括以下步骤:
(1)采用时间热度函数的计算方法对Pearson相关系数算法进行改进得到改进后的相似度计算公式;
(2)根据步骤(1)的改进后的相似度计算公式计算当前用户与其他用户的相似度,并找出最终相似度最高的N个初步邻居用户;
(3)建立用户属性相似度模型,对邻居用户进行进一步过滤,得到最终可信邻居集合 M;
(4)由最终得到的可信邻居对当前用户进行推荐。
进一步,作为优选,所述步骤(1)中,时间热度函数计算公式如下:
其中,设Dui表示用户u访问项目i的时间与用户u最早访问系统任一项目的时间间隔,该时间间隔在数据库中有相应的时间记录,时间热度函数WT(u,i)是一个和Dui相关的函数值,其采用关于Dui的非递减函数,即对于Dui>Duj,有WT(u,i)≥WT(u,j),该时间热度函数是一个线形函数,其中Lu表示用户u使用推荐系统的时间跨度,即该用户最早访问系统任一项目的时间与最近访问系统任一项目的时间间隔,a∈(0,1),称为权重增长指数,改变a的值可以调整权重随时间变化的速度,a越大权重增长速度越快,a的大小可影响到算法性能,动态调整a的值来优化推荐效果。
进一步,作为优选,所述步骤(1)中,Pearson相关系数算法具体为:
用户a和用户b的Pearson相似度表示如下:
其中,给定用户集U、项目集P以及用户对项目的评分矩阵R,ra,p表示用户a对项目p 的评分,表示用户u对项目P评分的平均值。
进一步,作为优选,所述步骤(1)中,将时间热度加入到相似度计算公式中来,优化后得到的改进后的相似度计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司教育培训评价中心,未经云南电网有限责任公司教育培训评价中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710599815.X/2.html,转载请声明来源钻瓜专利网。