[发明专利]一种基于高斯混合的大数据智能推荐方法有效

专利信息
申请号: 201710844205.1 申请日: 2017-09-19
公开(公告)号: CN107545471B 公开(公告)日: 2021-06-11
发明(设计)人: 杨永丽;宁振虎;薛菲;公备;王昱波 申请(专利权)人: 北京工业大学
主分类号: G06Q30/02 分类号: G06Q30/02;G06Q30/06;G06K9/62;G06N3/00
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 混合 数据 智能 推荐 方法
【权利要求书】:

1.一种基于高斯混合的大数据智能推荐方法,其特征在于:该方法的实现步骤如下,

(1)基于用户兴趣的相似度预测模型;首先,通过PLSA模型构建用户和项目的联合概率,基于此概率形式,构建合适的似然函数即大数据智能推荐模型;然后,通过CFPSO即粒子群算法优化EM算法从而求解大数据智能推荐模型中的参数;最后,运用大数据智能推荐模型求解目标用户对项目的预测评分;

a.构建用户和项目的联合概率;对于每一个三维向量u,ii,v,其中u,ii,v分别为用户u、项目ii、及用户u对项目ii的评分;引入潜在变量Z={z1,z2,…zi,…zk},其中zi为不同的聚类群体,1≤i≤k,用P(zk|u)表示用户u属于zk群体的概率且P(v|ii,zi)表示群体zi对项目ii评分v的概率;则用户和项目的联合概率为:

b.构建似然函数即大数据智能推荐模型;假定群体z对项目ii评分v的条件概率P(v|ii,z)符合高斯分布,有P(v|ii,z)=N(μi,zi,z)=P(v;μi,zi,z),其中μi,zi,z分别为群体Z对项目i评分的均值和方差,则用户和项目的联合概率是一个满足高斯混合的概率模型:则得到对数似然函数为:

c.参数初始化选择;针对参数P(z|u),μi,z,采用K-means聚类算法对参数进行初始化;同时,运用CFPSO算法对初始化后的参数进行优化;设定粒子群的数目为n,任意粒子l的位置表示为Xl=(x1,x2,…xn),选择(1)式作为适应度函数;则基于CFPSO优化EM算法的步骤如下:

第一步:初始化粒子种群;给定粒子群的数目同时对粒子群中每个粒子的初始位置和速度进行初始化,位置和速度公式如下:

其中,表示第l个粒子在t+1时刻d维空间的速度,ε为压缩因子,ω为惯性权重,c1,c2为加速常数,r1和r2为随机数,与分别表示粒子l在t时刻d维空间的个体最优和全局最优值,表示第l个粒子在t+1时刻d维空间的位置;

第二步:计算粒子群中各个粒子的适应度值,并更新粒子的当前个体最优位置pbest和粒子群的群体最优位置gbest

第三步:对粒子群的gbest根据EM算法对其进行更新;比较更新前后的适应度值,如果更新后的gbest值使得适应度函数值变大,则更新种群最优位置gbest信息,否则不予更新;

第四步:对更新后的种群最优值gbest进行校验,如果其满足要求,则结束CFPSO算法,并取得gbest值的属性信息作为EM算法的初始参数;否则转至第五步;

第五步:根据公式(2)和(3)更新粒子群中粒子个体的速度和位置参数并转至第二步继续执行;其中,EM算法的执行步骤如下:

E步:根据每一个评分向量u,i,v,计算得到每个潜在的变量z∈Z的后验概率P(z|u,v,i),如下:

M步:根据E步计算得到的后验概率,并结合拉格朗日最优化极值对似然函数求偏导可得到P(z|u),μi,z,的值,分别如下:

根据CFPSO优化EM算法的初始化参数,交替执行E步和M步,直到收敛,求得参数P(z|u),μi,z,作为大数据推荐模型的参数集;

d.用户兴趣相似度模型预测评分;通过M步中的参数集,构造基于高斯混合的用户兴趣相似度模型,从而计算用户u对项目i的预测评分,具体公式如下:

(2)基于项目的预测模型;根据对项目打分的用户越多,则项目之间的相似度越高;同时,由于同类物品出现的时间越相近,则各物品之间的相似度越高,因此引入项目时间因子,定义如下:

其中,ti和tj为项目i和项目j出现的时间;定义项目i和j的相似度为sim(i,j):

其中,U(i)和U(j)分别是对项目i和j评分的用户集合,ru,i和ru,j表示用户u对项目i和项目j的评分,和表示所有用户对项目i和项目j的平均评分,θ为非负数;则定义用户对项目的预测评分如下:

其中,S(i)为项目i的邻域集合,这里选择项目是否加入邻域的方式为判断两项目的相似度是否大于一定的阈值,这样的计算的方式减少项目之间的比较排序,节约运算时间;

(3)线性加权预测;将用户兴趣相似预测模型与基于项目的预测模型运用线性加权的方式将二者的预测评分进行结合,从而计算出用户对项目的最终预测评分,其公式计算如下:

rateu,i=α×rate_uHMMu,i+β×rate_Itemu,i,0<α<1,α+β=1 (12)

综上,对协同过滤算法中用户对项目的预测评分进行改进,分别通过高斯混合、CFPSO、EM算法建立基于用户兴趣相似度预测模型,通过添加时间因子建立基于项目预测模型,从而将二者的预测评分进行线性结合,作为用户对项目的最终预测评分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710844205.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top