[发明专利]一种基于高斯混合的大数据智能推荐方法有效

申请号：	201710844205.1	申请日：	2017-09-19
公开（公告）号：	CN107545471B	公开（公告）日：	2021-06-11
发明（设计）人：	杨永丽;宁振虎;薛菲;公备;王昱波	申请（专利权）人：	北京工业大学
主分类号：	G06Q30/02	分类号：	G06Q30/02;G06Q30/06;G06K9/62;G06N3/00
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	沈波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于混合数据智能推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于高斯混合的大数据智能推荐方法，其特征在于：该方法的实现步骤如下，

(1)基于用户兴趣的相似度预测模型；首先，通过PLSA模型构建用户和项目的联合概率，基于此概率形式，构建合适的似然函数即大数据智能推荐模型；然后，通过CFPSO即粒子群算法优化EM算法从而求解大数据智能推荐模型中的参数；最后，运用大数据智能推荐模型求解目标用户对项目的预测评分；

a.构建用户和项目的联合概率；对于每一个三维向量u,ii,v，其中u,ii,v分别为用户u、项目ii、及用户u对项目ii的评分；引入潜在变量Z＝{z₁,z₂,…z_i,…z_k}，其中z_i为不同的聚类群体，1≤i≤k，用P(z_k|u)表示用户u属于z_k群体的概率且P(v|ii,z_i)表示群体z_i对项目ii评分v的概率；则用户和项目的联合概率为：

b.构建似然函数即大数据智能推荐模型；假定群体z对项目ii评分v的条件概率P(v|ii,z)符合高斯分布，有P(v|ii,z)＝N(μ_i,z,σ_i,z)＝P(v；μ_i,z,σ_i,z)，其中μ_i,z,σ_i,z分别为群体Z对项目i评分的均值和方差，则用户和项目的联合概率是一个满足高斯混合的概率模型：则得到对数似然函数为：

c.参数初始化选择；针对参数P(z|u)，μ_i,z，采用K-means聚类算法对参数进行初始化；同时，运用CFPSO算法对初始化后的参数进行优化；设定粒子群的数目为n，任意粒子l的位置表示为X_l＝(x₁,x₂,…x_n)，选择(1)式作为适应度函数；则基于CFPSO优化EM算法的步骤如下：

第一步：初始化粒子种群；给定粒子群的数目同时对粒子群中每个粒子的初始位置和速度进行初始化，位置和速度公式如下:

其中，表示第l个粒子在t+1时刻d维空间的速度，ε为压缩因子，ω为惯性权重，c₁，c₂为加速常数，r₁和r₂为随机数，与分别表示粒子l在t时刻d维空间的个体最优和全局最优值，表示第l个粒子在t+1时刻d维空间的位置；

第二步：计算粒子群中各个粒子的适应度值，并更新粒子的当前个体最优位置p_best和粒子群的群体最优位置g_best；

第三步：对粒子群的g_best根据EM算法对其进行更新；比较更新前后的适应度值，如果更新后的g_best值使得适应度函数值变大，则更新种群最优位置g_best信息，否则不予更新；

第四步：对更新后的种群最优值g_best进行校验，如果其满足要求，则结束CFPSO算法，并取得g_best值的属性信息作为EM算法的初始参数；否则转至第五步；

第五步：根据公式(2)和(3)更新粒子群中粒子个体的速度和位置参数并转至第二步继续执行；其中，EM算法的执行步骤如下：

E步：根据每一个评分向量u,i,v，计算得到每个潜在的变量z∈Z的后验概率P(z|u,v,i)，如下：

M步：根据E步计算得到的后验概率，并结合拉格朗日最优化极值对似然函数求偏导可得到P(z|u)，μ_i,z，的值，分别如下：

根据CFPSO优化EM算法的初始化参数，交替执行E步和M步，直到收敛，求得参数P(z|u)，μ_i,z，作为大数据推荐模型的参数集；

d.用户兴趣相似度模型预测评分；通过M步中的参数集，构造基于高斯混合的用户兴趣相似度模型，从而计算用户u对项目i的预测评分，具体公式如下：

(2)基于项目的预测模型；根据对项目打分的用户越多，则项目之间的相似度越高；同时，由于同类物品出现的时间越相近，则各物品之间的相似度越高，因此引入项目时间因子，定义如下：

其中，t_i和t_j为项目i和项目j出现的时间；定义项目i和j的相似度为sim(i,j)：

其中，U(i)和U(j)分别是对项目i和j评分的用户集合，r_u,i和r_u,j表示用户u对项目i和项目j的评分，和表示所有用户对项目i和项目j的平均评分，θ为非负数；则定义用户对项目的预测评分如下：

其中，S(i)为项目i的邻域集合，这里选择项目是否加入邻域的方式为判断两项目的相似度是否大于一定的阈值，这样的计算的方式减少项目之间的比较排序，节约运算时间；

(3)线性加权预测；将用户兴趣相似预测模型与基于项目的预测模型运用线性加权的方式将二者的预测评分进行结合，从而计算出用户对项目的最终预测评分，其公式计算如下：

rate_u,i＝α×rate_uHMM_u,i+β×rate_Item_u,i，0＜α＜1,α+β＝1 (12)

综上，对协同过滤算法中用户对项目的预测评分进行改进，分别通过高斯混合、CFPSO、EM算法建立基于用户兴趣相似度预测模型，通过添加时间因子建立基于项目预测模型，从而将二者的预测评分进行线性结合，作为用户对项目的最终预测评分。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710844205.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种薄型补偿膜偏光片的贴合装置及其制作工艺
下一篇：热压复合系统中的复合件计码结构

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30-00 商业，例如购物或电子商务
G06Q30-02 .行销，例如，市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励；价格评估或确定
G06Q30-04 .签单或开发票
G06Q30-06 .购买、出售或租赁交易
G06Q30-08 ..拍卖

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于高斯混合的大数据智能推荐方法有效

专利文献下载