[发明专利]一种IPTV节目推荐方法在审

专利信息
申请号: 201910011378.4 申请日: 2019-01-07
公开(公告)号: CN109672938A 公开(公告)日: 2019-04-23
发明(设计)人: 顾军华;谢志坚;张亚娟;武君艳;许馨匀;佘士耀;陈博;张素琪 申请(专利权)人: 河北工业大学
主分类号: H04N21/442 分类号: H04N21/442;H04N21/466;H04N21/475
代理公司: 天津翰林知识产权代理事务所(普通合伙) 12210 代理人: 胡安朋
地址: 300130 天津市红桥区*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明一种IPTV节目推荐方法,涉及由服务器执行的方便内容分发与终端用户设备相关的数据的交互式电视,是一种基于隐式评分模型和图游走的协同过滤IPTV节目推荐方法,提出一种三特征隐式评分模型,将用户收视行为数据转化为用户评分数据,再使用加入时间因子函数余弦相似度计算节目的直接相似度,然后使用图游走的方法计算节目的间接相似度,最后重建节目的相似度并对用户进行推荐,克服了现有技术中存在处于大数据环境下,数据稀疏性和兴趣漂移影响到对IPTV节目推荐的准确度的缺陷,以及现有技术均未对用户的兴趣漂移问题进行改善的缺陷。
搜索关键词: 相似度 漂移 评分模型 隐式 节目 用户收视行为数据 用户评分数据 终端用户设备 交互式电视 余弦相似度 准确度 内容分发 时间因子 数据稀疏 协同过滤 大数据 再使用 服务器 重建 转化
【主权项】:
1.一种IPTV节目推荐方法,其特征在于:是一种基于隐式评分模型和图游走的协同过滤IPTV节目推荐方法,具体步骤如下:第一步,基于三特征隐式评分模型的IPTV用户收视行为数据的处理:第1.1步,IPTV用户收视行为数据的收集:所需收集的IPTV用户收视行为数据包括,IPTV用户编号、行为开始时间、行为类型、节目收视时长、节目编号、节目名称、节目类型和节目本身时长,其中,行为类型数据包括浏览、点播、直播和收藏,节目类型包括节目所属一级类型、节目所属二级类型,第1.2步,使用三特征隐式评分模型计算IPTV用户对节目的评分:制定基于收视比值、IPTV用户兴趣偏置因子和IPTV节目类型影响因子的三特征隐式评分模型,IPTV用户对节目的隐式评分计算方法如下公式(1)所示,公式(1)中,score(i,j)为IPTV用户i对节目j的隐式评分,scale为IPTV用户i对节目j的收视比值,interest为IPTV用户i兴趣偏置因子,category为节目j类型影响因子,α、β和γ为权重,f为收视比值作用函数、g为IPTV用户兴趣偏置因子作用函数,h为节目类型影响因子作用函数,n为IPTV用户对同一节目观看的次数,进一步设置收视比值作用函数f、IPTV用户兴趣偏置因子作用函数g和节目类型影响因子作用函数h这三个特征作用函数的评分作用以及权重计算方法,表述如下:1)收视比值作用函数f:收视比值即上述第1.1步中收集的“节目收视时长”与“节目本身时长”的比值,收视比值越大,说明IPTV用户对节目的喜好程度也越大,隐式评分越高,收视比值作用函数f的表述方式如下公式(2)所示,公式(2)中,scale为IPTV用户对该节目的收视比值,behave_len为IPTV节目收视时长,item_len为节目本身时长,2)IPTV用户兴趣偏置因子作用函数g:IPTV用户兴趣偏置因子是按照IPTV用户的收视比值的均值将IPTV用户对节目的喜好程度划分为以下两部分,IPTV用户观看某一节目的收视比值高于平均收视比值的视为IPTV用户喜欢该节目,IPTV用户观看某一节目的收视比值低于平均收视比值的视为IPTV用户不喜欢该节目,根据以上定义,IPTV用户兴趣偏置因子的表述方式如下公式(3)所示,公式(3)中,pij代表上述第1.1步中收集的“IPTV用户编号”为i的IPTV用户i对“节目编号”为j的节目j的观看时长和节目j的本身时长的比值,为IPTV用户i的平均收视比值,设max ri为IPTV用户i的最大IPTV用户兴趣偏置因子,min ri为IPTV用户i的最小IPTV用户兴趣偏置因子,它们的表述方式分别如下公式(4)和公式(5)所示,归一化后的IPTV用户兴趣偏置因子作用函数g如下公式(6)所示,公式(6)中,为IPTV用户i的IPTV用户兴趣偏置因子平均值,rij为“IPTV用户编号”为i的IPTV用户i对“节目编号”为j的节目j的IPTV用户兴趣偏置因子,当g(interest)为正值时,表示IPTV用户i喜欢该节目,g(interest)=1则表示IPTV用户i最喜欢该节目,g(interest)为负值时,表示IPTV用户i不喜欢该节目,g(interest)=‑1表示IPTV用户i最不喜欢该节目,3)节目类型影响因子作用函数h:节目类型影响因子用于衡量上述第1.1步中收集的不同“节目类型”对IPTV用户偏好的影响,每个IPTV用户都有自己喜欢的节目类型,当“节目类型”属于IPTV用户喜欢的类型,则增加其隐式评分的值,节目类型影响因子作用函数h的评分方式如下公式(7)所示,h(category)=lij/Li   (7),公式(7)中,lij为IPTV用户i观看的与“节目编号”为j的节目j“节目类型”同相同的上述第1.1步中收集的总的“节目收视时长”,Li为IPTV用户i观看所有类型节目的总的“节目收视时长”,4)特征函数权重计算方法:使用熵权法来确定上述特征作用函数的IPTV用户偏好权值,熵权法计算过程如下:首先,将上述第1.2步中所述的IPTV用户的三个特征作用函数的值表示成n×3阶矩阵即B=(bzk)n×3,z∈[1,n],其中n表示上述第1.1步中用户行为数据的条数,bzk表示根据第z条用户收视行为数据得到的第k个特征作用函数的值,4.1)用如下公式(8)进行标准化数据处理:公式(8)中,szk为标准化后第z条用户收视行为数据的第k个特征作用函数的大小,max(bk)是第k个特征作用函数的最大值,min(bk)是第k个特征作用函数的最小值,4.2)用如下公式(9)进行计算上述第1.2步中所述的IPTV用户的三个特征作用函数的熵值:公式(9)中,N=1/ln3,Hk为第k个特征函数的熵值,fzk为对第z条用户收视行为数据的第k个特征作用函数值进行归一化的值,当fzk=0时,fzklnfzk=0,4.3)用如下公式(10)进行计算上述第1.2步中所述的IPTV用户的三个特征作用函数的权重系数:公式(10)中,ωk为上述第1.2步中所述的三特征隐式评分模型中的第k个特征作用函数的权重系数,第1.3步,生成IPTV用户评分数据:由上述第1.2步的收视比值、IPTV用户兴趣偏置因子和节目类型影响因子的三特征隐式评分模型的操作结果,将IPTV用户收视行为数据转化为IPTV用户评分数据,所生成IPTV用户评分数据包括:IPTV用户编号、IPTV节目编号、评分、评分时间,其中评分时间即为第1.1步中的行为开始时间,由此完成基于三特征隐式评分模型的IPTV用户收视行为数据的处理;第二步,组成IPTV节目近邻集合:第2.1步,建立IPTV用户节目评分矩阵:利用上述第一步中得到的IPTV用户评分数据,包括:IPTV用户编号、IPTV节目编号、评分、评分时间,建立IPTV用户节目评分矩阵如下公式(11)公式(11)中,rij=score(i,j)为根据上述第一步中得到的IPTV用户i对节目j的评分,N为IPTV用户的个数,M为节目的个数,tij为IPTV用户i对节目j的评分时间,i=1,2,…,N;j=1,2,…,M,第2.2步,计算IPTV节目间的直接相似度:设有一个“IPTV节目编号”为a的IPTV节目a和另一个“IPTV节目编号”为b的IPTV节目b,在余弦相似度的基础上引入交占比系数,计算IPTV节目a和IPTV节目b的直接相似度的方法如下公式(12)公式(12)中,sim(a,b)为IPTV节目a与IPTV节目b的相似度,sa为对IPTV节目a评过分的用户编号集合,sab为对IPTV节目a和IPTV节目b的共同评分用户编号集合,|sab|为对IPTV节目a和IPTV节目b的共同评分用户的个数,|sa|为对IPTV节目a评分的用户个数,|sb|为对IPTV节目b评分的用户个数,ria为IPTV用户i对节目a的评分,为IPTV节目a的平均评分,rib为IPTV用户i对节目b的评分,为IPTV节目b的平均评分,用户在相近的时间内收视IPTV节目,当两个节目的收视时间越接近,收视时间与当前时间越接近,用户收视的节目越相似,用公式(13)和公式(14)表述如下:公式(13)中,f(tia,tib)为用户i收看节目a和节目b的时间差对相似度的影响函数,tia为IPTV用户i收看节目a的时间,tib为IPTV用户i收看节目b的时间,α=0.085,公式(14)中,g(tia,tib)为用户i收看节目a和节目b的时间与当前时间差对相似度的影响函数,tia为IPTV用户i收看节目a的时间,tib为IPTV用户i收看节目b的时间,tcurrent为当前的时间,β=0.085,由此用以下公式(15)计算IPTV节目间的直接相似度,公式(15)构建了节目相似度矩阵Sim,该节目相似度矩阵Sim与IPTV节目a相似度最高的Top=20个节目编号组成IPTV节目a的直接近邻集合Na,由此完成组成IPTV节目近邻集合;第三步,基于图游走方法对IPTV节目近邻集合进行修正:第3.1步,建立IPTV节目网络图:首先对上述第二步中得到的Sim矩阵进行变换得到矩阵SU,如下公式(16)所示:公式(16)中,suab为变换后得到的IPTV节目a和其他IPTV节目b的相似度,Na为IPTV节目a的直接近邻集合,然后对矩阵SU按列进行归一化得到矩阵SU*,其中为从当前IPTV节目a下一步游走到IPTV节目b节点的概率,最后以矩阵SU*为邻接矩阵建立IPTV节目网络图,第3.2步,图游走计算IPTV节目的间接相似度:使用重启随机游走,图游走的过程用如下公式(17)描述:公式(17)中,t为远程跳转的节点的概率向量,r为当前处于每个节点的概率向量,p为d次游走后在当前节点继续图游走的概率,(1‑p)为随机远程跳转到目标节点的概率,令p=0.85,为d次图游走后停留在每个节点的概率,T为转置,向量为远程跳转的目标节点,其中经过有限次图游走后向量r收敛,令rd+1=rd=r,向量r=[r1,…,rb,…,rn]中rb为从IPTV节目a开始图游走最终停留在IPTV节目b的概率,rb被视作IPTV节目a与IPTV节目b的相对相似程度,当不考虑IPTV节目与它本身的相似度时,令rb=a=0,为此rb越大,表示IPTV节目a与IPTV节目b的间接相似度越高;第3.3步,重建IPTV节目相似度:集合N′a={b|b∈Na且suab≠0}表示上述第2.2步中所述的IPTV节目a的直接近邻集合Na中与IPTV节目a相似度大于0的IPTV节目集合,其中suab为上述第3.1步公式(16)得到的相似度,用该集合中IPTV节目b与目标IPTV节目a的直接相似度与上述第3.2步中的向量r中对应构成元素的映射关系,重建节目的相似度矩阵sim′,然后根据重建的相似度矩阵更新IPTV节目a的直接近邻集合N″a,如下公式(19)所示:公式(18)中,sim′(a,b)为相似度矩阵Sim′中目标IPTV节目a与IPTV节目b的重建相似度,suab为上述公式(16)中目标IPTV节目a与IPTV节目b的直接相似度,|Na′|为集合Na′中用户个数,suac为上述公式16得到的IPTV节目a与IPTV节目c的直接相似度,rc为上述公式(17)中的向量r的第c个元素,rb为上述公式(17)中的向量r的第b个元素,由此完成基于图游走方法对IPTV节目近邻集合N″a进行修正;第四步,将评分最高的TopK个节目推荐给用户:TopK是指为IPTV用户推荐的节目个数,第4.1步,预测IPTV用户对未观看节目的评分:在进行预测IPTV用户对未观看节目的评分时引入时间因子如下公式(19)所示,公式(19)中,h(tib)为用户i对节目b的评分时间与当前时间差对评分预测的影响函数,tcurrent为当前时间,tib为IPTV用户i观看节目b的时间,e为指数,γ=0.085,根据上述第三步中得到的用户近邻集合N″a以及重建用户的相似度矩阵Sim′,对目标IPTV用户i未观看节目进行评分预测,目标IPTV用户i对未观看节目a的预测评分如下公式(20)所示:公式(20)中,ria为IPTV用户i对未评分节目a的预测评分,为IPTV节目a的平均评分,rib为IPTV用户i对节目b的评分,为IPTV节目b平均评分,N″a为第三步得到的节目a更新的近邻集合,sim′(a,b)为节目a与近邻节目b的重建相似度,由此完成预测IPTV用户对未观看节目的评分;第4.2步,为IPTV用户推荐评分最高的TopK个节目:最后将IPTV用户i的未评分节目中预测评分最高的TopK个节目推荐给IPTV用户i;至此完成基于隐式评分模型和图游走的协同过滤IPTV节目推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910011378.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top