[发明专利]一种基于协同过滤的电视终端节目个性化推荐方法有效
申请号: | 201710708711.8 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107454474B | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 肖欣庭;孙永强;刘鑫;唐军 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | H04N21/466 | 分类号: | H04N21/466;G06F16/9535 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 秦华云;刘渝 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于协同过滤的电视终端节目个性化推荐方法,基于物品的协同过滤技术,主要分两步进行,首先通过用户物品评分矩阵计算物品与物品之间的相似性,然后利用用户历史评分数据和物品物品相似性矩阵计算用户对其它物品的偏好,物品协同过滤技术主要利用了用户之间的集体智慧来计算物品之间的相似性,进而计算用户对物品的偏好。本发明首先针对电视端用户历史评分数据较难直接获取,构建了一种打分策略来将用户的观影行为转换为评分数据,然后利用构建的评分数据计算物品与物品相似性,最后实现推荐。 | ||
搜索关键词: | 一种 基于 协同 过滤 电视 终端 节目 个性化 推荐 方法 | ||
【主权项】:
1.一种基于协同过滤的电视终端节目个性化推荐方法,其特征在于:其方法步骤如下:A、根据用户的历史观影行为构建用户‑节目‑评分矩阵R;从采集的观影行为中抽取最近T_day天的用户观影行为作为算法源数据,对算法源数据进行如下两步清洗处理:A1、去除过于活跃的用户:从T_day天的用户观影行为中统计所有用户的观影情况,取一定比例相对非活跃的用户参与到后续步骤B,一定比例为整个用户所占比X1;其中,活跃用户的活跃度指在T_day天的用户观影行为中统计出的单个用户观看的节目数;A2、剔除过于热门的节目:从T_day天的用户观影行为中统计所有节目被观看的情况,取一定比例相对非热门的节目参与到后续步骤B,一定比例为所有节目所占比;其中,热门节目的热门度指在T_day天的用户观影行为中统计出的单个节目有多少用户观看过;经过步骤A清洗后的数据有m个用户,用户表示为user,n个节目,节目表示为item,则R表示为:
式中,rui表示用户useru对节目itemi的评分;其中rui采用如下方式构建:
式中,null表示用户useru未观看节目itemi,C为用户useru对节目itemi观看的总次数,T为节目itemi的总时长,tc表示用户useru每次观看节目itemi的时长,α为收缩因子,
表示连乘符号;
式中,
是所有
的集合,上式表示对构建后的评分数据进行max‑min归一化处理;B、根据用户物品评分矩阵R计算出节目‑节目‑相似性矩阵W,节目‑节目‑相似性矩阵W表示为:
式中,wij表示节目itemi与节目itemj的相似性;C、根据用户‑节目‑评分矩阵R和节目‑节目‑相似性矩阵W计算用户节目偏好矩阵P,偏好矩阵P表示如下:
式中,pui表示算法预测出的用户useru对节目itemi的偏好;D、形成对用户的Top‑N推荐列表结果L:根据用户偏好矩阵P,获得推荐列表结果L,具体数学化的表示如下:
其中,Top‑N(pui)表示取用户useru偏好pui的Top‑N;E、对算法进行离线评估,优化算法模型:采用均方误差来衡量预测效果的优劣,其数学化表示如下:
采用根据RMSE采用单一变量分析法,来调整步骤A到步骤D中涉及的参数,以使算法推荐效果离线最优;F、实现对用户的个性化推荐:当模型调试到离线最优状态时,可进行上线测试,实现对用户的个性化推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710708711.8/,转载请声明来源钻瓜专利网。