[发明专利]一种基于增量协同过滤的UGC相关视频生成方法在审
申请号: | 201710517911.5 | 申请日: | 2017-06-29 |
公开(公告)号: | CN107343209A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 文辉;江永青;纪达麒;高翔;纪传俊 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/258;H04N21/466 |
代理公司: | 北京卓唐知识产权代理有限公司11541 | 代理人: | 唐海力,韩来兵 |
地址: | 200000 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于增量协同过滤的UGC相关视频生成方法,包括实时读取原始的用户播放行为数据,并进行预处理,输出用户播放数据;根据用户播放数据计算并输出视频的最终流行度数据;根据用户播放数据获取增量数据及其中的增量共现数据;根据历史共现数据和增量共现数据计算最终共现数据;对于每一个视频数据对,分别对视频数据对中的两个视频数据进行聚合操作,获取最后的相关视频列表。本发明中的方法,可以实时处理用户行为数据,可以将协同过滤推荐结果更快地反馈到推荐结果并集中;更快地计算出新视频的协同过滤结果,避免新视频的推荐冷启动效果不佳的问题。 | ||
搜索关键词: | 一种 基于 增量 协同 过滤 ugc 相关 视频 生成 方法 | ||
【主权项】:
一种基于增量协同过滤的UGC相关视频生成方法,其特征在于,包括:实时读取原始的用户播放行为数据UserPlayLog,并进行预处理,输出用户播放数据UserPlayData,UserPlayData格式为:userid,[(videoid_1,ref_1),(videoid_2,ref_2),…(videoid_i,ref_i)],userid为用户数据,videoid_i为该用户观看过的视频数据,ref_i为与视频数据videoid_i的用户得分数据;按照用户播放数据UserPlayData中的userid对观看行为进行聚合,同时对观看视频次数过多的用户进行过滤;读取用户播放数据UserPlayData,对用户播放数据中视频数据videoid_i进行聚合,统计出每个视频数据相对应的用户得分数据总和:将增量视频流行度ref_i_new和历史视频流行度ref_i_old进行合并,计算并输出视频的最终流行度数据VideoPopularityData;读取用户播放数据UserPlayData,根据所述用户播放数据获取所有用户中观看任意两个视频的视频数据对(videoid_i,videoid_j),并按照视频数据对进行聚合,得到增量数据RtCooccurData,字段包括(videoid_i,videoid_j),rt_count_ij,其中rt_count_ij为增量共现数据,表示同时观看过视频videoid_i和videoid_j用户的个数;读取增量数据RtCooccurData及历史数据HisCooccurData,根据历史共现数据his_count_ij和增量共现数据rt_count_ij计算最终共现数据count_ij,计算时并对历史数据进行衰减;所述HisCooccurData字段为(videoid_i,videoid_j),his_count_ij;对于每一个视频数据对,分别对视频数据对中的两个视频数据videoid_i和videoid_j进行聚合操作,获取最后的相关视频列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710517911.5/,转载请声明来源钻瓜专利网。