[发明专利]一种视频推荐方法及系统有效
申请号: | 201710687544.3 | 申请日: | 2017-08-11 |
公开(公告)号: | CN107515909B | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 张桐;刘海宝;汪念 | 申请(专利权)人: | 深圳市云网拜特科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06N3/04;G06N3/08 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 李琴 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 推荐 方法 系统 | ||
本发明公开了一种视频推荐方法,包括:采集用户信息数据、视频信息数据和用户观看视频所产生的行为信息数据;根据所采集的数据建立因子分解机模型,并训练强化学习网络模型;获取用户截止到当前所观看视频的历史行为信息数据,并根据所述历史行为信息数据,基于所述因子分解机模型和训练后的强化学习网络模型,获得用户的推荐视频;记录用户对所述推荐视频的实际反馈信息,并根据所述实际反馈信息优化所述因子分解机模型和所述训练后的强化学习网络模型。本发明还公开了一种视频推荐系统。本发明能够有效提高视频推荐的准确率和推荐速度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种视频推荐方法及系统。
背景技术
随着各类视频平台内容的不断丰富和快速地更新速度特点,用户在面对过量的信息却很难找到自己真正感兴趣的内容,因此为用户推荐符合其兴趣品味的视频内容,提高视频推荐的准确率已经成为各大视频平台运营商重点的研究领域之一。
目前常用的推荐算法包括基于内容、知识、图谱的推荐,协同过滤推荐等。其中运用较多的是协同过滤推荐,包含基于用户的协同过滤和基于物品的协同过滤两类推荐算法,协同过滤在不同的应用场景下可以产生较高的准确率,但当用户数或物品数较多时推荐系统的性能则会受到限制,同时难以解决冷启动问题。
发明内容
本发明针对现有技术中存在的问题,提供了一种视频推荐方法及系统,能够有效提高视频推荐的准确率和推荐速度。
本发明就上述技术问题而提出的技术方案如下:
一方面,本发明提供一种视频推荐方法,包括:
采集用户信息数据、视频信息数据和用户观看视频所产生的行为信息数据;
根据所采集的数据建立因子分解机模型,并训练强化学习网络模型;
获取用户截止到当前所观看视频的历史行为信息数据,并根据所述历史行为信息数据,基于所述因子分解机模型和训练后的强化学习网络模型,获得用户的推荐视频;
记录用户对所述推荐视频的实际反馈信息,并根据所述实际反馈信息优化所述因子分解机模型和所述训练后的强化学习网络模型。
进一步地,所述根据所采集的数据建立因子分解机模型,并训练强化学习网络模型,具体包括:
根据所采集的数据求解用户与视频之间的隐形因子特征,并根据所述隐形因子特征建立所述因子分解机模型;
将所采集的行为信息数据输入至所述强化学习网络模型和所述因子分解机模型,计算获得一个奖励期望值最大的训练视频;
根据预先建立的预测评分矩阵,计算用户观看所述奖励期望值最大的训练视频的奖励值,并将用户的观看行为数据添加到所述行为信息数据中;
根据所述行为信息数据、所述奖励值、所述观看行为数据和添加后的行为信息数据,更新强化学习网络结构权值参数,以更新所述强化学习网络模型;
将所述添加后的行为信息数据输入至更新后的强化学习网络模型和所述因子分解机模型,以继续更新所述强化学习网络结构权值参数,直到完成所述强化学习网络模型的训练为止。
进一步地,所述强化学习网络模型包括Actor网络和Critic网络;
所述将所采集的行为信息数据输入至所述强化学习网络模型和所述因子分解机模型,计算获得一个奖励期望值最大的训练视频,具体包括:
将所采集的行为信息数据输入至所述强化学习网络模型,由所述Actor网络输出一个训练初始推荐视频;
将所述行为信息数据和所述训练初始推荐视频输入至所述因子分解机模型,获得训练视频推荐集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市云网拜特科技有限公司,未经深圳市云网拜特科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710687544.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无烟炉
- 下一篇:一种自习教室实时查询系统