[发明专利]基于多模态视频内容和多任务学习的视频推荐方法有效
申请号: | 202010108302.6 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111246256B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 史景伦;邓丽;梁可弘;傅钎栓;林阳城 | 申请(专利权)人: | 华南理工大学;广州梦辉机器人有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/466;G06F16/783;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 视频 内容 任务 学习 推荐 方法 | ||
本发明公开了一种基于多模态视频内容和多任务学习的视频推荐方法,包括步骤:通过经预训练的模型提取短视频的视觉、音频、文本特征;采用注意力机制方法对视频多模态特征进行融合;采用深度游走方法学习用户社会关系的特征表示;提出基于注意力机制的深度神经网络模型学习多域特征表示;基于上述步骤生成的特征嵌入作为多任务模型的共享层,再分别通过多层感知机生成预测结果。本发明利用注意力机制结合用户特征对视频多模态特征进行融合,使得整个推荐更加丰富和具有个性化;同时,针对多域特征,考虑到交互特征在推荐学习中的重要性,提出一种基于注意力机制的深度神经网络模型丰富了高阶特征的学习,为用户提供更加精准的个性化视频推荐。
技术领域
本发明涉及网络视频和推荐系统技术领域,具体涉及一种基于多模态视频内容和多任务学习的视频推荐方法。
背景技术
随着智能移动端的快速普及和多媒体技术的发展,视频逐渐成为信息传播的载体,近年来短视频迅速兴起,视频已经成为人们娱乐的一种主要方式,用户的兴趣也表现的更广。短视频数量的暴增,带来了严重的信息过载问题,如何能从海量的数据中找到用户感兴趣的视频成为一个热门的话题和研究对象。一个好的推荐系统不仅能够帮助消费者更快更便捷的发现感兴趣甚至潜在感兴趣的视频,还能帮助内容提供商提升利润和用户粘性,因此近十年来,推荐系统成了各大视频平台衡量的一个重要标准。
目前短视频推荐技术面临两个重要的挑战:(1)目前大多数推荐算法都是基于用户的喜好、用户行为来进行推荐,忽视了物品的内容,也存在严重的冷启动问题,从而导致大多数视频被忽视,即使是传统的基于内容的推荐方法也并没达到很好的效果,因为它们依赖于元数据而不是原始视频内容。然而,微视频的元数据是由用户上传的,这对于视频来说可能是不准确的,如何有效的利用视频的多模态信息成为视频推荐的一个重要挑战。(2)单任务的推荐模型无法满足目前对多任务的需求,视频推荐中不仅要预测用户是否观看,还需预测用户对视频的评分、是否点赞、是否转发等行为。有效的多任务模型不仅可以减少模型训练成本,还能改进所有任务的模型预测。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于多模态视频内容和多任务学习的视频推荐方法,通过融合多模态视频内容实现更加具有个性化的推荐。本发明注重视频本身的内容,多模态内容使得用户和短视频之间的信息关系变得更加复杂,同时短视频的多模态信息也为整个的推荐系统提供了更为丰富的信息,能够有效的避免冷启动问题。
本发明的目的可以通过采取如下技术方案达到:
一种基于多模态视频内容和多任务学习的视频推荐方法,该视频推荐方法包括以下步骤:
S1、采用深度学习技术对视频内容进行分析,通过Inception-V3模型、3维卷积神经网络分别提取视频静态特征、动态特征构成视觉特征,通过VGGish模型提取音频特征;通过统计视频标题中每个词在该视频文本词库中出现的频率获得视频文本特征;
S2、采用注意力机制学习视频各模态特征(包括视觉特征、音频特征、视频文本特征)的权重,最后将各模态特征进行加权和获得视频特征表示;
S3、将用户和视频作为节点构成用户-视频社交网络,通过深度游走方法学习网络中顶点(即用户)的向量表示,并作为用户社会关系的特征表示;
S4、在多领域中,基于注意力机制学习有效的特征组合,并与原始特征进行拼接融合作为深度神经网络的输入,学习多域特征表示;
S5、基于上述步骤生成的特征嵌入作为多任务学习中各任务之间共享的部分,同时保留各任务特定的输出层生成预测结果。
进一步地,所述的步骤S1包括:
S11、对视频抽帧,利用经过预训练的经典图像处理模型Inception-V3模型提取每一帧视频的静态特征,最后通过平均池化层融合每一帧的信息作为视频的静态特征;利用3维卷积神经网络提取视频的动态特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州梦辉机器人有限公司,未经华南理工大学;广州梦辉机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010108302.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法