[发明专利]基于多模态视频内容和多任务学习的视频推荐方法有效
申请号: | 202010108302.6 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111246256B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 史景伦;邓丽;梁可弘;傅钎栓;林阳城 | 申请(专利权)人: | 华南理工大学;广州梦辉机器人有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/466;G06F16/783;G06N3/04;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多模态 视频 内容 任务 学习 推荐 方法 | ||
1.一种基于多模态视频内容和多任务学习的视频推荐方法,其特征在于,所述的视频推荐方法包括下列步骤:
S1、采用深度学习技术对视频内容进行分析,通过Inception-V3模型、3维卷积神经网络分别提取视频静态特征、动态特征构成视觉特征,通过VGGish模型提取音频特征,通过统计视频标题中每个词在该视频文本词库中出现的频率获得视频文本特征;
S2、采用注意力机制学习视频各模态特征的权重,最后将各模态特征进行加权和获得视频特征表示,其中,所述的视频各模态特征包括视觉特征、音频特征、视频文本特征;
S3、将用户和视频作为节点构成用户-视频社交网络,通过深度游走方法学习网络中顶点的向量表示,并作为用户社会关系的特征表示,其中,用户-视频社交网络的顶点表示用户;
S4、基于注意力机制学习有效的特征组合,并与原始特征进行拼接融合作为深度神经网络的输入,学习多域特征表示;
其中,所述的步骤S4包括:
S41、多域特征中的离散数据进行独热编码后经过嵌入矩阵降维,所有连续特征拼接后,通过一层全连接转换成同等维度的向量;
S42、采用注意力机制学习有效的特征组合,通过注意力机制学习不同特征之间交互的权重,权重计算公式如下:
einter=[a0,0e0e0,a0,1e0e1,…ai,jeiej],
其中ei为第i个特征,eiej为特征元素级别相乘,相乘后维度不变,为第i个特征与第j个特征交互的注意力得分,注意力得分经过归一化得到ai,j,表示特征交互的权重,einter为多域特征两两交互构成的交叉特征,W、h是注意力网络的可训练参数,b表示偏置;
S43、原始特征及其基于注意力的交叉特征进行拼接融合后作为输入,通过多层感知机输出的结果作为多域特征最终的表示;
S5、基于上述步骤生成的特征嵌入作为多任务学习中各任务之间共享的部分,同时保留各任务特定的输出层生成预测结果。
2.根据权利要求1所述的基于多模态视频内容和多任务学习的视频推荐方法,其特征在于,所述的步骤S1包括:
S11、对视频抽帧,利用经过预训练的经典图像处理模型Inception-V3模型提取每一帧视频的静态特征,最后通过平均池化层融合每一帧的信息作为视频的静态特征,利用3维卷积神经网络提取视频的动态特征;
S12、提取音频信息,利用经过预训练的VGGish模型提取视频的音频特征;
S13、提取视频标题信息,统计每个词在该视频文本词库中出现的频率作为视频文本特征;
S14、采用PCA方法对视频静态特征、视频动态特征、音频特征进行降维,同时视频静态特征和视频动态特征进行拼接构成视觉特征。
3.根据权利要求1所述的基于多模态视频内容和多任务学习的视频推荐方法,其特征在于,所述的步骤S2包括:
S21、融合用户特征,通过注意力机制学习用户与视频各模态之间的依赖关系,即学习用户分配视觉特征、音频特征、视频文本特征的权重,由以下公式计算:
其中m∈{v,a,t}分别表示视觉模态、听觉模态和文本模态,为各模态求得的注意力得分,注意力得分经过归一化得到am,表示用户对各模态的偏好,该用户对各模态的偏好等价于用户对各模态的权重,则表示从视频中提取出来的视觉特征、听觉特征和文本特征,eU是用户特征,和是注意力网络的可训练参数,b表示偏置;
S22、视频各模态特征进行加权和获得该视频最终的特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州梦辉机器人有限公司,未经华南理工大学;广州梦辉机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010108302.6/1.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法