[发明专利]一种视频处理方法、装置、设备以及可读存储介质有效
申请号: | 201911012723.2 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110781347B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 李伟康;陈小帅;刘德伟 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06F40/289 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 处理 方法 装置 设备 以及 可读 存储 介质 | ||
本申请实施例公开了一种视频数据处理方法、装置、设备以及可读存储介质,本申请属于计算机技术领域,方法包括:获取目标视频的关键帧数据,生成所述关键帧数据对应的视频图像特征;获取与所述目标视频相关联的文本数据,生成所述文本数据对应的视频文本特征;将所述视频图像特征与所述视频文本特征进行特征融合,生成视频表示特征;获取与所述目标视频对应的候选标签集中候选标签的标签表示特征,将所述视频表示特征与所述标签表示特征进行匹配,根据匹配结果在所述候选标签集中确定用于表征所述目标视频的目标标签。采用本申请,可以提高视频标签检索能力,提高构建视频标签的效率与质量。
技术领域
本申请涉及计算机技术领域,尤其涉及一种视频处理方法、装置、设备以及可读存储介质。
背景技术
随着多媒体技术的发展,视频已成为人们日常生活中获取信息与享受娱乐的主要载体。不同的多媒体软件的爆炸式增长使海量视频出现在人们的视野中,如何进行个性化推荐,使视频响应用户的需求、更贴近于用户的喜好,显得十分有必要。
在现有技术中,视频推荐可以通过视频标签使用户快速获取到想看的视频内容,视频软件平台也可以通过视频标签建立视频间的关联,从而推荐相关联的视频给用户,使用户观看到更多更丰富的内容。
但现有技术在构建视频标签时主要通过人工进行标注,通过人工标注的方法会消耗掉大量的人力与时间,效率低下。
发明内容
本申请实施例提供一种视频数据处理方法、装置、设备以及可读存储介质,可以提高视频标签检索能力,提高构建视频标签的效率与质量。
本申请实施例一方面提供了一种视频数据处理方法,包括:
获取目标视频的关键帧数据,生成所述关键帧数据对应的视频图像特征;
获取与所述目标视频相关联的文本数据,生成所述文本数据对应的视频文本特征;
将所述视频图像特征与所述视频文本特征进行特征融合,生成视频表示特征;
获取与所述目标视频对应的候选标签集中候选标签的标签表示特征,将所述视频表示特征与所述标签表示特征进行匹配,根据匹配结果在所述候选标签集中确定用于表征所述目标视频的目标标签。
其中,所述获取目标视频的关键帧数据,生成所述关键帧数据对应的视频图像特征,包括:
基于所述目标视频中的每个视频帧对应的图像参数,从所述目标视频中获取N个关键视频帧;所述N为正整数且小于所述目标视频的总帧数;
基于所述关键视频帧对应的帧时间戳,生成关键视频帧序列;
将所述关键视频帧序列输入循环神经网络模型,通过所述循环神经网络模型输出所述关键视频帧序列对应的向量数据,将所述向量数据确定为所述视频图像特征。
其中,所述与所述目标视频相关联的文本数据包括:视频标题数据、视频描述数据以及视频字幕文件;
所述获取与所述视频相关联的文本数据,生成所述文本数据对应的视频文本特征,包括:
获取所述目标视频的视频标题数据与视频描述数据;
从所述视频字幕文件中获取所述目标视频的视频字幕数据;
对所述视频标题数据、所述视频描述数据以及所述视频字幕数据分别进行分词处理,得到多个文本分词;所述多个文本分词包括标题分词、描述分词以及字幕分词;
获取每个文本分词分别对应的第一词向量,将所述第一词向量输入语言处理模型;
基于所述语言处理模型输出所述视频标题数据对应的标题表示特征、所述视频描述数据对应的描述表示特征以及所述视频字幕数据对应的字幕表示特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911012723.2/2.html,转载请声明来源钻瓜专利网。