[发明专利]视频分类方法、装置、设备及介质在审
申请号: | 202110267539.3 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112784111A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 陈凯兵;刘国翌 | 申请(专利权)人: | 有半岛(北京)信息科技有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75 |
代理公司: | 北京博遵律师事务所 11761 | 代理人: | 马佑平 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 设备 介质 | ||
1.一种视频分类方法,所述方法包括:
获取目标视频和目标类别标签;
通过预设视频模型提取所述目标视频的视频内容特征,得到对应于所述目标视频的视频特征向量;
通过预设文本模型提取所述目标类别标签的文本内容特征,得到对应于所述目标类别标签的文本特征向量;
根据所述视频特征向量和所述文本特征向量,获得所述目标视频与所述目标类别标签间的相关性分数;
在所述相关性分数大于或等于预设的分数阈值的情况下,确定所述目标视频的类别标签为所述目标类别标签。
2.根据权利要求1所述的方法,其中,所述目标类别标签为所述目标视频所在视频集合的类别标签,所述方法还包括:
在所述相关性分数小于所述分数阈值的情况下,从所述视频集合中滤除所述目标视频。
3.根据权利要求1所述的方法,其中,所述方法在所述通过预设视频模型提取所述目标视频的视频内容特征,及所述通过预设文本模型提取所述目标类别标签的文本内容特征之前,还包括:
获取训练样本集;其中,所述训练样本集中每一训练样本包括视频样本及所述视频样本的样本类别标签;
通过所述训练样本集,以设定的收敛条件同步训练基础视频模型和基础文本模型,得到训练后的基础视频模型作为所述预设视频模型及得到训练后的基础文本模型作为所述预设文本模型;
其中,所述收敛条件包括:通过所述基础视频模型提取的所述视频样本的视频内容特征和通过所述基础文本模型提取的所述样本类别标签的文本内容特征均具有对应于所述样本类别标签的分类结果。
4.根据权利要求3所述的方法,其中,所述通过所述训练样本集,以设定的收敛条件同步训练基础视频模型和基础文本模型,得到训练后的基础视频模型作为所述预设视频模型及得到训练后的基础文本模型作为所述预设文本模型,包括:
通过所述训练样本集,固定所述基础视频模型的模型参数,以所述收敛条件训练所述基础文本模型,得到第一阶段训练后的基础文本模型;
通过所述训练样本集,以所述收敛条件训练所述基础视频模型并接续所述第一阶段训练后的基础文本模型继续训练所述基础文本模型,得到所述预设视频模型和所述预设文本模型。
5.根据权利要求4所述的方法,其中,所述训练样本集包括第一样本集和第二样本集,所述通过所述训练样本集,固定所述基础视频模型的模型参数,以所述收敛条件训练所述基础文本模型,得到第一阶段训练后的基础文本模型,包括:
通过所述第一样本集,固定所述基础视频模型的模型参数,以所述收敛条件训练所述基础文本模型,得到前期训练后的基础文本模型;
通过所述第二样本集,固定所述基础视频模型的模型参数,接续所述前期训练后的基础文本模型继续训练所述基础文本模型,得到所述第一阶段训练后的基础文本模型。
6.根据权利要求3所述的方法,其中,所述通过所述训练样本集,以设定的收敛条件同步训练基础视频模型和基础文本模型中的每一步训练,包括:
通过对应当前步的基础视频模型提取所述视频样本的视频内容特征,得到对应于视频样本的第一样本特征向量;
通过对应当前步的基础文本模型提取所述样本类别标签的文本内容特征,得到对应于所述样本类别标签的第二样本特征向量;
通过共享分类参数的多分类器分别对所述第一样本特征向量和所述第二样本特征向量进行分类,得到对应于所述第一样本特征向量的第一分类结果和对应于所述第二样本特征向量的第二分类结果;
以所述收敛条件训练所述基础视频模型和所述基础文本模型。
7.根据权利要求6所述的方法,其中,所述多分类器对应的类别标签的种类与所述训练样本集包含的样本类别标签的种类相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有半岛(北京)信息科技有限公司,未经有半岛(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110267539.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种雾化器、电子烟组件及电子烟
- 下一篇:一种电推剪