[发明专利]基于视频相关文本的视频检测方法、装置及电子设备在审
申请号: | 201811496488.6 | 申请日: | 2018-12-07 |
公开(公告)号: | CN111368071A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 黄君实;罗玄;陈强 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06K9/62;G06F16/78;G06F16/73 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视频 相关 文本 检测 方法 装置 电子设备 | ||
本申请提供一种基于视频相关文本的视频检测方法、装置及电子设备,应用于视频检测技术领域,其中该方法包括:对待检测视频的相关文本进行分词处理,得到多个文本词,然后,通过预定的词嵌入方法得到各个文本词对应的词向量,并基于各个文本词对应的词向量确定相关文本的固定长度的向量表征,继而,将固定长度的向量表征输入预定的分类网络得到相关文本的低俗检测结果,并根据相关文本的低俗检测结果确定待检测视频的低俗检测结果。即通过预定的分类网络确定待检测视频的相关文本的低俗检测结果,并基于相关文本的低俗检测结果确定待检测视频的低俗检测结果,从而实现了待检测视频是否是低俗视频的自动检测,降低了低俗检测的成本。
技术领域
本申请涉及视频检测技术领域,具体而言,本申请涉及一种基于视频相关文本的视频检测方法、装置及电子设备。
背景技术
随着视频制作技术的发展,人人都可以制作并分享自己的视频,造成网络上视频数量的激增。在网络上的大量视频中,有一部分视频是“三俗”(即庸俗、低俗、媚俗)视频,其传播的信息内容非常低俗,相关低俗视频的传播将对社会产生不良影响,因此,实现视频的低俗检测具有重要意义。
目前,对视频的低俗检测是通过人工方式实现的,即相应视频平台的相关工作人员通过人工检测的方式,逐一对视频平台上的视频进行浏览、观看,然后确定相应的视频是否为低俗视频。然而,根据现有的人工方式进行视频的低俗检测,相关工作人员需要逐一检测相关视频,对于部分视频,甚至需要观看视频的完整内容之后才能确定相关视频是否为低俗视频,检测效率非常低,此外,随着视频平台视频数量的激增,需要大量的相关工作人员才能完成视频的低俗检测工作,人工成本非常高。因此,现有的人工进行视频的低俗检测方式存在效率低、成本高的问题。
发明内容
本申请提供了一种基于视频相关文本的视频检测方法、装置及电子设备,用于提升视频的低俗检测的效率,及降低视频的低俗检测的成本,本申请采用的技术方案如下:
第一方面,提供了一种基于视频相关文本的视频检测方法,该方法包括,
对待检测视频的相关文本进行分词处理,得到多个文本词;
通过预定的词嵌入方法得到各个文本词对应的词向量;
基于各个文本词对应的词向量确定相关文本的固定长度的向量表征;
将固定长度的向量表征输入预定的分类网络得到相关文本的低俗检测结果,并根据相关文本的低俗检测结果确定待检测视频的低俗检测结果。
进一步地,基于各个文本词对应的词向量确定相关文本的固定长度的向量表征,包括以下至少一项:
基于各个文本词的词向量通过全局平均池化编码方法,得到待检测视频的相关文本的固定长度的向量表征;
基于各个文本词的词向量通过VLAD编码方法,得到待检测视频的相关文本的固定长度的向量表征;
基于各个文本词的词向量通过Fisher Vector编码方法,得到待检测视频的相关文本的固定长度的向量表征。
进一步地,基于各个文本词的词向量通过VLAD编码方法,得到待检测视频的相关文本的固定长度的向量表征,包括:
基于各个文本词的词向量对多个文本词进行聚类处理,得到多个聚类中心;
计算确定各个文本词的向量值分别与其对应的聚类中心向量值的残差值,并针对任一聚类中心对该聚类中心与对应的各个文本词之间的残差值进行求和得到残差值的和;
基于得到的各个聚类中心分别对应的残差值的和来确定待检测视频的相关文本的固定长度的向量表征。
进一步地,该方法还包括:
通过预训练的神经网络模型确定提取的待检测视频的关键帧图像的低俗检测结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811496488.6/2.html,转载请声明来源钻瓜专利网。