[发明专利]基于视频相关文本的视频检测方法、装置及电子设备在审

申请号：	201811496488.6	申请日：	2018-12-07
公开（公告）号：	CN111368071A	公开（公告）日：	2020-07-03
发明（设计）人：	黄君实;罗玄;陈强	申请（专利权）人：	北京奇虎科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/289;G06K9/62;G06F16/78;G06F16/73
代理公司：	北京市立方律师事务所 11330	代理人：	张筱宁
地址：	100088 北京市西城区新***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于视频相关文本检测方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种基于视频相关文本的视频检测方法、装置及电子设备，应用于视频检测技术领域，其中该方法包括：对待检测视频的相关文本进行分词处理，得到多个文本词，然后，通过预定的词嵌入方法得到各个文本词对应的词向量，并基于各个文本词对应的词向量确定相关文本的固定长度的向量表征，继而，将固定长度的向量表征输入预定的分类网络得到相关文本的低俗检测结果，并根据相关文本的低俗检测结果确定待检测视频的低俗检测结果。即通过预定的分类网络确定待检测视频的相关文本的低俗检测结果，并基于相关文本的低俗检测结果确定待检测视频的低俗检测结果，从而实现了待检测视频是否是低俗视频的自动检测，降低了低俗检测的成本。

技术领域

本申请涉及视频检测技术领域，具体而言，本申请涉及一种基于视频相关文本的视频检测方法、装置及电子设备。

背景技术

随着视频制作技术的发展，人人都可以制作并分享自己的视频，造成网络上视频数量的激增。在网络上的大量视频中，有一部分视频是“三俗”(即庸俗、低俗、媚俗)视频，其传播的信息内容非常低俗，相关低俗视频的传播将对社会产生不良影响，因此，实现视频的低俗检测具有重要意义。

目前，对视频的低俗检测是通过人工方式实现的，即相应视频平台的相关工作人员通过人工检测的方式，逐一对视频平台上的视频进行浏览、观看，然后确定相应的视频是否为低俗视频。然而，根据现有的人工方式进行视频的低俗检测，相关工作人员需要逐一检测相关视频，对于部分视频，甚至需要观看视频的完整内容之后才能确定相关视频是否为低俗视频，检测效率非常低，此外，随着视频平台视频数量的激增，需要大量的相关工作人员才能完成视频的低俗检测工作，人工成本非常高。因此，现有的人工进行视频的低俗检测方式存在效率低、成本高的问题。

发明内容

本申请提供了一种基于视频相关文本的视频检测方法、装置及电子设备，用于提升视频的低俗检测的效率，及降低视频的低俗检测的成本，本申请采用的技术方案如下：

第一方面，提供了一种基于视频相关文本的视频检测方法，该方法包括，

对待检测视频的相关文本进行分词处理，得到多个文本词；

通过预定的词嵌入方法得到各个文本词对应的词向量；

基于各个文本词对应的词向量确定相关文本的固定长度的向量表征；

将固定长度的向量表征输入预定的分类网络得到相关文本的低俗检测结果，并根据相关文本的低俗检测结果确定待检测视频的低俗检测结果。

进一步地，基于各个文本词对应的词向量确定相关文本的固定长度的向量表征，包括以下至少一项：

基于各个文本词的词向量通过全局平均池化编码方法，得到待检测视频的相关文本的固定长度的向量表征；

基于各个文本词的词向量通过VLAD编码方法，得到待检测视频的相关文本的固定长度的向量表征；

基于各个文本词的词向量通过Fisher Vector编码方法，得到待检测视频的相关文本的固定长度的向量表征。

进一步地，基于各个文本词的词向量通过VLAD编码方法，得到待检测视频的相关文本的固定长度的向量表征，包括：