[发明专利]一种对数字视频进行内容识别的方法有效
申请号: | 201010176193.8 | 申请日: | 2010-05-13 |
公开(公告)号: | CN101853377A | 公开(公告)日: | 2010-10-06 |
发明(设计)人: | 金城;刘国辉;冯瑞;薛向阳 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/64 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数字视频 进行 内容 识别 方法 | ||
技术领域
本发明属于数字视频处理、多媒体信息管控等技术领域,具体涉及一种对数字视频进行内容识别的方法,可用于各类多媒体信息管控中需要数字视频管控的场合。
背景技术
随着多媒体技术和网络通信技术的发展,数字媒体在给人们方便的同时,也带来了一些潜在的风险,如色情有害内容泛滥。如何对这些网络多媒体信息进行有效管控,并保障网络的内容安全,已成为不良信息检索、监控研究的主要内容之一。
现有的一些网络过滤系统大都是基于URL地址的过滤,该技术只是简单地屏蔽掉网络运营商“黑名单”(已经被网络运营商认定为不良网站)中的网站URL。虽然基于URL的屏蔽技术简单高效,但其却存在着严重的局限性:1、网络运营商无法做到对“黑名单”的实时更新,一些新增的不良网站由此成为漏网之鱼;2、简单的URL屏蔽,可能导致许多正常网站内容被无辜屏蔽掉。基于多媒体内容的过滤却没有以上局限性,该技术直接对网络多媒体内容进行实时分析并得出分析结果,从而能够有效的辅助多媒体信息管控。由此可见,基于内容的过滤技术必然是互联网过滤系统的发展趋势,而数字视频内容识别正是该方向的一个重要分支。
目前,常用的视频内容识别方法,往往是通过对视频进行关键帧抽取,然后再对关键帧采用图像内容识别的方法进行检测。经过大量观察我们发现,不良图片(暴力、反动、色情等)在网络传输有两个主要特点:数量大、重复性,同一张不良图片往往会被同一人/不同人反复浏览。所以,对不良图片的识别应优先考虑拷贝检测的方法,通过搜集大量的不良图片组成强大的图片语料库,这样就能对大部分不良图片进行有效过滤。此外,对于色情图片的检测,我们还可以依靠人体皮肤区域分割技术,加上人脸检测技术相互配合,解决色情图片的识别。
本方法除了考虑到图像内容识别的方法,还加入了视频的拷贝检测模块,从而进一步提高了检测性能。网络上流传的不良视频往往和图像一样具有相似性和重复性的特点,通过构建不良视频语料库,然后采用基于局部排序的视频拷贝检测方法,对检测视频进行与不良视频库的拷贝检测,这样就可以快速过滤到大部分的不良视频。
基于局部排序的视频拷贝检测方法。首先对视频进行关键帧的抽取,并将每个关键帧分解成4*4的等分块,然后对每个分块分别提取平均亮度特征,最后通过计算相邻块间的灰度排序特征,就能对每个关键帧形成一个17维的包含时间点的特征向量。分别对不良视频库和检测视频进行相应特征提取,再采用基于局部敏感哈希的£近邻查询模式快速得到相似帧,最后根据视频帧时间点建图就能得到两段视频的拷贝路径,从而得到最终的拷贝检测结果。
综合考虑视频帧内容识别结果和视频拷贝检测结果,并形成最终的视频内容识别结果,能够有效的提高检测的准确率、降低不识别率和误检率。
发明内容
本发明的目的在于提供一种准确率高、误检率低的对数字视频进行内容识别的方法。
本发明在充分考虑传统的基于图像内容识别的视频内容识别方法的基础上,引入了不良视频拷贝检测技术。通过综合两方面检测结果,不仅改善了数字视频内容识别系统的检测性能,同时提高了系统的检测准确性,降低了漏检率。
本发明方法的流程如附图1所示,具体包含以下几个步骤:
一、建立不良视频语料库,构建由不良视频语料库到不良特征库的映射。互联网上流传的不良视频往往具有重复性的特点,同一不良视频可能存在多种拷贝版本(更改分辨率、更改视频格式、视频中加入logo信息等),而这些同一不良视频的各种拷贝版本都可以通过视频拷贝检测的方法检测出来。因此,通过构建一个可供更新的视频语料库,就能对互联网上的数字视频信息进行有效的管控。对于某段时间具有广泛传播性的不良视频,只需将其加载到视频语料库中,就能很好地对该视频进行过滤。视频具有占用空间容量大且不同格式视频解码时间复杂度不同的特点,本系统通过对不良视频语料库进行预处理,离线提取不良视频语料库特征,并建立从不良视频语料库到不良特征库的哈希映射,大大节省了系统的空间和时间开销。具体的离线处理方法(附图2)是:
(1)视频关键帧的抽取。对视频每隔单位时间进行一次关键帧的抽取,并记录下相应的时间轴信息。
(2)关键帧的特征向量形成。将每一关键帧等分成4*4块,对每一块分别计算其平均亮度特征,然后计算相邻块之间的灰度排序特征。通过结合关键帧的时间轴信息,就能得到每一关键帧的十七维特征向量信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010176193.8/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法