[发明专利]一种对数字视频进行内容识别的方法有效

专利信息
申请号: 201010176193.8 申请日: 2010-05-13
公开(公告)号: CN101853377A 公开(公告)日: 2010-10-06
发明(设计)人: 金城;刘国辉;冯瑞;薛向阳 申请(专利权)人: 复旦大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/64
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;盛志范
地址: 20043*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数字视频 进行 内容 识别 方法
【权利要求书】:

1.一种对数字视频进行内容识别的方法,其特征在于具体步骤如下:

一、建立不良视频语料库,构建由不良视频语料库到不良特征库的映射互联

对于某段时间具有广泛传播性的不良视频,将其加载到视频语料库中,通过对不良视频语料库进行预处理,离线提取不良视频语料库特征,并建立从不良视频语料库到不良特征库的哈希映射,具体的离线处理步骤是:

(1)视频关键帧的抽取对视频每隔单位时间进行一次关键帧的抽取,并记录下相应的时间轴信息;

(2)关键帧的特征向量形成将每一关键帧等分成4*4块,对每一块分别计算其平均亮度特征,然后计算相邻块之间的灰度排序特征;结合关键帧的时间轴信息,得到每一关键帧的十七维特征向量信息;

(3)建立不良视频语料库到不良特征库的映射对每个不良视频,通过哈希映射,将其所有的关键帧的特征信息写入到一个对应的.feature文件中,形成从不良视频语料库到不良特征库的一一映射;

二、视频的拷贝检测对检测视频采用基于局部排序的视频拷贝检测方法,具体的拷贝检测步骤如下:

(1)检测视频的特征提取,同步骤一中所述方法;

(2)匹配检测视频特征与不良特征库,并生成匹配结果图采用基于局部敏感哈希的£近邻查询模式,使得数据库中距离近的矢量聚集到一起的概率远高于距离远的矢量,从而保证以一定的概率快速得到相似帧;

(3)对匹配结果图中的每个节点在匹配图中查找其最长路径,并形成最终的拷贝检测结果;采用Floyd-warshall算法,计算出每个节点之间的最短路径,通过该路径信息形成视频的拷贝的最长路径,从而判定检测视频是否为不良视频库中视频的一个拷贝;

三、基于图像内容识别技术的视频关键帧内容识别对于步骤二中判定的不属于不良视频库拷贝的视频,需再进行一次视频内容的识别,以减少新增不良视频的漏检率;

图像的内容识别技术,主要采用皮肤分割算法和基于边缘的区域增长算法;其步骤是先对图像进行归一化处理,将所有图像统一成同一个尺寸;然后通过四个分类器:皮肤区域比例分类器、人脸个数分类器、不变矩分类器、皮肤区域分布分类器对图像进行识别;四个分类器得出的值都在[0,1]范围内,分别把四个分类器赋予不同的置信度,相加后即得到强分类器的结果,该结果就是色情图片识别的最终结果;对视频的所有关键帧均进行内容识别,并统计得到不良帧的总数,当不良帧的总数超过某一设定阈值时,即判定该视频为不良视频,得出最终视频内容识别结果。

2.根据权利要求1所述的数字视频内容识别方法,其特征在于:所述不良视频语料库特征由离线提取获得,并由人为分类和更新,采用人工判定的方式将不良视频库按内容分别划分为色情、暴力、反动;对于视频帧内容识别模块无法检测出的不良视频,将该视频加载到不良视频语料库中,从而实现对不良视频语料库的更新,改变二次检测结果。

3.根据权利要求1所述的数字视频内容识别方法,其特征在于:视频拷贝检测采用基于局部平均灰度排序特征的视频拷贝检测方法,其视频拷贝检测步骤如下:

步骤1:视频关键帧抽取;

步骤2:关键帧特征提取,将关键帧平分成4*4块,分别提取每块的平均亮度特征,再结合关键帧的时间轴信息构成最终的17维特征向量;

步骤3:查询视频和目标视频相似帧的匹配,采用基于局部敏感哈希的£近邻查询模式,使得数据库中距离近的矢量视频帧聚集到一起的概率远高于距离远的矢量,从而保证以一定的概率快速得到相似帧;

步骤4:根据匹配结果生成匹配结果图,采用Floyd_warshall获得图中的所有路径信息,并获得最终的拷贝检测结果。

4.根据权利要求1所述的数字视频内容识别方法,其特征在于:视频帧内容识别采用基于图像的内容识别方法,包括:图像拷贝检测方法和色情图像识别方法。

5.根据权利要求4所述的数字视频内容识别方法,其特征在于:图像拷贝检测方法的步骤为:先将待处理图像和图像库中图像的二阶熵进行比较,从而缩小比较范围,然后用SSIM算法比较图像之间的结构相似性,取相似性最大的值作为衡量该图像是否与图像库中某一图像相似的依据。

6.根据权利要求4所述的数字视频内容识别方法,其特征在于:色情图像识别方法,包括采用四个弱分类器:皮肤区域比例分类器,人脸个数分类器,不变矩分类器,皮肤区域分布分类器,四个弱分类器分别输出四个置信度并组成一个四维特征向量,将其输入到一个强分类器中即得到最后检测结果;强分类器结果越大,内容为色情的概率越大。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010176193.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top