[发明专利]基于内容的互联网动画媒体垃圾信息过滤方法无效
申请号: | 200810036144.7 | 申请日: | 2008-04-17 |
公开(公告)号: | CN101276417A | 公开(公告)日: | 2008-10-01 |
发明(设计)人: | 王士林;李翔;李生红;刘功申;赵明 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 上海交达专利事务所 | 代理人: | 王锡麟;王桂忠 |
地址: | 200240*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 内容 互联网 动画 媒体 垃圾 信息 过滤 方法 | ||
技术领域
本发明涉及的是一种图像处理和模式识别技术领域的方法,特别是一种基于内容的互联网动画媒体垃圾信息过滤方法。
背景技术
随着互联网的迅速发展,宽带的迅速普及,存储成本的降低,多媒体内容在网上也越来越多。包含各种类型数据如文本、图像、音频、视频等的多媒体信息,飞速膨胀逐渐成为信息的主流,并对人们的生活和社会的发展产生了重要的影响。同时,视频压缩技术的发展让视频在体积越来越小的同时质量反而越来越高,因此,大部分网站都开始将动画融入网页之中。同时,由于数码摄像机等设备的普及,供个人传播和交换视频的网站也如雨后春笋般涌现。
这些视频信息的特点是,一方面它的信息量很大,难以用少量标注精确描述,不同的观察者或同一观察者在不同条件下对同一幅图像可能给出不同的描述。这使得在很多情况下文本标注并不能满足实际需求。另一方面它的结构化程度较低,不利于进行有效的管理。如何有效地利用多媒体信息中的相关内容已成为一个急需解决的问题。值得一提的是,在人们享受科技发达带来的便利的同时,也出现了许多用动画短片传播的广告等垃圾信息,给用户带来诸多不便。现有的多种浏览器,如Internet Explorer,Firefox等都提供了广告过滤或类似功能的模块,但是这些软件大多是通过分析其文件名的关键字来实现的,当文件名缺乏意义时将无法正确实现分类和过滤功能。
经过对现有技术文献的检索发现,Y.Alp Aslandogan等在《IEEETransactions on Knowledge and Data Engineering》vol.11,no.1,Jan.1999,(《IEEE学报知识与数据工程》1999年一月,第11卷,no.1)上发表的“图像与视频检索技术与系统”(“Techniques and Systems for Image and VideoRetrieval”),该文中提出了对于图像和视频的理解和检索的方法。对于图像:首先提取以描述图像内容为主的图像颜色、纹理和形状特征,以及非图像内容的其他相关信息(如文件名、注解等),然后通过对于图像库中的图像特征进行匹配和比对,获得对于图像的理解和检索。对于视频:首先对于视频镜头分割,然后进行目标检测和追踪,最后完成对于视频内容的理解和检索。然而,针对互联网上的动画媒体,上述方法有以下的不足:第一,动画媒体与传统的图像和视频在持续时间、镜头变化、色彩分布都存在较大的差异,其特征提取方法并不适合对于互联网动画媒体的分析和理解;第二,对于互联网动画媒体垃圾信息过滤这一新的应用来说,该方法中提出的视频特征并不具有较高的广告/非广告分类鉴别力。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于内容的互联网动画媒体垃圾信息过滤方法,根据动画媒体的特点以及垃圾信息分类过滤的特殊性,依据动画的内容对其进行理解和过滤。
本发明通过以下技术方案实现的,包括如下步骤:
步骤一,从互联网上随机采集若干个类别标引为广告和非广告的动画作为训练样本集,并提取训练样本集中所有动画的颜色特征、纹理特征、文字信息特征、动画长度特征、动画几何尺寸特征、动画的动态特征,具体如下:
根据动画中各图像帧的颜色直方图和RGB三个通道颜色均值提取动画的颜色特征;
对动画中各图像帧的灰度图进行伽博变换,提取动画的纹理特征;
对动画中各图像帧进行离散余弦变换,计算图像的边缘图,进而检测图像帧中文本块,提取动画的文字信息特征;
计算动画持续时间跨度,提取动画长度特征;
计算动画中图像帧的长度与宽度,提取动画几何尺寸特征;
计算动画各帧间的颜色差异的均值,提取动画的动态特征。
步骤二,将步骤一得到的训练样本集中的所有动画的六个特征以及相应动画的类别标引输入到支持向量机(SVM)中,支持向量机对所有样本进行训练得到权值、偏置等参数,并获得描述广告和非广告动画媒体差异的SVM模型。
步骤三,对于一个待测试动画,按照步骤一中提取动画特征的方法提取待测试动画的六个特征,并将这六个特征输入步骤二训练所得的SVM模型中,SVM模型判断出动画是属于广告类动画还是属于非广告类动画,对于广告类的动画由媒体进行过滤。
所述提取颜色特征,具体为:
①提取每个图像帧的颜色直方图,并计算所有图像帧的平均的颜色直方图特征;
②计算每个图像帧的三个颜色通道的颜色平均值,并计算所有图像帧的颜色平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810036144.7/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法