[发明专利]基于特征的动态视觉注意区域提取方法无效

专利信息
申请号: 200910046688.6 申请日: 2009-02-26
公开(公告)号: CN101493890A 公开(公告)日: 2009-07-29
发明(设计)人: 侯小笛;祁航;张丽清;祝文骏 申请(专利权)人: 上海交通大学
主分类号: G06K9/46 分类号: G06K9/46;G06T7/20
代理公司: 上海交达专利事务所 代理人: 王锡麟;王桂忠
地址: 200240*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 特征 动态 视觉 注意 区域 提取 方法
【说明书】:

技术领域

发明涉及的是一种图像处理技术领域的方法,具体地说,涉及的是一种基于特征的动态的视觉注意区域提取方法。

背景技术

随着人工智能技术地不断发展,机器视觉在现实生活中的应用越来越多,其主要用计算机来模拟人的视觉功能,但并非仅仅是人眼的简单延伸,更重要的是具有人脑的一部分功能——从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。由于机器视觉具有速度快、信息量大、功能多的特点,其在质量检测,身份认证,物体检测与识别,机器人,自动小车等的应用十分广泛。

目前工程上已经可以做出在各个方面(包括视角,视锐度,广谱性,动态特性)都超过人眼能力的传感器,可以说对“视”的探索已经到达一定程度了,但机器视觉系统不仅需要“视”,还需要“觉”。由于人的选择性注意机制保证了人眼获取信息的高效性,吸引了人们的关注和研究,各种视觉注意区域的提取技术被提出并得到了广泛的应用。例如,利用基于选择性注意机制的视觉注意区域的提取技术来找到图像中的感兴趣区域,然后优先在这些区域中进行搜索,从而提高了物体检测和识别的效率;利用找到的感兴趣区域,进行高效的图片压缩(感兴趣的区域压缩比低,其他区域压缩比高),和图片缩放(感兴趣的区域的放缩比例大于其他区域),等等。视觉注意区域的提取技术在获取信息的高效性有着巨大的优势,因而经常出现中机器视觉系统处理过程中。

经对现有技术的文献检索发现,视觉注意区域的提取技术是Koch和Ullman于1985年提出的显著地图(Saliency Map),后来该技术经Itti和Koch完善,形成一整套关于显著地图的体系。具体可以参考文献:″LAURENT I,CHRISTOF K,ERNST N.A model of saliency-based visual attention for rapid sceneanlysis[J].IEEE Transactions on PAMI,1998,20(11):1254-1259″,(作者:LAURENT I,CHRISTOF K,ERNST N,题目:一个可用于快速场景分析的基于显著度(saliency)的视觉注意模型,杂志:模式分析和机器智能IEEE会刊,1998年20卷,第11期,1254-1259页)。该方法是基于空间的提取技术,首先将图片分成颜色,方向,亮度,纹理等几个平行的通道,然后对于每个通道分别抽取信息,形成一张保留了图片拓扑结构,但同时对特征的响应强弱有记录的特征地形图(feature maps),接下来,每个特征地形图都经过一系列尺度的“墨西哥帽(Difference of Gaussian)”函数进行滤波,它是对两个不同尺度的高斯函数求差之后得到的函数。该函数对于检测变化非常敏感,而对于一而弥撒的信号反映非常弱,具有普遍的生物意义。接下来,使用竞争网络的胜者全赢(Winner-Take-All)模型对于不同的注意区域进行比较,最终生成一个关于全局每个点显著度的地图,称为显著地图。该方法以及后来的基于空间的分析技术虽然在很多场景中有很好的表现,但几乎都无可避免的面临着下面的问题:1)只能关注特定一部分视觉线索,2)注意力的分配在时间上是不连续的。例如,在对连续影像进行观测时,系统就无法考虑多帧的情况,这就导致每个时刻都需要单独地重新分析显著地图,使得系统的连续性,可靠性都大幅下降。而且,当视角以及物体的位置发生变化的时候,由于没有对特征的追踪机制,新的显著地图的预测很有可能与前帧发生偏移。此外,一系列视觉注意行为,例如返回抑制,以及视点转移等,都无法在基于空间的分析技术中得到很好的实现。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于特征的动态视觉注意区域提取方法,该方法对显著度的定义是基于特征本身,而非特征的空间分布差异,可以消除“时间片”,连续的采样,从而不同帧(时间)的数据可以一起指导显著度的处理,解决了不同帧(时间)的显著度需要独立处理的问题,实现了动态性。

本发明是通过以下技术方案实现的,包括以下步骤:

第一步,采用独立成分分析方法对大量的自然图像进行稀疏分解,得到一组滤波基函数和对应的一组重构基函数,将输入的图像分成m×m的RGB小块,并投影到这组基上,得到该图的特征;

第二步,利用有效编码原理,即当一个系统是有效编码时,其熵最大的原理,为每个特征衡量增量编码长度指标;

第三步,依据这些增量编码长度指标,通过对各个特征的能量重新分配来处理各个小块的显著度,从而最终得到显著地图。

所述的第一步,具体如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910046688.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top