[发明专利]基于改进视觉注意模型的序列图像显著区域检测方法有效
申请号: | 201410317739.5 | 申请日: | 2014-07-04 |
公开(公告)号: | CN104063872A | 公开(公告)日: | 2014-09-24 |
发明(设计)人: | 胡艳艳;韩冰;黄帅;李瑞;沙露露;仇文亮;王韵彤;柳畅 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 视觉 注意 模型 序列 图像 显著 区域 检测 方法 | ||
技术领域
本发明属于图像处理技术领域,特别涉及一种图像区域检索方法,可用于目标识别。
背景技术
视觉选择性注意机制是一个心理学和计算机学的交叉学科。“注意”是人类感知外界环境过程中的一项重要机制,正是由于“注意”机制的作用,人类才能迅速将注意力集中于少数感兴趣的信息源上,提高自身的信息处理效率。
如今随着信息科技的飞速发展,数字图像应用技术越来越受到人们的重视。数字图像所包含的数据量和信息量越来越大,而传统的图像处理算法对图像中的每个像元都赋予了同等优先级,这使得图像的时间复杂度和空间复杂度都居高不下。
心理学领域已经提出了不同的视觉注意模型,但这些模型大都仅仅适用于解释某些心理物理学实验的结果,并不能直接用于感兴趣信息源的检测。因此,如何利用计算机视觉和图像处理等理论和知识将传统图像处理算法与视觉选择性注意机制结合起来,让计算机更加主动地、有针对性地检测出视觉注意中心已经成为世界各国亟待解决的热门课题。
从所处理的信息源图像上来看,视觉注意模型可以分为空域视觉注意模型和空时视觉注意模型两大类。空域视觉注意模型是指输入图像数据是单幅图像的视觉注意模型,空时视觉注意模型是指输入图像数据是一组相同场景连续图像的视觉注意模型。
现有最著名的空域视觉注意计算模型就是视觉显著性计算模型,视觉注意是与周围环境完全与众不同的目标物会自动的从视野环境中“跳出”并且吸引注意力的关注。选择性注意力机制可以将人们的视觉关注引导到在场景中称之为“显著性区域”的那一部分。视觉的显著性计算模型提供了关于这些可能吸引观测者注意力的预测区域。这些模型在图像本身能够提供少许语义信息以及人们不需要执行特定观测任务时,能够达到良好的检测效果。Fisher在文章中“A Object-based visual attention for computer vision,Artificial Intelligence,2003,v146(1):77-123.”利用“groupings”来针对基于目标和基于位置视觉注意的通用模型。对于这种手工的预处理的图像上,他们的模型可以整个复制出人类对于人工以及自然场景的注视行为。Koch和Ullman在其文章中“Shifts in selective visual attention:Towards the underlying neural circuitry,Hum.Neurobiol.1985,4:219–297.”根据已有的视觉生理和心理物理实验结果基础上提出了一个计算模型,用于模拟生物体“自底向上”选择性注意机制。随后Itti和Koch在文章“A model of saliency-based visual attention for rapid scene analysis,IEEE Trans.Pattern Anal.Mach.Intell.1998,20:1254–1259.”中进一步完善了这个模型,并将它用于包含自然物、交通及军事目标的检测。Koch和Itti的模型将多尺度拓扑“特征图”在亮度、色度以及方向空间上检测到的图像局部空间的不连续性来作为早期基本的视觉注意特征,最后对带有不同动态范围且来自不同视觉形态的特征进行整合,得到最后的“显著性图”。该模型不需要任何先验知识,处理结果完全由输入图像的初级视觉特征决定。现在很多的基于视觉注意力模型的目标检测中,其中视觉注意力模型都是在Itti这个模型的基础之上改进的。这些模型在对目标检测的过程中,它将所有的特征等同对待,而很多时候,图像某些区域,如边界处的物体并不能引起人脑真正的视觉关注,但是由于其具有非常显著的颜色等单一特征值,因此,在最终得到的显著性图中其显著性区域是最为明显的。这和人脑真正的视觉关注是不相吻合的,且对目标的检测造成很大的误差。进一步地,有证据显示特征越多并不一定会增强显著性区域的显著性,有时候反而会导致更多的误检。因此,有必要去确定哪些特征对最后的显著图的生成起主要作用。文献“Feature combination strategies for saliency-based visual attention systems.Journal of Electronic Imaging,2001,10(1):161–169,”中,Itti等已比较了四种不同的特征整合策略。在这四种策略中,简单线性加和的方法给所有特征都赋予了正权值,这种线性加和的方法并不适合人眼的视觉习惯;学习权值的线性合成方法是无监督的学习方法,它需要关于训练图像的显著区域的先验知识;而另一个迭代的非线性局部竞争策略可以用来克服全局非线性标准化方法的缺陷。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410317739.5/2.html,转载请声明来源钻瓜专利网。