[发明专利]一种模仿视觉感知机制的自然场景类型辨识方法有效
申请号: | 201010515043.5 | 申请日: | 2010-10-21 |
公开(公告)号: | CN101964055A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 龚卫国;张睿;李伟红;杜兴;白志;黄庆忠;罗凌;熊健 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 重庆华科专利事务所 50123 | 代理人: | 康海燕 |
地址: | 400044 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模仿 视觉 感知 机制 自然 场景 类型 辨识 方法 | ||
技术领域
本发明涉及计算机视觉领域关于自然场景分析的方法,特别是涉及一种其核心部分在于模仿人类视觉感知机制的自然场景类型辨识方法。
背景技术
自然场景又称为现实世界场景,泛指真实存在的一个具有特定时空界限的物理环境。人类的视觉感知系统在漫长的自然进化中具备了极强地自然场景分析能力,其中,人类所具有的快速辨识自然场景类型的能力是目前脑神经科学和心理学的研究热点,同时也是下一代智能计算机视觉技术正在努力实现的关键技术之一。对自然场景类型的计算机辨识技术在智能视频监控、无人驾驶系统、移动式自主机器人、海量图像数据库的自动整理等实际应用中具有重要价值。
目前,对自然场景类型的计算机辨识研究主要以自然场景图像为对象。自然场景图像是真实地记录了物理环境外观与状态的图片,这些图片中包含了各种各样人们在日常生活中可能见到的自然场景类型。目前,对自然场景图像中呈现的场景类型的划分主要是依据自然场景图像的语义外观。最早的研究者们将自然场景图像划分为“室内”与“室外”两大类,或者是“城市”与“自然风光”两大类。近年来,有研究者开始探索更为细化的语义分类标准,例如:麻省理工学院的Aude Oliva等人将自然场景图像按语义外观划分为海岸、森林、山脉、旷野、市内、街道、高速公路、高层建筑等8大类;之后,斯坦福大学的Li Fei-Fei和北卡罗来纳大学的Svetlana Lazebnik等人又分别在上述的8类语义分类标准基础之上,扩展出了针对自然场景图像的13类语义分类标准和15类语义分类标准。目前,自然场景类型的计算机辨识技术的核心关键在于如何利用计算机有效地提取出自然场景图像中蕴含的语义信息,从而实现对自然场景类型的快速、准确辨识。
到目前为止,各种自然场景类型辨识技术都可以归结为以下四大途径:基于物体识别的场景类型辨识方法,基于图像区域识别的场景类型辨识方法,基于语境分析的场景类型辨识方法,以及模仿生物视觉机制的场景类型辨识方法。基于物体识别的方法需要首先辨识出场景中存在的物体再藉此推断场景所属的语义类型,该方法受限于物体识别技术的不成熟,目前已经较少使用。基于图像区域识别的方法则首先将场景图像分割为若干子区域,然后识别出每个子区域的语义,最后通过分析子区域的语义组合来推断场景所属的语义类型;由于图像分割技术远未成熟,因此这类方法的发展也受到了较大的限制。基于语境分析的方法通过直接建立图像底层特征(形状、纹理、色彩等)与高层语义之间的对应关系来实现对自然场景类型的辨识,此类方法在近年来获得了很大的成功,是目前比较主流的方法;但是,该类方法的缺点在于实现过程比较复杂,需要人工选择和设定较多参数,而且其处理过程无法与人类视觉系统的工作机制相对应。而模仿生物视觉机制的场景类型辨识方法,则通过模仿人类视觉系统对自然场景中语义信息的感知机制来实现对自然场景类型的有效辨识,该类方法在实现过程上与人类视觉系统的工作机制有较好的对应,无需人工选择和设定大量参数,而且在算法的实现上也通常较以上三种方法更简单、计算复杂度更低且鲁棒性更好,因此模仿生物视觉机制的方法被认为是该领域未来的发展方向。
模仿生物视觉机制的场景类型辨识方法实际上是从基于语境分析的场景类型辨识方法上发展起来的,两者的关键区别在于对自然场景图像底层特征的提取方式不同。基于语境分析的场景类型辨识方法利用的是一些传统的、通用的图像特征提取方法,由于没有充分挖掘自然场景图像所具有的独特视觉统计特性,因此无法保证所提取的图像特征能够真正反映自然场景图像中隐含的本质特性。而模仿生物视觉机制的场景类型辨识方法则从分析自然场景图像所具有的视觉统计特性入手,通过模仿人类视觉系统在感知自然场景图像固有统计特性时呈现的生理机制,构建出一种更具有针对性的自然场景图像特征提取方法,然后利用所提取的有效特征实现对自然场景图像类型的辨识。
发明内容
本发明所要解决的技术问题在于提供一种模仿视觉感知机制的自然场景类型辨识方法。该方法通过模仿人类视觉感知系统在处理自然场景图像时的生物机制,获得了一种能够有效对应于自然场景图像语义类型的图像统计性特征,利用该特征可以有效地提高计算机对自然场景图像进行场景类型辨识的正确率。
本发明的技术方案如下:
首先,需要具备一个自然场景图像样本集,该图像样本集必须满足以下条件:
(1)样本集中所有图像样本反映的内容必须为场景,而不是其他的内容;
(2)样本集中具有N个不同的自然场景类型,N为大于2的自然数;
(3)样本集中的每一个图像样本都唯一的归属于上述N个自然场景类型中的一种;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010515043.5/2.html,转载请声明来源钻瓜专利网。