[发明专利]一种结合深度学习与稀疏表示的室内场景识别方法有效
申请号: | 201611120285.8 | 申请日: | 2016-12-08 |
公开(公告)号: | CN106650798B | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 孙宁;朱小英;刘佶鑫;李晓飞 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 徐莹 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 深度 学习 稀疏 表示 室内 场景 识别 方法 | ||
本发明公开了一种结合深度学习与稀疏表示的室内场景识别方法,包括步骤:从室内场景库中随机挑选若干张室内场景图像作为训练样本,将剩余作为测试样本;利Fast‑RCNN算法对训练和测试样本进行物体类别判别和检测,以构建得到每张室内场景图像的底层特征;利用词袋模型将每张室内场景图像的底层特征和空间特征结合,构建得到中层特征;对训练样本中的中层特征进行糅合构建得到稀疏字典;利用稀疏字典对测试样本进行稀疏表示,及根据求解出的稀疏解与所输入的测试样本计算得到残差,并根据残差的大小判断测试样本所属的物体类别;将判断得到所属的物体类别输出。本发明能准确识别室内场景,可有效提高室内场景识别的准确率和鲁棒性,具有很高的实用性能。
技术领域
本发明涉及一种结合深度学习与稀疏表示的室内场景识别方法,属于图像处理技术的技术领域。
背景技术
随着信息技术和智能机器人的发展与普及,场景识别作为重要的研究内容,已成为计算机视觉和模式识别领域的重要研究问题。场景图像分类是依据一组给定的语义标签来对图像数据集进行自动分类。场景识别模型主要分为三大块:基于低级特征、基于中级特征、基于视觉词汇。所谓低级特征,即对场景图像提取全局或者分块的纹理、颜色等特征对场景图像进行分类,比如Valiaya和Szumme等人的研究,但是这种提取底层特征的方法只适用于比较简单的场景或者场景差别较大的图像场景(沙滩和蓝天、室内和室外等),因而人们又继续进行探索,David G[6]提出了一种基于尺度空间的、具有图像缩放、旋转和仿射不变形的图像局部特征描述算子SIFT,Dalal等人提出了HOG图像局部特征,得到了高性能的底层特征。随着人们对图像识别研究领域的深入,人们逐渐发现仅仅提取底层特征不能有效解决语义鸿沟问题,因此构建中层特征作为一个新的研究思路,引起了广大研究者们的关注,其中最具代表性的是视觉词袋模型(Bag of visual Words,BoW),但它是将图像表示成了一个无序局部特征集的特征包方法,忽略了所有的关于图像块的位置信息,为了解决这个问题,Lazebnik等人提出一种基于空间金字塔匹配(Spatial Pyramid Matching,SPM)的方法来改进传统的BoW模型,取得了较好的识别效果。
当把上述方法应用在室内场景识别时,识别效果显著下降,究其原因是室内场景主要存在类内差异大类间差异小、遮挡、尺度、角度变化等原因,比如同是书店,有可能只有书柜和书,也有可能只有书,而书店和图书馆两个场景同时有书柜和书。为此,Vogel和Schiele[12]最早提出了采用局部区域目标来对自然场景进行建模的方法。因此,基于目标的高层图像表示方法被相继提出,如Li-feifei等提出的目标银行模型,这些方法将目标作为图像的基本元素,通过分析图像中所包含的一系列目标来进一步分类场景图像,但是由于室内场景图像较复杂,目前并没有一种特别好的解决室内场景图像识别效果差的方法,其识别仍然普遍偏低,无法满足现实的需求。
发明内容
本发明所要解决的技术问题在于克服现有技术的不足,提供一种结合深度学习与稀疏表示的室内场景识别方法,解决由于目前室内场景类内差异大类间差异小、遮挡、尺度、角度变化等原因,造成了目前室内场景识别相比较于室外场景识别来说其复杂度和困难性更大,因而识别效果差的问题,以提高室内场景识别算法的识别率和鲁棒性。
本发明具体采用以下技术方案解决上述技术问题:
一种结合深度学习与稀疏表示的室内场景识别方法,包括以下步骤:
步骤A、从室内场景库中随机挑选若干张室内场景图像作为训练样本,及将室内场景库中剩余的室内场景图像作为测试样本;
步骤B、利用Fast-RCNN算法对所述训练样本和测试样本进行物体类别判别和检测,得到训练样本和测试样本中每张室内场景图像中包含的物体类别、位置和分值信息,以构建得到每张室内场景图像的底层特征;
步骤C、利用词袋模型根据所述训练样本和测试样本中每张室内场景图像的底层特征,构建得到每张室内场景图像的中层特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611120285.8/2.html,转载请声明来源钻瓜专利网。