[发明专利]一种多特征的概率主题模型的图像场景分类方法在审
| 申请号: | 201811077631.8 | 申请日: | 2018-09-15 |
| 公开(公告)号: | CN109325434A | 公开(公告)日: | 2019-02-12 |
| 发明(设计)人: | 孙雪莹;陈锦言 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 概率主题模型 视觉词典 视觉主题 图像场景 训练图像 视觉 训练图像集 测试图像 分类图像 局部颜色 均值算法 提取图像 图像分块 纹理特征 向量表示 训练样本 主题分布 最优化 分类 分块 量化 概率 应用 学习 | ||
本发明涉及一种多特征的概率主题模型的图像场景分类方法,包括:将训练图像集中所有图像分块,分块大小为9×9,对每个块提取图像的局部颜色、SIFT和纹理特征;将提取的特征用向量表示,用K‑均值算法生成视觉词典;量化视觉词典中的视觉词,得到训练图像集上的特征视觉词分布;应用LDA模型,得到训练样本中各视觉词所属主题Z的分布与各训练图像主题概率θ的分布情况;将得到的视觉主题分布输入KNN‑SVM分类器,最优化KNN‑SVM分类器的参数K、V和Z;对测试图像集中的未分类图像,用LDA模型学习得到对应的视觉主题分布;将LDA处理得到的主题分布输入KNN‑SVM分类器。
技术领域
本发明涉及一种融合颜色特征、SIFT特征和纹理特征的图像场景分类方法,特别是一种基于LDA概率主题模型的图像场景分类方法。
背景技术
场景图像分类是机器人学研究面临的一个基本问题,也是计算机视觉领域的一项重要任务。近年来,随着机器视觉技术的快速发展,涌现出众多场景分类方法和技术,这些方法涉及面非常广泛。所谓场景图像分类,是指对给定的图像,通过观察它所包含的内容,进而判断其拍摄场景的类别。在机器人学研究领域,为了能够实时地估计机器人在所处环境中的位置及方向,通常需要为其建立一个能同时完成地图和定位的系统,而场景图像分类正是该系统开发中的关键环节。在计算机视觉领域,随着互联网多媒体技术的迅速发展,涌现出海量的复杂图像数据,为了有效对这些数据进行分析和管理,需要根据图像内容为其贴上语义标签,而场景图像分类恰巧是解决该类问题的一种重要途径。
常见场景可以大致分为4类:自然场景、城市场景、室内场景和事件场景。由于不同场景构成元素的差别较大,同一种分类方法在不同的场景数据集上的分类效果经常存在较大的差异,而这种差异在室外场景和室内场景之间尤为显著。在早期,场景图像分类主要采用基于低级特征的方法和基于场景图像结构的方法;而在后期,场景图像分类主要采用基于视觉词汇的方法。因此,场景图像分类的研究方法大体可分为三类:基于低级特征的方法,基于场景图像结构的方法和基于视觉词汇的方法。
在场景分类的历史上,SIFT(scale-invariant feature transform)是一种比较流行的图像描述子。是为了识别在不同图像中出现的同一目标,它对于平移、缩放、旋转、光照甚至遮挡等情况都能保持一定的稳定性,具有强大、突出的辨别能力。纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质.但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的.与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算.在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功.作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力.
发明内容
本发明的目的是提供一种融合颜色特征、纹理特征和SIFT特征的概率主题模型进行场景图像的分类方法,本发明能够明显提高分类的效果。技术方案如下:
一种多特征的概率主题模型的图像场景分类方法,包括下列步骤:
步骤1:在数据集中随机选择三分之二的图像作为训练集合;将训练图像集中所有图像分块,分块大小为9×9,对每个块提取图像的局部颜色、SIFT和纹理特征;
步骤2:将提取的特征用向量表示,用K-均值算法生成视觉词典;
步骤3:量化视觉词典中的视觉词,得到训练图像集上的特征视觉词分布;
步骤4:应用LDA模型,得到训练样本中各视觉词所属主题Z的分布与各训练图像主题概率θ的分布情况;
步骤5:将得到的视觉主题分布输入KNN-SVM分类器,使用训练图像集中的图像进行实验,最优化KNN-SVM分类器的参数K、V和Z;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811077631.8/2.html,转载请声明来源钻瓜专利网。





