[发明专利]基于潜在狄利克雷分配的自然图像分类方法有效
申请号: | 201310296468.5 | 申请日: | 2013-07-14 |
公开(公告)号: | CN103366175A | 公开(公告)日: | 2013-10-23 |
发明(设计)人: | 焦李成;马文萍;韩冰;王爽;马晶晶;侯彪;白静;田小林 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06F17/30 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 潜在 狄利克雷 分配 自然 图像 分类 方法 | ||
技术领域
本发明属于图像处理技术领域,涉及一种对自然图像的分类方法,可用于目标识别。
背景技术
近年来,图像数量的大量激增给图像识别、检索以及分类等问题带来了巨大的挑战。如何在浩瀚的数据中准确获得用户所需信息并进行处理,成为该领域亟待解决的问题之一。自然图像分类的目的是根据图像中所包含的内容将图像划分为不同的类别,供后续处理或便于管理。经典的自然图像分类方法包括:
基于词袋模型的自然图像分类方法。该方法是由Csurka G等人将词袋BoW模型的思想移植到图像处理领域,见Csurka G,Dance C,Fan L,et al.Visual Categorization with Bags of Keypoints.Workshop on statistical learning in compute vision,ECCV.2004,1:22.,其主要思想是通过对图像进行特征提取和描述,得到大量特征进行处理,从而得到用来表示图像的关键词,并在此基础上构建视觉词典,然后对待分类图像采用相同的处理方法,将结果代入到训练的分类器中进行分类。然而,词袋模型在计算机视觉领域的应用的缺陷是在应用于图像分类时分类精度不够高,且分类时间较长。
基于潜在狄利克雷分配的自然图像分类方法。该方法是由David M.Blei等人在pLSA模型的基础上进行扩展,提出了潜在狄利克雷分配LDA,对于像语料库这样的离散数据的收集建立了概率模型,见Blei,D.M.,Ng,A.Y.,Jordan,M.I.Latent Dirichlet Allocation.Journal of Machine Learning Research3:993-1022,2003。随后Fei Fei Li等人将该模型应用于自然场景分类,见Fei-Fei L,Perona P.A bayesian hierarchical model for learning natural scene categories.Computer Vision and Pattern Recognition,2005.CVPR2005.IEEE Computer Society Conference on.IEEE,2005,2:524-531。该方法相较于词袋模型方法虽然大大缩短了分类时间,但却降低了分类精度。
发明内容
本发明的目的在于针对已有技术的不足,提出一种基于潜在狄利克雷分配的自然图像分类方法,以提高分类效果。
为实现上述目的,本发明包括如下步骤:
1、基于多特征的潜在狄利克雷分配的自然图像分类方法,包括如下步骤:
(1)将每一幅自然图像的彩色空间转换为HIS空间,得到其色调H、饱和度S和亮度I特征图,通过谱残差的方法获取自然图像的显著S特征图;
(2)采用网格分块方法分别对每幅自然图像的色调特征图、饱和度特征图、亮度特征图和显著特征图分别进行网格稠密采样,得到每一个特征图相应的网格采样点;
(3)对每一个网格采样点提取其周围区域的尺度不变特征转换SIFT特征;
(4)对所有自然图像的色调特征图、饱和度特征图、亮度特征图和显著特征图提取出来的SIFT特征分别进行K聚类,即共进行四次K聚类,每次K聚类均生成一个视觉词典和n个聚类中心,每次K聚类生成n个聚类中心对应于一个视觉词典中的n个视觉单词,从而生成四个均由n个视觉单词构成的视觉词典;
(5)量化每幅自然图像的色调特征图、亮度特征图、饱和度特征图和显著特征图为视觉文档,并用每幅自然图像的色调特征图、亮度特征图、饱和度特征图和显著特征图中网格采样点的SIFT特征分别与这四幅特征图对应的视觉词典中的每个视觉单词进行比较,找出与每幅自然图像的所有特征图中网格采样点的SIFT特征最相近的视觉单词来代替该SIFT特征,使得每幅自然图像的所有特征图均由n个视觉单词表示,即用量化后每幅自然图像的色调特征图、饱和度特征图、亮度特征图和显著特征图,作为由n个视觉单词构成的视觉文档;
(6)将所述视觉文档顺次相连后,输入给潜在狄利克雷分配LDA模型进行若干次Gibbs采样迭代,得到每幅自然图像的潜在语义主题分布;
(7)将所有自然图像的潜在语义主题分布输入给支持向量机SVM分类器进行分类,选择所有自然图像的一半的图像作为训练样本,另一半的图像作为测试样本,得到分类结果。
本发明与现有的技术相比具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310296468.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种倾斜式助凝水冷坩埚
- 下一篇:热镀锌线炉鼻内部锌渣清除装置