[发明专利]基于Fisher Vector的图像精细分类方法有效
申请号: | 201610390209.2 | 申请日: | 2016-06-03 |
公开(公告)号: | CN106056159B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 田小林;焦李成;薛鹏龙;张小华;马文萍;朱虎明;缑水平 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 韦全生;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于Fisher Vector的图像精细分类方法,用以解决现有图像精细分类方法中存在分类准确率低的技术问题,包括如下步骤:读取图像库数据,得到包含各个类别的训练图像集和测试图像集;提取训练图像集和测试图像集中每幅图像的RGB特征;求取关于训练图像集RGB特征描述的混合高斯参数;求取匹配图像块集的Fisher Vector特征矢量;求取训练图像集的最终特征描述和测试图像集的最终特征描述;利用SVM对训练图像集的最终特征描述进行训练,得到分类模型;利用分类模型对测试图像集的最终特征描述进行分类。本发明具有分类准确率较高的优点,可应用于互联网通信、交通和公共安全领域。 | ||
搜索关键词: | 基于 fisher vector 图像 精细 分类 方法 | ||
【主权项】:
1.一种基于Fisher Vector的图像精细分类方法,包括以下步骤:(1)依照图像库自带文本文档中的图像采样编号,读取图像库中各种类中对应的训练图像和测试图像,得到了包含所有种类的训练图像集和测试图像集;(2)从得到的训练图像集和测试图像集中提取每幅图像的RGB特征,得到训练图像集的RGB特征描述和测试图像集的RGB特征描述,按如下步骤实现;(2a)利用简单的线性迭代聚类SLIC超像素分割方法,对得到的训练图像集和测试图像集中的图像进行分割,每幅得到多个带有标签的超像素块;(2b)提取得到的多个超像素块的RGB特征,得到每幅训练图像的RGB特征描述和测试图像的RGB特征描述;(2c)将得到训练图像RGB特征描述和测试图像的RGB特征描述进行汇总,得到训练图像集的RGB特征描述或测试图像集的RGB特征描述;(3)利用训练图像集的RGB特征描述,求取训练图像集的RGB特征描述的混合高斯参数;(4)求取匹配图像块集的Fisher Vector特征矢量,按如下步骤实现:(4a)依次沿着得到训练图像集中每幅图像的XY坐标,随机提取相同数目的匹配图像块;(4b)将提取的匹配图像块和其所对应的训练图像,进行含有超像素块的标签比对,获得每个图像块的RGB特征描述;(4c)利用得到的混合高斯参数,分别列出每个匹配图像块的RGB特征描述的似然函数,求取每个似然函数的梯度向量,并对求取的每个似然函数的梯度向量均进行归一化,得到每个匹配图像块的Fisher Vector特征矢量;(4d)对得到的所有匹配图像块的Fisher Vector特征矢量进行汇总,得到匹配图像块集的Fisher Vector特征矢量;(5)求取训练图像集的最终特征描述和测试图像集的最终特征描述,按如下步骤可实现:(5a)将得到的匹配图像块集的Fisher Vector特征矢量分别与训练图像集和测试图像集中的每幅图像进行遍历匹配,得到每幅图像的匹配响应图集;(5b)统计得到的匹配响应图集中每个响应图相似度最大的三个值,作为该响应图的第一层编码;(5c)沿得到的匹配响应图集中每个响应图的两条几何中心线,将其分割成四个区域,并将每个区域中相似度最大的值,作为该响应图的第二层编码;(5d)依次对得到第一层编码和第二层编码进行组合,得到每个响应图的金字塔编码;(5e)对得到的所有响应图的金字塔编码进行汇总,得到响应图集的金字塔编码,并将响应图集的金字塔编码作为该幅图像的最终特征描述;(5f)按照每幅图像取自于训练图像集或测试图像集,对每幅图像的特征描述进行汇总得到训练图像集的最终特征描述和测试图像集的最终特征描述;(6)利用SVM支撑向量机,对得到的训练图像集的最终特征描述进行训练,得到分类模型;(7)利用得到的分类模型,对得到的测试图像集的最终特征描述进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610390209.2/,转载请声明来源钻瓜专利网。
- 上一篇:用于机器人操作系统的消息传输方法和装置
- 下一篇:媒体文件的投放方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序