[发明专利]一种基于分类驱动的可视化词袋特征权重化方法和系统无效
申请号: | 201310285891.5 | 申请日: | 2013-07-08 |
公开(公告)号: | CN103399870A | 公开(公告)日: | 2013-11-20 |
发明(设计)人: | 金海;郑然;朱磊;冯晓文 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 朱仁玲 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分类驱动的可视化词袋特征权重化方法,包括:从网络下载图像,并建立图像数据库,提取图像数据库中所有N张图像的可视化词袋特征,建立所有N张图像的可视化词袋特征的倒排索引,从图像数据库中随机抽取N1张图像及其对应的可视化词袋特征,通过聚类算法将N1张图像形成C个视觉类,并从每个视觉类中随机选择图像组成该视觉类的学习样本集,针对每一视觉类,在该视觉类的学习样本集上建立可视化词袋特征的权重学习样本集,并利用该权重学习样本集训练每个视觉类,以形成该视觉类的支持向量机判别模型。本发明能够解决现有方法中存在的检索精度低、无法挖掘不同查询图像之间差异性的技术问题。 | ||
搜索关键词: | 一种 基于 分类 驱动 可视化 特征 权重 方法 系统 | ||
【主权项】:
一种基于分类驱动的可视化词袋特征权重化方法,其特征在于,包括以下步骤: (1)从网络下载图像,并建立图像数据库; (2)提取图像数据库中所有N张图像的可视化词袋特征,其中N为任意正整数; (3)建立所有N张图像的可视化词袋特征的倒排索引; (4)从图像数据库中随机抽取N1张图像及其对应的可视化词袋特征,通过聚类算法将N1张图像形成C个视觉类,并从每个视觉类中随机选择图像组成该视觉类的学习样本集,C为正整数; (5)针对每一视觉类,在该视觉类的学习样本集上建立可视化词袋特征的权重学习样本集,并利用该权重学习样本集训练每个视觉类,以形成该视觉类的支持向量机判别模型; (6)采用最大分类器分值原则,利用获得的支持向量机判别模型提取图像数据库中每张图像的视觉类,该视觉类为该图像的潜在类别标号,并建立每张图像的序号与该图像的潜在类别标号之间的映射关系表; (7)根据可视化词袋特征的权重学习样本集计算C个视觉类中每一个视觉类的可视词权重,并建立视觉类与该视觉类的可视词权重之间的映射关系表; (8)提取查询图像的可视化词袋特征,输入支持向量机判别模型,得到查询图像的视觉类; (9)根据查询图像的视觉类与可视词权重的映射关系表,得到该查询图像可视化词袋特征中可视词的权重,输入倒排索引文件,计算查询图像与图像数据库中所有图像之间的距离; (10)将步骤(9)中得到的距离从小到大排序,并返回给检索用户每 一个距离所对应的图像数据库中的图像,以获得检索结果; (11)判断检索结果是否满足检索用户需求,若检索用户对检索结果不满意,在检索结果中选择L张视觉感官上与查询图像相同的图像进行正反馈,调整可视词的权重,输入倒排索引,得到重排序结果;若检索用户对检索结果满意,则直接返回检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310285891.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种文件管理的方法及装置
- 下一篇:一种制备二氧化铈介孔空心球的方法