[发明专利]一种基于视觉词典库实现图像快速检索的方法及系统在审
申请号: | 201710978931.2 | 申请日: | 2017-10-19 |
公开(公告)号: | CN107730357A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 李杰 | 申请(专利权)人: | 上海斐讯数据通信技术有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/30;G06K9/62 |
代理公司: | 杭州千克知识产权代理有限公司33246 | 代理人: | 周希良,吴辉辉 |
地址: | 201616 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 词典 实现 图像 快速 检索 方法 系统 | ||
技术领域
本发明涉及一种图像检索领域,尤其涉及一种基于视觉词典库实现图像快速检索的方法及系统
背景技术
在当今快速发展的互联网技术和多媒体信息时代的背景下,人们对于多媒体信息的利用得到了充分的展示,而人们在商城中购买某个物品时只知道物品的图像,却总是需要东奔西走才能找到对应商品的陈列位置,在寻找的过程中既浪费了时间还可能无法购买到心仪的商品。
随着多媒体技术的快速发展,以计算机技术为基础的视觉研究和数据库技术的广泛使用,使得图像检索技术快速发展,通过从图像的自身来提取到图像的特征,以图像自身的特征来检索得到类似的图像,将商城的商品图像的特征信息先提取出来,再建立视觉词典库,当人们在购买商品时就可以通过输入想要的商品的图像直接检索到对应的商品信息,能够节省购买者大量的寻找时间。
专利号为CN102208038A的专利提供了一种基于视觉词典的图像分类方法,包括以下步骤:S1:抽取训练图像数据集的联合局部特征;S2:通过基于移动均值和区域哈希法的聚类算法对所述联合局部特征进行向量矢量化,从而选择聚类中心个数,以形成视觉词典;S3:根据所述视觉词典生成图像的特征表示,以建立图像分类器;S4:根据所述图像分类器分类所述训练图像数据集中的图像。该发明通过形成视觉词典,通过视觉词典生成的图像特征建立图像分类器并将图像进行分类,但是该发明无法达到检索图像的目的,在用户需要通过图像无法检索到对应的目标图像。
发明内容
本发明要解决的技术问题目的在于提供一种基于视觉词典库实现图像快速检索的方法及系统,用以解决用户在购买商品时无法快速的寻找到对应商品位置信息的问题。
为了实现上述目的,本发明采用的技术方案为:
一种基于视觉词典库实现图像快速检索的方法,包括步骤:
S1:接收样本图像数据集,提取所述样本图像的所有视觉特征,并通过所述样本图像ID名称标识该样本图像的所有视觉特征;
S2:将所述视觉特征量化成样本图像特征向量以生成视觉词典库;
S3:提取待检索图像的视觉特征,并量化成待检索图像特征向量;
S4:将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行度量对比,输出与所述检索图像相匹配的样本图像。
进一步的,所述步骤S2还包括步骤:
将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类以形成聚类簇并对聚类簇进行分裂,当所述聚类簇达到预设分裂次数时,完成聚类。
进一步的,所述步骤S2还包括步骤:
将所述样本图像提取到的特征向量映射到聚类形成的聚类簇上,获取所述样本图像的视觉表示词汇;
进一步的,还包括步骤:
提取所述样本图像对应的ID名称及所述图像的视觉词汇表示,生成视觉词典库。
进一步的,所述步骤S3还包括步骤:
计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离;
获取所述欧式距离小于预设阈值的特征向量对应的样本图像ID名称,并将所述样本图像输出。
一种基于视觉词典库实现图像快速检索的系统,包括:
标识模块:用于接收图像样本数据集,提取所述样本图像的视觉特征,并通过所述样本图像ID名称标识该样本图像的所有视觉特征;
生成模块:用于将所述视觉特征量化成样本图像特征向量以生成视觉词典库;
量化模块:用于提取待检索图像的视觉特征,并量化成待检索图像特征向量;
对比输出模块:用于将所述待检索图像的特征向量与视觉词典库中的样本图像特征向量进行对比,输出与所述检索图像相匹配的样本图像。
进一步的,所述生成模块还包括:
聚类单元:用于将提取到的所述样本图像的视觉特征集合按照层次聚类法进行聚类以形成聚类簇并对聚类簇进行分裂,当所述聚类簇达到预设分裂次数时,完成聚类。
进一步的,所述生成模块还包括:
映射单元:用于将所述图像提取到的特征向量映射到聚类形成的聚类簇上,获取所述样本图像的视觉表示词汇;
进一步的,还包括:
生成单元:用于提取所述样本图像对应的ID名称及所述图像的视觉词汇表示,生成视觉词典库。
进一步的,所述对比输出模块还包括:
计算单元:用于计算待检索图像的特征向量与视觉词典库中的样本图像特征向量的欧式距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斐讯数据通信技术有限公司,未经上海斐讯数据通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710978931.2/2.html,转载请声明来源钻瓜专利网。