[发明专利]一种基于模糊聚类的图片检索方法有效
申请号: | 201410472785.2 | 申请日: | 2014-09-16 |
公开(公告)号: | CN104298713B | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 刘瑞;左源;张辉 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙)11381 | 代理人: | 陈曦,符浩 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模糊 图片 检索 方法 | ||
技术领域
本发明涉及一种图片检索方法,尤其涉及一种基于模糊聚类的图片检索方法,属于信息检索技术领域。
背景技术
图片作为多媒体信息的重要呈现形式之一,它通过颜色、纹理、形状等丰富的视觉特征,直观、生动地使抽象数据形象化、真实化地呈现给大众。随着互联网信息传播的愈发便捷和移动终端功能的不断完善,图像信息将成为继文字之后的又一种主要的信息载体被广泛应用于信息检索、数据挖掘、人机交互等计算机重点领域。但由于图片本身存在蕴含信息复杂、环境相关性强、高层语义抽象困难、检索模式计算量大和面向海量图片的组织架构不完善等问题,与图片信息处理相关,尤其是与互联网中海量图片的检索、分析、组织管理相关的研究成为计算机领域的一个研究难点。
现有的图片检索的基本模型是根据检索图片与被检索库图片进行相似度一一比较,经过排序后选出最接近的若干张图片作为返回值,这种模型需要在每次检索时对整个图片库进行一次遍历操作,当检索访问过多时会对后来的访问者带来较长时间的等待,而且这种等待时间会随着访问者的不断增多而进一步增长。图片检索的结果来源于收集的图片库,如果要满足不同访问者的需要,或适用于不同类型图片的检索输入,图片库的规模就需要足够大,这样才能保证检索的准确度,但过大的图片库使检索的负载和响应时间呈倍增长,无法到达实时检索的要求。
为了解决上述问题,在申请号为:201010195710.6的中国发明专利中,公开了一种图像检索方法,包括训练和检索两个部分;训练部分包括以下步骤:特征点的提取;特征点的补充和匹配关系的确定;同类点集的生成;特征点集聚类;图像数据库中每幅图像特征矢量的生成;检索部分包括以下步骤:提取待检索图片的特征点,生成特征点集;计算各个特征点描述子向量到各个聚类中心的距离,以最小距离确定当前特征点所属聚类;计算待检索图片的特征点所属各个聚类的频数;基于待检索图片的特征点所属聚类的频数和所述的各聚类的概率对数生成一个特征矢量并单位化;计算待检索图片的特征矢量到图片库各图像特征矢量的欧拉距离,选取距离最小的图像输出为检索结果。
发明内容
本发明所要解决的技术问题在于提供一种基于模糊聚类的图片检索方法。
为实现上述目的,本发明采用下述的技术方案:
一种基于模糊聚类的图片检索方法,包括如下步骤:
S11,为图片库中图片构建特征值库,并为每张图片进行编号;
S12,以编号为操作对象,从图片库中选取图片间的相互距离均大于距离阙值A1的N张图片,对其余图片进行第一次归类,形成N类图片集;其中,所述从图片库中选取N张图片的过程包括如下步骤:S121, 在图片库中随意选取一张图片P,以这张图片为输入在图片库中进行检索,寻找相似度距离最大的图片Q1;S 122,以图片Q1为检索输入并将图片集划分为和Q1的相似度距离大于距离阙值A1的部分SH1,并得到相似度距离最大的图片Q2;S123,循环执行步骤S122,每次的检索图片为上一次循环得到的最不相似图片QN,被检索的图片集为上一次循环得到的SHN,直到SHN为空为止,所得到的Q1……QNN张图片即为需要选出的N个代表点;
S13,对N类图片集中所含图片数量大于数量阙值的类执行步骤 S12,选取的图片间相互距离均大于距离阙值A2,每类形成不同数量的子类别,继续在符合所含图片数量大于数量阙值的子类别中执行步骤S12,直到所有的类均小于数量阙值为止,得到M个代表点;
S14,对图片库中的所有图片,根据与M个代表点的相似程度,划分到相似程度最高的代表点所代表的图片集去,完成整个图片库类别的划分过程;
S15,对于待检索的输入图片,对其特征值化,分别计算该图片与所有代表点之间的相似度并按照大小顺序排列,选取相似度距离最近的若干个代表点,在选取的代表点所代表的图片集中进行检索,将检索结果合并后返回给用户。
一种基于模糊聚类的图片检索方法,包括如下步骤:
S21,对图片库中的图片进行编号,并将图片映射为特征值码,使用字节哈希将其分配到节点上,再存储到分布式文件系统中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410472785.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于异常处理的海量文本自动标注方法
- 下一篇:印刷品表面烘干机构