[发明专利]一种基于分层聚类的均衡图像聚类方法在审
| 申请号: | 201711140092.3 | 申请日: | 2017-11-16 |
| 公开(公告)号: | CN108171252A | 公开(公告)日: | 2018-06-15 |
| 发明(设计)人: | 李炜 | 申请(专利权)人: | 柳州健鱼科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京中恒高博知识产权代理有限公司 11249 | 代理人: | 宋敏 |
| 地址: | 545000 广西壮族自治区柳州市柳*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于分层聚类的均衡图像聚类方法,主要包括:步骤1:提取图像的特征数据;步骤2:对图像的特征数据进行聚类;步骤3:对步骤2得到的每个聚类簇进行切分。本发明的一种基于分层聚类的均衡图像聚类方法,可以实现效率高、节省成本以及实用性强的优点。 1 | ||
| 搜索关键词: | 聚类 均衡图像 分层 特征数据 提取图像 聚类簇 图像 | ||
步骤1:提取图像的特征数据;
步骤2:对图像的特征数据进行聚类;
步骤3:对步骤2得到的每个聚类簇进行切分。
2.根据权利要求1所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤1还包括将特征数据转换成特征矢量数据。3.根据权利要求2所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述特征矢量的每一维数值都用来表征图像的特征,包括形状、颜色、纹理和结构。4.根据权利要求1所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤2中所述聚类采用K‑Means算法。5.根据权利要求4所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述K‑Means算法将输入的特征数据划分为多个聚类,且同一聚类中的对象相似度较高,不同聚类中的聚类相似度较低。6.根据权利要求1所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤3具体包括:步骤3.1:检查聚类所包含的图像个数;
步骤3.2:在聚类簇进行二次中心聚类;
步骤3.3:将该聚类簇的中心坐标写入聚类文件中。
7.根据权利要求6所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤3还包括:如果步骤3.1中聚类中心包含的图像个数小于设置的阈值则跳转到步骤3.3,否则跳转到步骤3.2。
8.根据权利要求6所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤3.1具体包括:阈值的设定取决于服务器的计算及接口性能,由于高维空间距离计算的复杂性,我们在计算的时候忽略距离排序及归并的计算量,而着眼于使单次查询距离计算次数最小,设单次查询遍历的聚类簇个数为n。
9.根据权利要求6所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤3.2具体包括:我们的目标是保证每一个聚类簇包含的数据量不超过阈值;因此,对于包含数据量超过阈值的聚类簇,我们在该聚类簇内部进行聚类中心的k‑Means聚类,聚类得到新的聚类簇,并且这新的聚类簇包含的数据量仍可能超过阈值;对于数据量超过阈值的新聚类簇,重复执行步骤3.2的操作,直到没有聚类簇包含的数据量超过阈值。
10.根据权利要求6所述的一种基于分层聚类的均衡图像聚类方法,其特征在于,所述步骤3.3具体包括:对于包含数据量小于等于阈值的聚类簇,将该聚类簇的中心坐标写入到聚类中心文件中;聚类中心的维数与特征文件的维数相等,为了保证精度,我们将聚类中心的每一维数据保存为一个浮点数,一个聚类中心文件可能包含多个类目的聚类中心数据,而一个类目包含多个聚类中心点的坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柳州健鱼科技有限公司,未经柳州健鱼科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711140092.3/,转载请声明来源钻瓜专利网。





