[发明专利]一种图片聚类的方法及装置有效
申请号: | 201210144457.0 | 申请日: | 2012-05-10 |
公开(公告)号: | CN103390165B | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 文林福 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 方法 装置 | ||
1.一种图片聚类方法,包括:
A.提取多张输入图片的全局特征和局部特征;
B.根据所述全局特征对所述输入图片进行初次聚类,以得到初步聚类结果,其中所述初步聚类结果包括一个以上的图片组;
C.根据所述局部特征分别对每个图片组内的图片进行二次聚类,以将每个图片组内的图片分为一个以上的集合,得到所述输入图片的二次聚类结果;
其中,根据所述局部特征分别对每个图片组内的图片进行二次聚类的步骤具体包括:
针对每个图片组,建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引;利用所述倒排索引,将拥有共同特征分量数超过预设值的图片归为一类,得到每个图片组内的一个以上的集合;
所述方法进一步包括:在对输入图片进行聚类之后,对聚类结果中相同集合的图片赋予统一标识;
对输入图片进行初次聚类包括:
从输入图片中选取一定数量的图片作为样本图片,利用样本图片确定K个聚类中心,其中K为自然数;将输入图片中除样本外的剩余图片分为K份,其中每份图片对应一个聚类中心,利用分布式计算平台,将每份图片中的每张图片分别与对应的聚类中心进行相似度比较,并将当前比较的图片归到最相似的聚类中心所在类。
2.根据权利要求1所述的方法,其特征在于,所述步骤A中提取所述输入图片的多个全局特征;
所述步骤B中根据每个全局特征分别对所述输入图片进行初次聚类,以得到与每个全局特征对应的初次聚类结果,其中每个初次聚类结果包含一个以上的图片组;
所述步骤C中针对与每个全局特征对应的初次聚类结果,根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类,以将每个图片组内的图片分为一个以上的集合,得到所述输入图片与每个全局特征对应的二次聚类结果;
所述方法进一步包括:将各二次聚类结果进行合并,得到所述输入图片的最终聚类结果。
3.根据权利要求2所述的方法,其特征在于,将各二次聚类结果进行合并的步骤具体包括:
将各二次聚类结果包含的集合中,两两之间存在交集的多个集合合并为一个集合。
4.根据权利要求2所述的方法,其特征在于,所述多个全局特征中包含第一全局特征,其中所述第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。
5.根据权利要求2所述的方法,其特征在于,所述多个全局特征中包含第二全局特征,其中所述第二全局特征为Gist特征。
6.根据权利要求1所述的方法,其特征在于,所述步骤B中采用K-means方法对所述输入图片进行初次聚类。
7.根据权利要求1所述的方法,其特征在于,所述全局特征为:颜色、纹理或形状特征;所述局部特征为SIFT特征。
8.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
将所述二次聚类结果中的包含图片数量大于设定值的集合中的图片作为热门图片,所述热门图片用于在搜索引擎系统中作为优先返回的检索结果。
9.一种图片聚类的装置,包括:
特征提取单元,用于提取多张输入图片的全局特征和局部特征;
分组单元,用于根据所述全局特征对所述输入图片进行初次聚类,以得到初步聚类结果,其中所述初步聚类结果包括一个以上的图片组;所述对输入图片进行初次聚类包括:从输入图片中选取一定数量的图片作为样本图片,利用样本图片确定K个聚类中心,其中K为自然数;将输入图片中除样本外的剩余图片分为K份,其中每份图片对应一个聚类中心,利用分布式计算平台,将每份图片中的每张图片分别与对应的聚类中心进行相似度比较,并将当前比较的图片归到最相似的聚类中心所在类;
确定单元,用于根据所述局部特征对每个图片组内的图片进行二次聚类,以将每个组内的图片分为一个以上的集合,得到所述输入图片的二次聚类结果;
所述确定单元具体包括:
索引单元,用于针对每个图片组,建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引;
归类单元,用于利用所述倒排索引,将拥有共同特征分量数超过预设值的图片归为一类,得到每个图片组内的一个以上的集合;
所述装置进一步包括:标识单元,用于为聚类结果中的相同集合的图片赋予统一标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210144457.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:卡号的识别处理方法及读卡设备
- 下一篇:分布式发电物联网控制系统