[发明专利]一种图片聚类的方法及装置有效
申请号: | 201210144457.0 | 申请日: | 2012-05-10 |
公开(公告)号: | CN103390165B | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 文林福 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 方法 装置 | ||
【技术领域】
本发明涉及图片处理技术,特别涉及一种图片聚类的方法及装置。
【背景技术】
对海量图片进行聚类,根据聚类结果对同一类的图片进行相应处理,是图片搜索引擎向用户返回准确的检索结果的前提。例如,对海量图片进行聚类处理,根据聚类结果,将同一类中的重复图片去除,可以实现对海量图片的去重工作,这样用户在海量图片数据库中进行图片检索时,针对相同关键词可以得到尽可能丰富的结果。
在现有技术中,对海量图片进行聚类,通常采用的方法是抽取图片的全局特征,然后通过比较不同图片的全局特征的相似度将相似图片聚为一类。在现有技术的方法对海量图片进行聚类时,准确度和召回率都不够高。
【发明内容】
本发明所要解决的技术问题是提供一种图片聚类的方法及装置,以解决现有技术对海量图片进行聚类时,准确度和召回率较低的缺陷。
本发明为解决技术问题而采用的技术方案是提供一种图片聚类方法,包括:A.提取多张输入图片的全局特征和局部特征;B.根据所述全局特征对所述输入图片进行初次聚类,以得到初步聚类结果,其中所述初步聚类结果包括一个以上的图片组;C.根据所述局部特征分别对每个图片组内的图片进行二次聚类,以将每个图片组内的图片分为一个以上的集合,得到所述输入图片的二次聚类结果。
根据本发明之一优选实施例,所述步骤A中提取所述输入图片的多个全局特征;所述步骤B中根据每个全局特征分别对所述输入图片进行初次聚类,以得到与每个全局特征对应的初次聚类结果,其中每个初次聚类结果包含一个以上的图片组;所述步骤C中针对与每个全局特征对应的初次聚类结果,根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类,以将每个图片组内的图片分为一个以上的集合,得到所述输入图片与每个全局特征对应的二次聚类结果;所述方法进一步包括:将各二次聚类结果进行合并,得到所述输入图片的最终聚类结果。
根据本发明之一优选实施例,将各二次聚类结果进行合并的步骤具体包括:将各二次聚类结果包含的集合中,两两之间存在交集的多个集合合并为一个集合。
根据本发明之一优选实施例,所述多个全局特征中包含第一全局特征,其中所述第一全局特征融合了颜色特征描述子、纹理特征描述子、形状特征描述子或空间关系特征描述子中的至少两个。
根据本发明之一优选实施例,所述多个全局特征中包含第二全局特征,其中所述第二全局特征为Gist特征。
根据本发明之一优选实施例,所述步骤B中采用K-means方法对所述输入图片进行初次聚类。
根据本发明之一优选实施例,所述全局特征为:颜色、纹理或形状特征;所述局部特征为SIFT特征。
根据本发明之一优选实施例,根据所述局部特征分别对每个图片组内的图片进行二次聚类的步骤具体包括:针对每个图片组,建立所述局部特征中各特征分量与图片组中的各图片之间的倒排索引;利用所述倒排索引,将拥有共同特征分量数超过预设值的图片归为一类,得到每个图片组内的一个以上的集合。
根据本发明之一优选实施例,所述方法进一步包括:将所述二次聚类结果中的包含图片数量大于设定值的集合中的图片作为热门图片,所述热门图片用于在搜索引擎系统中作为优先返回的检索结果。
本发明还提供了一种图片聚类的装置,包括:特征提取单元,用于提取多张输入图片的全局特征和局部特征;分组单元,用于根据所述全局特征对所述输入图片进行初次聚类,以得到初步聚类结果,其中所述初步聚类结果包括一个以上的图片组;确定单元,用于根据所述局部特征对每个图片组内的图片进行二次聚类,以将每个组内的图片分为一个以上的集合,得到所述输入图片的二次聚类结果。
根据本发明之一优选实施例,所述特征提取单元提取所述输入图片的多个全局特征;所述分组单元根据每个全局特征分别对所述输入图片进行初次聚类,以得到与每个全局特征对应的初次聚类结果,其中每个初次聚类结果包含一个以上的图片组;所述确定单元针对与每个初次聚类结果,根据所述局部特征分别对该初次聚类结果中的每个图片组内的图片进行二次聚类,以将每个图片组内的图片分为一个以上的集合,得到所述输入图片与每个全局特征对应的二次聚类结果;所述装置进一步包括:合并单元,用于将各二次聚类结果进行合并,得到所述输入图片的最终聚类结果。
根据本发明之一优选实施例,所述合并单元将各二次聚类结果进行合并的方式具体包括:将各二次聚类结果包含的集合中,两两之间存在交集的多个集合合并为一个集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210144457.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:卡号的识别处理方法及读卡设备
- 下一篇:分布式发电物联网控制系统