[发明专利]基于词汇树层次语义模型的图像检索方法有效
申请号: | 201210422998.5 | 申请日: | 2012-10-29 |
公开(公告)号: | CN103020111A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 吴健;崔志明;张月辉;李承超 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 陶海锋 |
地址: | 215123 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 词汇 层次 语义 模型 图像 检索 方法 | ||
技术领域
本发明涉及一种图像检索的方法,具体涉及一种基于内容的图像检索方法,尤其是一种考虑图像所包含的图像高层语义信息,并加入用户对图像内容理解和检索结果反馈的方法。
背景技术
随着因特网和多媒体技术的迅速发展,从20世纪90年代初至今,基于内容的图像检索(CBIR)得到了广泛的研究。
现有图像检索技术中,由于其使用图像纹理、颜色和形状等低层特征作为索引来对图像进行检索,而图像低层特征表达出的信息与用户对这些特征图像理解的含义存在不一致性,即语义鸿沟,所以检索效果往往不能满足用户的需求。
如果检索过程中能够考虑图像所包含的图像高层语义信息,加入用户对图像内容的理解,则会是一种更贴近用户理解的图像检索。然而,目前语义检索中语义映射关系大多是通过人工标注建立,对于待检索图像中的语义信息难以获得较好的映射,并且,建立的映射关系不能随着用户检索的反馈信息自动进行修正,从而影响检索效果的提升。
发明内容
本发明的发明目的是提供一种基于词汇树层次语义模型的图像检索方法,利用词汇树将图像特征与人工标注的语义特征进行关联,以实现检索过程中的自动语义映射;并实现高层语义映射的自动修正,以获得更好的检索效果,更贴近检索用户的需求。
为达到上述发明目的,本发明采用的技术方案是:一种图像检索方法,提供用于检索的图像库和待检索的图片,包括下列步骤:
(1)提取图像库中所有图片的SIFT特征,得到特征集合;
(2)构建词汇树,方法是:设定聚类个数K,树的深度P,对步骤(1)获得的特征集合进行分层聚类,第一层获得K个聚类,作为词汇树的K个子节点,计算出每个子节点的中心向量;对每个子节点分别进行聚类,每一子节点生成K个下一层的子节点,并计算出每个子节点的中心向量;不断重复直到树的深度达到预设值P,获得SIFT词汇树;其中,K取5~10的整数,P取3~6的整数;
(3)将图像库中的图片与词汇树进行关联:词汇树的叶节点个数为M=K×P,每个叶节点具有中心向量Cm,其中,m为1~M的整数,将每个叶节点称为一个视觉词汇单词Wm,图像库中的总图片数为N,其中每个图片称为一个文档Fi,i是1~N的整数,则文档Fi和视觉词汇单词Wm的相关度为Weight(i,m)=NUMim×idfm,式中,NUMim表示视觉词汇单词Wm在图片文档Fi中出现的次数,Nm表示视觉词汇单词Wm一共包含的图片文档数目;计算每个图片与词汇树的每个叶节度的相关度,完成图片与词汇树的关联;
(4)设定图像库的语义主题信息集,先采用人工标注的方法将图像库中的图片分类至语义主题信息集中的各语义主题信息;再利用Bayesian统计决策理论实现视觉词汇层到语义信息层的映射,映射方法为,每个视觉词汇单词和语义主题信息间的映射概率为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210422998.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种一体化橱柜拉篮
- 下一篇:一种内置调味品架的橱柜