[发明专利]一种基于表示转换的多义数字图像检索方法有效
申请号: | 200810020716.2 | 申请日: | 2008-02-22 |
公开(公告)号: | CN101236565A | 公开(公告)日: | 2008-08-06 |
发明(设计)人: | 周志华;张敏灵 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06T7/00 |
代理公司: | 南京苏高专利商标事务所 | 代理人: | 柏尚春 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 表示 转换 多义 数字图像 检索 方法 | ||
技术领域
本发明涉及一种数字图像检索方法,特别涉及一种适用于多义数字图像的检索方法。
背景技术
随着计算机的数据收集以及处理能力的不断提高,数字图像的获取也变得越来越容易。因此,可用的数字图像正快速地增长并在越来越多的行业中得到了应用。图像检索技术是一种高效地辅助用户获取图像信息的方法,该方法通过用户提交给检索装置的查询图像,从图像库中快速、准确地找出其希望获得的图像并返回给用户。一种有效的图像检索策略是将检索过程看作一个学习过程,利用用户提交的查询图像作为学习所需的样本,使用机器学习技术学习得到一个预测模型从而实现对数字图像的检索。
目前的图像检索技术主要涉及单义数字图像,该类型的图像对应于单一的概念类,因此其语义是确定且没有歧义的。然而,在真实世界中,多义数字图像是广泛存在的。例如,一幅室内装饰图像可能同时对应于桌子、沙发、衣橱等多个概念类;一幅自然场景图像可能同时具有蓝天、太阳、山脉等多个概念标记;一幅野外生物图像可能同时隶属于草地、狮子、长颈鹿等多个类别。由于已有的数字图像检索技术只能处理单义数字图像,因此无法利用多义数字图像所蕴含的多种语义信息,不利于有效地进行检索从而获得与用户相关的图像。
发明内容
1、发明目的:本发明的目的是针对目前的数字图像检索技术只能处理单义数字图像的问题,提出一种能够有效处理多义数字图像的方法,该方法通过对图像的初始向量特征进行表示转换,显式地描述多义数字图像内嵌的各种语义信息,从而提高数字图像检索装置的性能。
2、技术方案:为实现上述目的,本发明所述的一种基于表示转换的多义数字图像检索方法,包括以下步骤:(1)用户从已有的多标记图像库中选择查询图像,包括相关图像和不相关图像;(2)使用表示转换的方法显式地描述查询图像蕴含的多义信息;(3)使用预设的分类方法对转换后的查询图像进行学习得到一个预测模型;(4)基于预测模型预测数字图像存储设备中待检索图像的概念标记,并利用所得预测结果进行检索返回检索图像;(5)如果用户对检索结果满意,则执行步骤6,否则从多标记图像库中选择更多的查询图像进行反馈,执行步骤2;(6)结束。
3、有益效果:本发明给出了一种用于多义数字图像的检索方法,该方法基于表示转换技术,显式地处理图像的多种语义信息,解决了目前大部分图像检索方法只能处理单义图像的局限。
附图说明
图1是数字图像检索装置的工作流程图。
图2是本发明方法的流程图。
图3是本发明采用的数字图像表示转换的流程图。
图4是本发明使用的分类方法的流程图。
具体实施方式
下面将结合附图对最佳实施例进行详细说明。
如图1所示,数字图像存储设备中存放了待检索的数字图像,此外还存在一个多标记数字图像库,该图像库中含有一些多义数字图像,每个多义数字图像均对应了一组人工标注的概念标记。用户从多标记数字图像库中选取M幅查询图像提交给数字图像检索装置,其中一些为其感兴趣的相关图像而另外一些为其不感兴趣的非相关图像。可以使用数字图像处理教科书中的经典方法生成适当的图像特征,如颜色、纹理、形状等。由此,每幅图像可由一个特征向量进行表示。在得到图像特征后,采用表示转换的方法对多义数字图像进行处理,然后使用预设的分类方法训练得到相应的预测模型,基于此对数字图像存储设备中的待检索图像进行检索。如果用户对所得结果不满意,可以从多标记数字图像库中选取更多的查询图像反馈给数字图像检索装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810020716.2/2.html,转载请声明来源钻瓜专利网。