[发明专利]文档检索设备和文档检索方法有效
申请号: | 200710153776.7 | 申请日: | 2007-09-20 |
公开(公告)号: | CN101206662A | 公开(公告)日: | 2008-06-25 |
发明(设计)人: | 山本雅仁 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N1/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李玲 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 检索 设备 方法 | ||
技术领域
本发明涉及文档检索设备和文档检索方法。
背景技术
先进的存储技术和成本降低允许存储和管理大量文档数据。并且,文件服务器、文档管理系统、群件等已经流行并在先进的功能和性能方面得到改进。在每个都具有文档存储、以及图像传送和接收功能的诸如复印机、打印机、图像扫描仪、传真机、数字摄影机、多功能外围设备(MFP)之类的各种视频办公室机器与网络兼容的同时,信息处理设备也进行了更新。在网络环境中,信息处理设备和各种视频办公室机器持续交换大量文档数据。可校验地存储经由办公室网络传播的文档通信量的存储基础结构(infrastructure)正在开始进入实际使用。
日本专利No.3,486,452披露了一种多功能图像处理设备,该多功能图像处理设备可连接至少两个图像数据输出设备,以便提供一种能保证对所需图像制作副本而不麻烦操作者的多功能图像处理设备。
为了有效地从巨大数量的存储文档中检索所需文档,考虑除文本之外主要包括图像的文档的检索是重要的。全文本搜索对于检索主要包括图像而不是文本的文档,诸如演示材料、广泛使用图形和可视数据之类的文档是能力不足的。当用户想要使用给定图像作为检索关键,并检索包括图像的文档时,单独的全文本搜索不能很好地起作用。
已知使用图像作为检索关键来检索相似图像的许多相似图像检索方案。已获得一种基于图像中的边缘等来确定对象的形状以抽取对象,并使用对象的配置、配色、多个对象之间的位置关系等的方案,一种基于直方图等抽取并使用形成整个图像的占主导的颜色的组合或彩色图案的方案等。
例如,日本专利申请公开No.2005-244684披露了一种相似图像检索方案,该相似图像检索方案使用推导具有与认知相似度确定接近的特性的特征量的数学处理。
日本专利No.3691962披露了基于文本检索包括多个页面的文档,并显示包括与命中(hit)文本对应的文本图像的一个或多个页面(当文本出现在跨越两个页面时的两个页面)的布置。
在使用图像检索技术的文档检索中,只获得一个文档作为检索结果的情况是罕见的。在大多数情况下,根据用户的判断,在检索之后需要从相当大数量的命中文档中抽取所需文档的处理。其原因是:出于所有实用目的,在大规模存储基础结构中存在包括被再次使用或修改的同样图像的多个文档。并且,图像相似度由模拟连续量来表达,甚至是一对不同的图像也具有一定相似度。根据检索的最终目的,因为“相似”是基于用户的主观性的,所以“相似”的标准是任意的。因为不可能自动地作出与用户的主观性完全符合的相似度评估,所以相似图像检索只被用来缩小(narrow down)相当大的数量的备选,并且用于找出所需文档的操作应由用户的主观性负责。此外,演示某范围内的相当大的数量的检索结果文档可激发用户的思考,从而支持他或她的创造性作品。
在使用在日本专利申请公开No.2005-244684所披露的图像检索技术的文档检索中,检索结果列表包括相当大的数量的文档、还有许多噪声结果(除所需文档之外的文档)。因而,当用户浏览该列表并从该列表检索所需文档时,效率是重要的。
例如,当多个文档包括命中检索条件的图像时,将该多个文档列入文档检索结果列表中。在这样的情况下,根据该图像被分配的上下文,该文档可能不是所需的。在文档主要包括文本的情况下,可构建一种检索系统,该检索系统使用文本概要技术自动地产生概要,并且将该文档概要显示在检索结果列表中,以允许用户容易地选择所需文档。然而,不能由基于文本的概要来表达图像信息。
日本专利No.3691962披露了一种当基于文本的检索结果跨越文档中的多个页面出现时的显示技术。然而,当由用户从相似图像检索的文档检索结果列表中选择所需文档时,这样的技术没有导致效率的提高。
发明内容
本发明的一个目的是提供一种文档检索技术,该文档检索技术可有效地显示文档概要,并且使用该图像检索技术,可将命中图像检索条件的图像所在的文档中的内容分配到文档检索的检索结果列表中。
本发明的另一目的是提供一种文档检索技术,该文档检索技术允许用户迅速地从包括相当大的数量的文档以及还有许多噪声结果的检索结果列表中找出所需文档。
为实现上述目的中的至少一个目的,根据本发明的一个方面,提供一种文档检索设备,所述设备包括:
文档检索单元,其适用于检索包括与输入检索条件相匹配的图像的文档数据;
检索结果列表显示单元,其适用于基于文档检索单元的检索结果,在显示单元上显示与检索条件相匹配的文档数据的列表显示;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710153776.7/2.html,转载请声明来源钻瓜专利网。