[发明专利]文档检索设备及文档检索方法有效
申请号: | 200710154724.1 | 申请日: | 2007-09-13 |
公开(公告)号: | CN101201840A | 公开(公告)日: | 2008-06-18 |
发明(设计)人: | 山本雅仁 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N1/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李玲 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 检索 设备 方法 | ||
技术领域
本发明涉及一种用于执行文档检索的设备及其方法,更具体地,涉及一种能检索包含图像的文档的设备。
背景技术
近年来,数据存储方法越来越先进,并且存储装置的制造成本也降低了。这样,可以容易地存储和管理大量的文档数据。另外,具有先进的功能和高性能的文件服务器和文档管理系统已经广泛使用,并且用于这种服务器设备和系统的群件已经普及。
随着具有先进的功能和高性能的信息处理设备的发展,诸如复印机、打印机、图像扫描仪、传真设备、数码相机和具有存储文档并发送和接收图像的功能的多功能外设(MFP)等各种图像处理设备可以在网络上相互通信。
在网络连接环境下,在各种信息处理设备和图像形成设备之间经常发送和接收大量的文档数据。在这方面,用于在办公室积极存储经网络流动的大量文档的存储基础结构已经投入使用。
日本专利号3486452(美国专利号6,061,150)公开了可以连接至少两个图像数据输出设备的合成图像形成设备,该合成图像形成设备能可靠地存储图像的副本,而不需要操作者执行特殊的操作。
为了从大量所存储的文档中有效地检索所需的文档,除了检索文本文档以外,提供检索主要包括图像的文档的能力也是重要的。全文本检索可能不适合于检索主要包括图像而不是文本的文档,例如演示材料和具有大量图形和图像的文档。当利用基于图像指定的检索关键检索包括图像的文档时,如果只进行全文本检索,可能就不那么有意义了。
传统的相似图像检索方法使用图像作为检索关键来检索相似的图像。传统的相似图像检索方法根据图像的边缘抽取对象(object),以便确定图像的形状,并使用多个对象的位置、颜色和相对位置来确定图像是否是相似的图像。另一种传统的相似图像检索方法在直方图中抽取构成整个图像的主要颜色和颜色模式的组合,并使用该结果确定图像是否是相似的图像。
日本专利申请公开号2006-065866(美国专利申请公开号2006/0050985 A1)公开了使用用于计算特征量的算术处理(类似于认知相似性确定处理)的相似图像检索方法。
使用图像检索方法的文档检索并不旨在检索本身被指定为检索关键的图像,而是旨在从包括多个图像的文档中适当地找到包括被指定为检索关键的图像的所需文档。
例如,日本专利申请公开号2002-149659公开了图书检索服务方法,在该方法中,用户提交包括图书的部分数据(例如,书的一页的副本)的检索请求数据,使用所提交的数据检索图书数据库,并将检索的结果通知给发出请求的用户。
在日本专利申请公开号2006-065866(美国专利申请公开号US2006/0050985 A1)公开的仅使用图像检索方法的方法中,作为检索结果只找到一个文档的情况是很少的。在大多数情况下,检索结果列表包括大量的文档,其中包括大量的“噪声”文档(不是所需的文档)。
这是因为在大规模存储基础结构中,在大多数实际情况下,存在由重新使用或修改相同的图像而创建的大量文档。
由模拟连续量表示图像之间的相似程度。这样,不同的图像某种程度上也具有相似性。因此,得到根据图像检索执行的文档检索的结果作为连续命中率,而不是根据文档是否完全被命中而得到的离散结果。
因此,通过尽可能精确地缩小(narrow)检索结果列表来设定详细的检索条件,以便只有与所需的文档基本上相似的文档被命中是重要的。
由日本专利申请公开号2002-149659公开的方法从部分页面图像数据检索文档(书),与上述传统方法相同。然而,日本专利申请公开号2002-149659既没有公开也没有暗示通过指定关于文档中页面图像数据包括的模式的条件来以高精度缩小检索的配置。
发明内容
本发明的一个实施例涉及一种文档检索方法,该方法用于通过基于检索关键图像在文档中的出现模式设定检索条件,来根据图像检索文档。
根据本发明的一个方面,一个实施例涉及一种被配置为检索包括多个图像成分的文档的设备。该设备包括:关键图像指定单元,被配置为指定要被用作用于图像检索的检索关键的关键图像;模式设定单元,被配置为将与由关键图像指定单元指定的关键图像等同的图像成分在文档中出现模式设定为检索条件;以及文档检索单元,被配置为使用由模式设定单元设定的检索条件检索文档。
根据本发明的另一方面,一个实施例涉及一种用于检索包括多个图像成分的文档的方法。该方法包括:指定要被用作用于图像检索的检索关键的关键图像;将与指定的关键图像等同的图像成分在文档中的出现模式设定为检索条件;和使用设定的检索条件检索文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710154724.1/2.html,转载请声明来源钻瓜专利网。