[发明专利]文件搜索系统和程序有效
申请号: | 201080040672.5 | 申请日: | 2010-09-03 |
公开(公告)号: | CN102483765A | 公开(公告)日: | 2012-05-30 |
发明(设计)人: | 卫藤达也;松浦正和;鹤田诚也 | 申请(专利权)人: | 株式会社日立解决方案 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F12/00 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 周靖;郑霞 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 搜索 系统 程序 | ||
技术领域
本发明涉及提前对接受搜索的文件创建索引文件,并且通过参考索引文件来搜索文件的文件搜索系统和程序。
背景技术
近年来,信息的数字化发展迅速。过去,数字化主要涉及将待参考的数据存储在文件和DB(数据库)中,以使企业、对外办事处等等的计算机系统进行核心操作,这样的数据包括银行账户、城市/城镇/村庄居民登记等等。
另一方面,目前,在诸如企业等等的组织的日常经营中创建的各种文档作为文档文件存储在每个员工的客户端PC(个人计算机)上,并且作为电子邮件附件传输至其他的客户端PC,或存储在文件服务器上作为整个组织的共享信息。此外,存储在文件服务器上的文档文件被各个员工参考,并且有时被复制到客户端PC和在客户端PC上更新。
因为大量的数字信息因此分布和存储在各种计算机上,所以完全一样或相似的数字信息最终在组织内大量地存在。此外,各种数字信息的存储量也在继续增长。
另一方面,在组织内,例如,经常出现的情况是人们可能希望参考其存储位置未知的数字信息,例如当需要由已经离开组织的前员工在过去创建的文档文件时等等。在这样的情况下,通常的做法是,使用预期在关心的文档文件中找到的关键词通过全文搜索等等来搜索文档文件等等。
顺便说一下,如果要在组织内的所有的计算机中搜索数字信息,那么每个员工的客户端PC还将必须允许来自所有的员工的访问,这在安全性方面是不期望的。因此,通常的作法是将要在整个组织中共享的数字信息存储在预定的文件服务器上。
然而,即使文档文件等等被存储在多个预定的文件服务器上,如果人们在每次需要文档文件时搜索存储在文件服务器上的所有文件,那么将需要大量的时间执行文件I/O(输入/输出)等等。
由于该原因,在专利文献1中已知以下技术,其中,对于存储在文件服务器上的文档文件等等,用于搜索的相对少量的信息(索引信息),例如存储位置、关键词等等被作为索引文件存储。具体地,通过创建索引文件,可以在搜索期间通过一次文件I/O获得与多个文件相关的索引信息,由此避免针对每个文档文件执行文件I/O的需要等等。作为结果,可以缩短在文件搜索期间的响应时间,并且可以减小文件服务器上的负荷。
引用列表
专利文献
专利引用1:日本专利公布(特开昭)No.2003-162545A
发明概述
技术问题
然而,为了通过诸如专利文献1中公开的技术进行文件搜索,必需创建所有接受搜索的文件的索引文件。
虽然索引信息的储存容量与实际的文件相比是相对小的,但是为了能够通过关键词进行全文搜索,必需的是分析文件中含有的关键词并且将它们存储在索引信息中。因此,当文件中含有的关键词的数量增加时,相应地需要更大的容量。因此,当待接受搜索的文件的数量增加时,索引文件的储存容量变得更大。
现在考虑例如在组织内的文件搜索,即使当文件存储在共享的文件服务器上时,经常的情况是每个部门具有对有限的文件夹等等的访问权限,文件存储在这些有限的文件夹下等等,并且在其中进行搜索。在这样的情况下,经常采用的方法是文件夹被给予例如“work report文件夹”和类似的名称,并且符合这些名称的文件被存储在相应的文件夹中,即将文件以文件夹的方式进行分类的方法。此外,在这样的情况下,由于可以通过按照文件夹的树形结构检索到所关心的文件,所以几乎不需要通过关键词的全文搜索。
因此,即使文件存储在错误的文件夹中,只要具有关于文件的意图、标题等等的小容量的索引文件,那么通过参考索引文件中的索引信息,搜索经常是可能的。
换句话说,对于在组织内创建的诸如文档等等的文件,只要具有关于文件的意图、标题等等的小容量的索引文件,那么搜索经常是可能的。另一方面,例如,对于从组织的外部获得的文件,例如专利文件、技术论文等等,或对于在组织外部的服务器例如web服务器等等上存在的文件,还经常为了在获得它们时未打算的目的而参考它们,经常需要通过关键词进行全文搜索。
因此,考虑在组织内的文件搜索,具有应当允许全文搜索的文件以及全文搜索对于其而言不必要的文件。这不但适用于组织,而且适用于例如由个人进行的文件搜索。
考虑到以上的情况,本发明的一个目的是,提供文件搜索系统和程序,其通过关于其中应当允许全文搜索的文件和全文搜索不必要的文件共存的文件搜索环境,创建在应当允许全文搜索的文件和全文搜索不必要的文件之间的不同的索引文件,来进行有效的搜索。
问题的解决方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立解决方案,未经株式会社日立解决方案许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080040672.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光纤激光装置
- 下一篇:具备后方监控摄像装置的作业车辆