[发明专利]文件检索装置、文件检索系统、文件检索程序及文件检索方法有效
| 申请号: | 202080013528.6 | 申请日: | 2020-02-10 |
| 公开(公告)号: | CN113474767B | 公开(公告)日: | 2023-09-01 |
| 发明(设计)人: | 南拓也;川原悠;竹本真平;武田领子;奥野好成 | 申请(专利权)人: | 株式会社力森诺科 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/338;G06F16/438 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王海奇;王秀辉 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文件 检索 装置 检索系统 程序 方法 | ||
1.一种文件检索装置,其具备:
输入接受部,接受关键字的输入;
文件获取部,从存放有文件档案及书写者名称的数字文件数据库中,获取所述书写者名称及所述文件档案,所述文件档案是对手写文件的文件图像数据进行文字识别处理而成的文本数据,所述书写者名称是写下所述手写文件的文字的书写者的名称;
对应关键字获取部,参照存放有将书写者名称、关键字、对应关键字关联的信息的对应关键字数据库,并根据通过所述输入接受部被输入的关键字、及由所述文件获取部获取的所述书写者名称,获取所述被输入的关键字的对应关键字;
文件检索部,根据所述被输入的关键字以及获取的所述对应关键字,对所述文件获取部所获取的所述文件档案进行检索;及
检索结果输出部,输出所述文件检索部的检索结果,
所述对应关键字是包含作为对与所述对应关键字关联的关键字进行所述文字识别处理的结果的误识别文字的文字列。
2.根据权利要求1所述的文件检索装置,还具备:
文件图像数据库,存放所述手写文件的文件图像数据;及
文件图像输出部,从所述文件图像数据库获取与所述文件档案对应的文件图像数据并输出,
所述检索结果输出部,从所述文件档案中,作为检索结果输出包含所述被输入的关键字或所述对应关键字的文本数据,
所述文件图像输出部,在所述文本数据的一部分被选择的情况下,获取与包含所述被选择的文本数据的一部分的文件档案对应的文件图像数据并输出。
3.根据权利要求1所述的文件检索装置,其中,
所述文件检索部,分别根据所述被输入的关键字及所述对应关键字进行模糊检索,
所述检索结果输出部将所述模糊检索的结果包含在所述检索结果中。
4.根据权利要求2所述的文件检索装置,其中,
所述对应关键字数据库中存放的信息包括所述对应关键字或在模糊检索中作为检索关键字的关键字、由所述文件获取部获取的书写者名称、通过所述输入接受部被输入的关键字以及选择次数,
所述文件检索装置还具备对应关键字更新部,在所述检索结果中,作为根据所述对应关键字进行检索或模糊检索的结果而输出的文本数据的一部分被选择的情况下,所述对应关键字更新部更新所述选择次数,并将其存放到所述对应关键字数据库中。
5.根据权利要求1至4中的任一项所述的文件检索装置,其中,
所述文件检索装置还具备用于使预测模型学习的预测模型学习部、以及用于存放所述预测模型的模型存储部,
所述预测模型学习部,将所述对应关键字数据库中存放的信息作为训练数据,使预测模型学习,
所述模型存储部存放学习完的学习完毕预测模型,
当所述被输入的关键字及所述获取的书写者名称被输入时,所述学习完毕预测模型预测对应关键字,并输出预测所得对应关键字,
所述文件检索部,根据所述被输入的关键字及所述预测所得对应关键字,对所述文件获取部获取的文件档案进行检索。
6.根据权利要求4所述的文件检索装置,
所述文件检索装置具备用于使预测模型学习的预测模型学习部、以及用于存放所述预测模型的模型存储部,
所述预测模型学习部,将所述对应关键字更新部中存放的更新后对应信息作为训练数据,使预测模型学习,
所述模型存储部存放学习完的学习完毕预测模型,
当所述被输入的关键字及所述获取的书写者名称被输入时,所述学习完毕预测模型预测对应关键字,并输出预测所得对应关键字,
所述文件检索部,根据所述被输入的关键字及所述预测所得对应关键字,对所述文件获取部获取的文件档案进行检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社力森诺科,未经株式会社力森诺科许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080013528.6/1.html,转载请声明来源钻瓜专利网。





