[发明专利]信息处理装置、储存介质及信息处理方法在审

专利信息
申请号: 201910829570.4 申请日: 2019-09-03
公开(公告)号: CN111539240A 公开(公告)日: 2020-08-14
发明(设计)人: 小林邦彦;清水淳一;堀江大悟 申请(专利权)人: 富士施乐株式会社
主分类号: G06K9/00 分类号: G06K9/00;G06F40/279;G06F40/151;G06F40/126
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 罗英;臧建明
地址: 日本东京*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 信息处理 装置 储存 介质 方法
【说明书】:

本发明提供一种信息处理装置、储存介质及信息处理方法,具有即使在与关键词对应的字符串也包含于与关键词的记载行不同的行的情况下,也能够输出与关键词对应的字符串这一效果。信息处理装置具备:提取部,按照如下提取条件从横跨多行记载的包含关键词的字符串提取与所述关键词对应的字符串,该提取条件为与所述关键词对应的字符串的提取条件;结合部,按照行排列结合通过所述提取部提取的各字符串;及输出部,将通过所述结合部结合的各字符串作为与所述关键词对应的字符串进行输出。

技术领域

本发明涉及一种信息处理装置、储存介质及信息处理方法。

背景技术

已知有从通过扫描仪读取的文件图像提取与以用户所期望的特定关键词来表示的项目建立对应关系的字符串的信息处理装置。

专利文献1中公开有一种图像处理装置,其从所输入的文件图像提取信息项目值,该图像处理装置具备:提取项目存储部,存储包含提取对象的信息项目的项目名称的提取项目信息;文字识别部,对所述文件图像执行文字识别;项目名称提取部,从由文字识别部输出的文字识别结果提取与存储于提取项目存储部的提取对象的项目名称相符的字符串;项目值提取部,从所述文件图像中的与项目名称相符的字符串的附近位置提取与该项目名称对应的项目值的字符串;及提取信息创建部,将项目值提取部提取的项目值的字符串与项目名称建立对应关系并创建提取信息。

专利文献2中公开有一种信息处理装置,其特征在于,具备:提取单元,通过对图像执行区域分析处理而提取区域;获取单元,获取用于提取特定关键词及与该关键词对应的价值(value)的规则;决定单元,根据能够获得该规则中所包含的所述关键词和与该关键词对应的价值的值决定使用所述规则确定包含所述关键词的区域及包含与该关键词对应的价值的区域的顺序;确定单元,按照所述决定的顺序,从所述提取的区域中确定包含所述关键词的区域或包含与该关键词对应的价值的区域;及文字识别单元,对所述确定的区域进行文字识别处理,所述确定单元按照所述决定的顺序,并根据先前确定的区域,确定所对应的另一个区域。

专利文献1:日本特开2007-233913号公报

专利文献2:日本特开2018-128996号公报

例如,在如报价单那样的文件中,在提出方的公司名称后面使用“公启”等预先设定的标记。因此,若对通过扫描仪读取的文件的图像进行OCR(Optical CharacterRecognition:光学字符识别)处理,并将“公启”作为关键词来提取“公启”的记载行中所记载的字符串,则能够获得文件的提出方的公司名称。

然而,当进行了通过扫描仪读取文件的OCR处理时,即便有条理的一连串的字符串跨行记载,由于不包含跨行的字符串的连结信息,因此有时发生不知道与关键词的记载行不同的行中所记载的字符串是否表示与关键词对应的字符串的状况。因此,到目前为止仅将与关键词的记载行相同的行中所包含的字符串作为与关键词对应的字符串进行提取。即,当与关键词对应的字符串包含于与关键词的记载行不同的行时,无法准确地提取与关键词对应的字符串。

发明内容

本发明的目的在于提供一种即使在与关键词对应的字符串也包含于与关键词的记载行不同的行的情况下,也能够输出与关键词对应的字符串的信息处理装置、储存介质及信息处理方法。

第1方式所涉及的信息处理装置具备;提取部,按照如下提取条件从横跨多行记载的包含关键词的字符串提取与所述关键词对应的字符串,该提取条件为与所述关键词对应的字符串的提取条件;结合部,按照行排列结合通过所述提取部提取的各字符串;及输出部,将通过所述结合部结合的各字符串作为与所述关键词对应的字符串进行输出。

第2方式所涉及的信息处理装置在第1方式所涉及的信息处理装置中,在所述提取条件中设定有从所述关键词的记载位置观察的与所述关键词对应的字符串的提取方向。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐株式会社,未经富士施乐株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910829570.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top