[发明专利]文档处理设备、图像处理装置和文档处理方法有效

专利信息
申请号: 201310652235.4 申请日: 2013-12-05
公开(公告)号: CN103873719A 公开(公告)日: 2014-06-18
发明(设计)人: 大黑庆久 申请(专利权)人: 株式会社理光
主分类号: H04N1/00 分类号: H04N1/00;H04N1/32
代理公司: 北京银龙知识产权代理有限公司 11243 代理人: 曾贤伟;杨继平
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文档 处理 设备 图像 装置 方法
【说明书】:

相关申请的交叉引用

本申请要求于2012年12月7日在日本提交的日本专利申请No.2012-267869的优先权权益,其全部内容通过引用方式并入到本文中。

技术领域

本发明涉及文档处理设备、图像处理装置和文档处理方法,并且更具体地涉及如下这样的文档处理设备、图像处理装置和文档处理方法,所述文档处理设备、图像处理装置和文档处理方法为文档图像数据创建适合于如下输出条件的样式的文档名称,所述输出条件不仅依赖于所述文档图像数据被输出的时间并且还依赖于所述文档图像数据被输出到的目的地。

背景技术

外部加载的文档图像数据包括并未向其给出文档名称的文档图像数据,并且特别是,需要向通过扫描设备从纸质文档加载的文档图像数据给出文档名称以用于存储管理,从而能够更有效地使用文档数据。

存在向这样加载的图像数据给出文档名称的常规方法,其中自动创建并给出加载日期、预定序列号等。然而,存在这样的问题,其中无法仅从日期或序列号确定文档图像数据的文档内容,这导致文档图像数据的不良使用性。

通常,用户将与加载的文档图像数据的内容相对应的文档名称输入给文档图像数据。这允许其他的用户根据文档名称知晓文档图像数据的内容,这改善了其使用性。然而,如果存在大量的文档图像数据,就降低了操作性,这种情况需要被改进。

因此,已经提出了从文档图像数据自身提取与文档图像数据的内容相对应的标题的各种技术。例如,存在这样的方法,即从通过对文档图像数据执行光学字符识别(OCR)扫描的文档提取每个候选标题语句的特征量并且随后提取标题,从而特征量包括相似度信息,所述相似度信息是相对于文档中的多个语句的候选标题语句的相似度的函数(参见专利文献1);还存在这样的方法,即从文档图像数据的字符区域属性和线区域布局特征来提取布局相似性以便提取标题(参见专利文献2);还存在这样的方法,即从与标题字符串附近所示的关键字字符串和标题字符串之间的相对位置相关的信息提取标题(参见专利文献3)。

上述常规技术中的每一个是这样的技术,其中从文档图像数据提取的字符串适合作为文档图像数据的内容的标题(文档名称);然而,并不考虑所提取的文档名称要被输出到的输出目的地装置,这意味着需要改进。

通过各种设备来存储和使用文档图像数据,或通过使用各种类型的软件来传输和使用文档图像数据,并且给出文档名称,以基于文档名称指明文档图像数据,从而改进文档图像数据的使用性。

然而,对输出所显示或记录的文档名称存在各种限制,例如字符代码可以根据设备、用于通过传输来输出文档图像数据的软件等而不同,对在一个传输中能够传输的数据量存在限制,或者对文档名称中的字符的数量可以存在限制。因此,文档名称的给出字符可能变为被破损,并且可能无法被准确地输出,或者期望的文档名称可能无法被输出,因此需要对给出文档名称的改进。

存在这样的需求,即根据文档名称输出条件创建表示文档图像的内容的文档名称。

发明内容

本发明的一个目的在于至少部分解决现有技术中的问题。

一种文档处理设备包括:字符信息提取单元,从文档图像数据提取字符信息;特征字符串提取单元,从由所述字符信息提取单元提取的字符信息中,提取指示所述文档图像数据的特征的给定数量的字符串作为文档名称候选字符串;输出条件获取单元,当由涉及所述文档图像数据的文档名称的输出的多个处理方法之一处理所述文档图像数据时,所述输出条件获取单元获取所述文档图像数据的文档名称的输出所需的输出条件;以及文档名称生成单元,从所述文档名称候选字符串生成与对应于所述输出条件的字符条件相一致的文档名称。

一种文档处理方法包括如下步骤:字符信息提取处理,从文档图像数据提取字符信息;特征字符串提取处理,从在所述字符信息提取处理步骤处提取的字符信息中,提取指示所述文档图像数据的特征的给定数量的字符串作为文档名称候选字符串;输出条件获取处理,当由涉及所述文档图像数据的文档名称的输出的多个处理方法之一处理所述文档图像数据时,所述输出条件获取处理获取所述文档图像数据的文档名称的输出所需的输出条件;以及文档名称生成处理,从所述文档名称候选字符串生成与对应于所述输出条件的字符条件相一致的文档名称。

通过结合附图阅读本发明当前优选实施例的具体实施方式,将更好地理解本发明的上述和其他目的、特征、优势以及技术和工业重要性。

附图说明

图1是应用了本发明一个实施例的文档处理设备的主单元框配置图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310652235.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top