[发明专利]基于区域关键字位置识别的精确图像切分方法无效
申请号: | 201110255902.6 | 申请日: | 2011-08-31 |
公开(公告)号: | CN102968627A | 公开(公告)日: | 2013-03-13 |
发明(设计)人: | 黄火德 | 申请(专利权)人: | 上海夏尔软件有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 上海浦一知识产权代理有限公司 31211 | 代理人: | 孙大为 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 区域 关键字 位置 识别 精确 图像 切分 方法 | ||
技术领域
本发明适用于纸质资料电子化领域,特别是海量纸质单据或者档案资料,需要经过多个加工环节进行电子化的时候。
背景技术
近年来,随着计算机等信息技术的发展,计算机在我们的日常工作中应用的越来越广泛。随着计算机硬件设备的普及,内部网络和外部骨干网络的不断的建立和完善,“无纸化办公”类软件的发展,现在无纸化办公的软硬件环境已经基本准备充分,越来越多的单位和企业采用了内部办公系统(OA系统)来提高效率,节约成本。新的办公系统启用之后,新产生的文档将采用电子化的方式,通过网络进行流转和使用,而庞大的历史资料和现有电子化系统的对接的问题越来越突出。随之,扫描加工外包服务应运而生,这个服务,可以使客户的历史纸质资料快速、准确、高性价比的成为电子档案。
海量业务单据的电子化过程,需要投入大量的扫描仪、计算机、网络和生产人员、管理人员。在电子化的过程中,如何加快索引录入人员的效率成为整个行业的一个挑战。
发明内容
本发明所要解决的技术问题是提供一种基于区域关键字位置识别的精确图像切分方法,它可以提高录入人员录入效率;节约人力成本。
为了解决以上技术问题,本发明提供了一种基于区域关键字位置识别的精确图像切分方法,服务器配置程序对识别模板库进行初始化,对需要识别的电子文件类型进行相应配置,获取特征文字的坐标、条码值,配置索引录入的区域坐标;挂接条码识别引擎;识别客户端读取模板库信息,对电子文件进行光学字符识别OCR识别,并得出特征文字坐标的偏移信息,从而切分出录入的图像。
本发明的有益效果在于:通过光学字符识别OCR技术,实现对录入人员录入效率的提高;节约人力成本。
服务器配置程序中,设置如下内容:对每种需要识别的资料,选择模板图像识别,程序记录资料上特征文字的区域坐标,以及特征文字;对模板图像,配置索引录入的区域坐标信息;通过该设置程序,形成系统需要识别的模板库数据。
在识别客户端程序中,实现如下内容:传入图像,读取模板库信息,光学字符识别OCR文字识别该图像,通过识别结果与系统配置特征字的区域坐标信息比较,得到坐标偏移信息;根据坐标偏移信息以及索引录入的区域坐标,切分出对应的图像。
识别模板的配置包括以下步骤:步骤一、新建一个识别模板;步骤二、载入模板文件;步骤三、新建识别区域;步骤四、识别模板文件的文字坐标;步骤五、选择特征文字;步骤六、判断是否继续新建识别区域;如是,重复步骤三;如否,继续;步骤七、新建索引录入区域;步骤八、框选识别区域,记录其坐标位置;步骤九、配置信息入配置信息库;步骤十、判断是否继续新建录入区域;如是,重复步骤四;如否,继续;步骤十一、判断是否继续新建识别模板;如是,重复步骤一;如否,继续;结束。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明。
图1是本发明所述方法识别模板的配置示意图。
具体实施方式
本发明利用光学字符识别OCR文字识别技术,为软件提供一种高效、可靠的切分出索引录入图像区域的方法。将本软件部署在扫描加工服务器的生产线上,可以提高录入人员的效率。
本发明的基于区域关键字位置识别的精确图像切分软件由2个部分组成,分别为服务器配置程序和识别客户端。
在服务器配置程序中,我们可以设置如下内容:
1、对每种需要识别的资料,选择模板图像识别,程序记录资料上特征文字的区域坐标,以及特征文字。
2、对模板图像,配置索引录入的区域坐标信息。
通过该设置程序,形成系统需要识别的模板库数据。
在识别客户端程序中,我们实现如下功能:
1、传入图像,读取模板库信息,光学字符识别OCR文字识别该图像,通过识别结果与系统配置特征字的区域坐标信息比较,得到坐标偏移信息。
2、根据坐标偏移信息以及索引录入的区域坐标,切分出对应的图像。
本发明的具体的实施步骤如下:
1、安装服务器配置程序。
2、对识别模板库进行初始化,即:对需要识别的电子文件类型进行相应配置,获取特征文字的坐标、条码值,配置索引录入的区域坐标。
3、安装识别客户端,挂接条码识别引擎。
4、识别客户端,读取模板库信息,对电子文件进行光学字符识别OCR识别,并得出特征文字坐标的偏移信息,从而切分出录入的图像。
本发明目前已经在夏尔文档数字化处理中心正式使用,节省了大量的人力成本,提高了录入人员的效率,取得了良好的效果。
本发明并不限于上文讨论的实施方式。以上对具体实施方式的描述旨在于为了描述和说明本发明涉及的技术方案。基于本发明启示的显而易见的变换或替代也应当被认为落入本发明的保护范围。以上的具体实施方式用来揭示本发明的最佳实施方法,以使得本领域的普通技术人员能够应用本发明的多种实施方式以及多种替代方式来达到本发明的目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海夏尔软件有限公司,未经上海夏尔软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110255902.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种移动电源自动调节输出电流的电路
- 下一篇:一种微源并网电能质量控制系统