[发明专利]一种图像信息提取方法和装置在审
| 申请号: | 201911070071.8 | 申请日: | 2019-11-05 |
| 公开(公告)号: | CN110895696A | 公开(公告)日: | 2020-03-20 |
| 发明(设计)人: | 马文伟;刘设伟;王亚领;闫永泽 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李阳;赵迪 |
| 地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 信息 提取 方法 装置 | ||
本发明公开了一种图像信息提取方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对目标图像进行文字检测与识别,得到目标图像的文本行以及文本行的字符信息;将字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在文本行的位置;对预印字符信息所在位置对应的文本行图像进行图像分割,以定位预印字符信息的像素位置,在像素位置提取预印字符颜色信息;使用目标图像的背景颜色信息替换预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。该方法提取预印字符颜色信息,用背景颜色替换预印字符颜色信息后,进行文字检测与识别,获得打印字符信息,提高了压盖区域信息识别的完整性和准确度。
技术领域
本发明涉及计算机领域,尤其涉及一种图像信息提取方法和装置。
背景技术
票据识别OCR(Optical Character Recognition,光学字符识别)系统是一款通用的数据批量采集软件,适用于具有表格特征的表单、问卷、单证、保险单等的信息提取。具体地,该系统通过扫描、图像处理、自动分类、OCR技术,可以准确、快速、真实地提取表格图像中的数据信息并保存,而且可以将数据结果导出为标准的数据格式,如Excel表,与ERP(Enterprise Resource Planning,企业资源计划)、CRM(Customer RelationshipManagement,客户关系管理)等系统能够无缝结合。
各种票据票面中存在一个普遍现象,即存在“压盖”问题,包括两个方面,一是印章随意压盖导致其与打印信息重叠,二是票据摆放不标准导致打印信息与预印信息重叠,该现象会极大地降低票据打印信息提取的准确率。现有的票据识别技术,需要先人工设定印章和预印信息的颜色信息,进而对票据图像进行处理,降低印章以及预印信息对打印信息的识别所带来的影响。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
由于打印方式不同、图像采集手段不同,人工设定的颜色信息往往严重偏离真实票据,导致票据干扰信息的消除效果较差,压盖区域的文字检测残缺,文字识别的准确率低。
发明内容
有鉴于此,本发明实施例提供一种图像信息提取方法和装置,利用预印字符模板和图像分割技术提取预印字符颜色信息,并使用目标图像的背景颜色信息替换预印字符颜色信息,之后对替换颜色后的目标图像进行文字检测与识别,即可获得打印字符信息,提高了压盖区域的信息识别的完整性和准确度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种图像信息提取方法。
本发明实施例的一种图像信息提取方法,包括:对目标图像进行文字检测与识别,得到所述目标图像的文本行以及所述文本行的字符信息;将所述字符信息与设定的预印字符模板进行匹配,以确定预印字符信息在所述文本行的位置;对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,在所述像素位置提取预印字符颜色信息;使用所述目标图像的背景颜色信息替换所述预印字符颜色信息,对替换颜色后的目标图像进行文字检测与识别,得到打印字符信息。
可选地,所述将所述字符信息与设定的预印字符模板进行匹配,包括:查找预印字符模板中是否存在所述字符信息;在所述预印字符模板中存在所述字符信息的情况下,确认所述字符信息为所述预印字符信息。
可选地,所述对所述预印字符信息所在位置对应的文本行图像进行图像分割,以定位所述预印字符信息的像素位置,包括:采用图像分割算法,对所述预印字符信息所在位置对应的文本行图像进行二值化分割,以定位所述预印字符信息的像素位置。
可选地,所述对替换颜色后的目标图像进行文字检测与识别的步骤之前,所述方法还包括:定位所述目标图像中印章的位置,以提取印章颜色信息;使用所述目标图像的背景颜色信息替换所述印章颜色信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911070071.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像篡改检测方法和装置
- 下一篇:一种潜在客户数据处理方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





