[发明专利]一种银行票据文本的识别方法、装置及设备在审
申请号: | 202110486301.X | 申请日: | 2021-04-30 |
公开(公告)号: | CN113052161A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 黄倩颖;潘鸿波;刘小刚 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/42 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭化雨 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 银行 票据 文本 识别 方法 装置 设备 | ||
本申请公开了一种银行票据文本的识别方法、装置及设备,能够利用多尺度变化特征提取方法结合长文本加权非极大值抑制的方式,准确确定出待识别的银行票据文本的文字区域,进而提高了后续识别结果的准确性。该方法包括:首先获取待识别的银行票据文本图像,并对银行票据文本图像进行尺度变化处理,得到尺度的信息,然后,根据尺度的信息,对将银行票据文本图像进行检测,确定候选的文字区域,接着,通过长文本加权非极大值抑制,从候选的文字区域中确定出最佳的文字区域,进而可以对最佳的文字区域进行识别,得到银行票据文本图像的识别结果。
技术领域
本申请涉及计算机技术领域,尤其涉及一种银行票据文本的识别方法、装置及设备。
背景技术
随着社会经济的高速发展,各大银行作为金融服务的中心,越来越多的银行客户会办理各种银行业务,进而产生大量的银行票据文本,使得银行领域对于光学字符识别(Optical Character Recognition,简称OCR)识别技术的需求也逐渐强烈。
但银行票据文本的识别与普通的文本识别相比有其特殊的样式和特性,银行票据文本需要识别填入的文本信息,有特定的位置,在图片上分布占比较密集。在识别过程中,信息字段的文本区域检测定位对文字识别的结果有较大的影响。而在进行文本区域检测时,通常需要进行局部提取图像特征,特征对应的局部如果小于文本区域的大小,所提取出来的文本检测结果只包含区域的一部分,造成识别结果文本缺失;反之,对应局部区域大于文本字段,所提取出来的区域包含大量空白,对后续识别结果也有一定影响。因此,如何准确确定出银行票据文本的文字区域,以提高识别结果的准确性是亟待解决的问题。
发明内容
本申请实施例的主要目的在于提供一种银行票据文本的识别方法、装置及设备,能够准确确定出待识别的银行票据文本的文字区域,进而提高了识别结果的准确性。
第一方面,本申请实施例提供了一种银行票据文本的识别方法,包括:
获取待识别的银行票据文本图像,并对所述银行票据文本图像进行尺度变化处理,得到尺度的信息;
根据所述尺度的信息,对将所述银行票据文本图像进行检测,确定候选的文字区域;
通过长文本加权非极大值抑制,从所述候选的文字区域中确定最佳的文字区域;
对所述最佳的文字区域进行识别,得到所述银行票据文本图像的识别结果。
可选的,所述获取待识别的银行票据文本图像,并对所述银行票据文本图像进行尺度变化处理,得到尺度的信息,包括:
获取待识别的银行票据文本图像,并对所述银行票据文本图像进行缩放处理,得到所述候选的文字区域在所述银行票据文本图像中的相对比例信息,作为尺度的信息。
可选的,所述通过长文本加权非极大值抑制,从所述候选的文字区域中确定最佳的文字区域,包括:
通过对所述候选的文字区域对应的数值扩大预设倍数,确定出最佳的文字区域。
可选的,所述预设倍数为1.5倍。
第二方面,本申请实施例还提供了一种银行票据文本的识别装置,包括:
获取单元,用于获取待识别的银行票据文本图像,并对所述银行票据文本图像进行尺度变化处理,得到尺度的信息;
检测单元,用于根据所述尺度的信息,对将所述银行票据文本图像进行检测,确定候选的文字区域;
确定单元,用于通过长文本加权非极大值抑制,从所述候选的文字区域中确定最佳的文字区域;
识别单元,用于对所述最佳的文字区域进行识别,得到所述银行票据文本图像的识别结果。
可选的,所述获取单元具体用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110486301.X/2.html,转载请声明来源钻瓜专利网。