[发明专利]一种带污损票据的字符识别方法及系统有效
申请号: | 201610911556.5 | 申请日: | 2016-10-19 |
公开(公告)号: | CN107967479B | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 翟云龙 | 申请(专利权)人: | 深圳怡化电脑股份有限公司;深圳市怡化时代科技有限公司;深圳市怡化金融智能研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06K9/32 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 邓猛烈;潘登 |
地址: | 518038 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 污损 票据 字符 识别 方法 系统 | ||
本发明公开了一种带污损票据的字符识别方法及系统。该方法包括:获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。
技术领域
本发明涉及字符识别技术领域,尤其涉及一种带污损票据的字符识别方法及系统。
背景技术
票据文件在采集图像的过程中,图像经常会带有污损,也容易出现倾斜,污损和倾斜都会对票据文件中字符号码的识别造成一定的干扰,降低票据文件中字符号码识别的准确性。
发明内容
本发明提供了一种带污损票据的字符识别方法及系统,该方法及系统可以排除污损对字符识别的干扰,准确识别字符的轮廓,提高字符识别的准确率。
为实现上述设计,本发明采用以下技术方案:
一方面,提供了一种带污损票据的字符识别方法,包括:
获取带污损的字符票据图像的所有轮廓;
计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;
根据所述质心纵坐标和周长识别字符的轮廓;
根据所述字符的轮廓对所述字符进行识别。
其中,所述根据所述质心纵坐标和周长识别字符的轮廓,包括:
根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;
根据所述聚类分析的结果识别字符的轮廓。
其中,所述根据所述字符的轮廓对所述字符进行识别,包括:
根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;
根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
其中,所述根据所述倾斜角对所述字符进行矫正,识别矫正后的字符,包括:
当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;
当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;
当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。
其中,所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。
其中,所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:
其中,所述θ表示倾斜角,p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,表示字符的重心坐标。
其中,所述获取带污损的字符票据图像的所有轮廓,包括:
对带污损的字符票据图像进行滤波;
获取滤波后的字符票据图像的所有轮廓。
另一方面,提供了一种带污损票据的字符识别系统,包括:
第一获取单元,用于获取带污损的字符票据图像的所有轮廓;
第一计算单元,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳怡化电脑股份有限公司;深圳市怡化时代科技有限公司;深圳市怡化金融智能研究院,未经深圳怡化电脑股份有限公司;深圳市怡化时代科技有限公司;深圳市怡化金融智能研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610911556.5/2.html,转载请声明来源钻瓜专利网。