[发明专利]基于OCR技术的票证票号识别方法无效
申请号: | 201310030661.4 | 申请日: | 2013-01-28 |
公开(公告)号: | CN103093219A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 杜国洪;袁永俊;郑朝晖;刘智恒;李樟标;奚兵;韩征;杨峥;孙巍巍;蔡琪;王雷;耿谨;其他发明人请求不公开姓名 | 申请(专利权)人: | 中国航空结算有限责任公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100028 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ocr 技术 票证 票号 识别 方法 | ||
技术领域
本发明属于票据票证信息识别方法技术领域,具体涉及一种基于OCR技术的票证票号识别方法。
背景技术
随着电子客票与EMD在全球的推广,各种票据票证特别是民航客运票证的电子化程度越来越高,但仍存在大量的纸质票证,特别是纸质行李票与MCO。在民航客运结算系统中,上述纸质票证的影像,通过扫描,被采集进系统。票号,作为票证影像的关键检索项,需从影像中被自动识别出来,以降低人工成本,提高工作效率。
光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析处理,获取文字及版面信息的过程。
现有技术中均是直接利用OCR技术,对客运票证的票号进行识别。直接利用OCR技术对客运票证的票号识别,一般需要预先指定票号区域,但不同航空公司、不同类型的票证,票号位置有所不同,再加上票证印刷、运输与扫描过程的干扰因素,造成票号识别率相对较低。
发明内容
本发明的目的在于提供一种基于OCR技术的票证票号识别方法,利用本发明的票证票号识别方法,可以不需要预先指定票号区域,且识别正确率高。
本发明的技术方案如下:
一种基于OCR技术的票证票号识别方法,依次进行如下步骤:
步骤1、采集票证图像;
步骤2、对票据图像进行二值化处理;
步骤3、利用Freeman直线检测算法,以获得可能的票号区域并进入步骤4,如无可能的票号区域则跳转到步骤7;
步骤4、根据系统预先设定的票号识别特征进行细化识别,以获得票号在步骤3得到的可能的票号区域中的具体位置并进入步骤5,否则跳转到步骤3;
步骤5、使用OCR识别方法,在步骤4获得的具体位置进行识别,以获得票号识别结果;
步骤6、根据系统预先设定的票号校验特征对步骤5的票号识别结果进行校验,校验成功,则输出识别结果并进入步骤7,否则进入步骤3;
步骤7、结束。
进一步的,步骤4中,票号识别特征为票号位数和票号字符间间距。
进一步的,步骤6中,票号校验特征为票号长度和票号检查号计算规则。
本发明的技术效果在于:
本发明基于OCR技术的票证票号识别方法,能自动快速定位票号位置,并对识别结果进行校验,具有较高的识别速度与正确率,能够降低人力成本,提高工作效率。
附图说明
图1所示为本发明基于OCR技术的票证票号识别方法的流程图。
具体实施方式
以下结合附图对本发明做进一步说明。
如图1所示,本发明一种基于OCR技术的票证票号识别方法,依次进行如下步骤:
步骤1、采集票证图像。
步骤2、对票据图像进行二值化处理。
图像二值化是指将图像上的灰度设置为0或255,也就是将整个图像呈现出明显的黑白效果,降低干扰因素的影响,凸显票号区域轮廓。
本实施例中,设定特定的阈值,对图像进行二值化处理,降低干扰因素的影响,凸显票号区域轮廓。
步骤3、利用Freeman直线检测算法,以获得可能的票号区域并进入步骤4,如无可能的票号区域则跳转到步骤7。
Freeman直线检测算法,相对于现有其它算法,是一种简单而高效的在二值图像中检测目标物体直线边界的算法。
本实施例中,如为第一次票号区域识别,则以图像的右下角为起点,否则以上一次识别出的可能的票号区域左下角为起点应用Freeman直线检测算法,向左查找垂直于底边、与底边相交且宽度大于一定值的直线。如找到符合条件的直线,则以当前直线为高,宽为直线的低端到起点的矩形区域,为可能的票号区域,则进行步骤4操作,否则跳转到步骤7。
步骤4、根据系统预先设定的票号识别特征进行细化识别,以获得票号在步骤3得到的可能的票号区域中的具体位置并进入步骤5,否则跳转到步骤3。通常,票号识别特征为票号位数和票号字符间间距。
步骤5、使用OCR识别方法,在步骤4获得的具体位置进行识别,以获得票号识别结果。
步骤6、根据系统预先设定的票号校验特征对步骤5的票号识别结果进行校验,校验成功,则输出识别结果并进入步骤7,否则进入步骤3。通常,票号校验特征为票号长度和票号检查号计算规则。
步骤7、结束。
综上所述,与现有的直接利用ORC技术进行民航客运票证票号相比,本发明的基于ORC技术的票证票号识别方法可自动快速定位票号位置,并对识别结果进行校验,提高识别速度与正确率,降低人力成本,提高工作效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空结算有限责任公司,未经中国航空结算有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310030661.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种眼部按摩仪
- 下一篇:磨煤机用输送机的防皮带跑偏装置