[发明专利]一种基于OCR的票据自动识别与处理系统有效
申请号: | 201610070970.8 | 申请日: | 2016-01-31 |
公开(公告)号: | CN105528604B | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 高学;金连文 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于OCR的票据自动识别与处理系统,包括图像采集模块、快速图像二值化模块、文本块检测与定位模块、单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块、文本识别模块和票据图像检索模块。本发明不仅可以完成发票票据图像的高清采集与压缩存储,还能够对每张票据中的购销方信息、商品信息、开票日期等文字字符进行鲁棒、高精度地定位与识别。票据图像识别能够进行方便的检索。该系统具有处理与识别精度高、成本较低、鲁棒性好、自动化程度高等特点,可广泛应用于票据的计算机自动化管理中,如票据的认证、票据的归档和查询等。 | ||
搜索关键词: | 一种 基于 ocr 票据 自动识别 处理 系统 | ||
【主权项】:
1.一种基于OCR的票据自动识别与处理系统,其特征在于包括票据图像采集模块、快速图像二值化模块、文本块检测与定位模块、单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块、文本识别模块和票据图像检索模块;图像采集模块采集发票票据图像后,快速图像二值化模块对图像进行二值化处理,文本块检测与定位模块进行文本块检测与定位,并根据检测中确定的水平分割线倾角,对图像进行倾斜检测和校正;根据定位的文本块,分别通过单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块进行精确定位与分割,从而得到待识别的票据信息文本行;文本行识别模块将文本行分为纯数字串和中文字符串两种,分别进行识别处理;票据图像检索模块将采集的票据图像与识别结果进行关联存储,完成票据图像数据中的检索,检索内容包括票据图像的购方信息、销方信息、商品信息、开票日期;用户启动系统后,本系统处于等待状态,用户将平整发票放置于摄像头下方,由图像采集模块根据连续帧图像计算触发信号,并触发摄像头进行发票图像采集,并保存到PC电脑的指定目录;然后,系统进行票据图像的自动处理与识别,分别提取与识别增值税发票票据中的购销双方名称与纳税人识别号、商品信息、开票日期信息,并完成票据图像的压缩保存,以及识别信息关联;根据生成的票据图像与识别信息数据,系统完成票据图像检索与归档自动化管理,并能依据识别信息,实现与税务机关数据库中相关票据信息进行认证管理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610070970.8/,转载请声明来源钻瓜专利网。