[发明专利]一种基于OCR的票据自动识别与处理系统有效

专利信息
申请号: 201610070970.8 申请日: 2016-01-31
公开(公告)号: CN105528604B 公开(公告)日: 2018-12-11
发明(设计)人: 高学;金连文 申请(专利权)人: 华南理工大学
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于OCR的票据自动识别与处理系统,包括图像采集模块、快速图像二值化模块、文本块检测与定位模块、单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块、文本识别模块和票据图像检索模块。本发明不仅可以完成发票票据图像的高清采集与压缩存储,还能够对每张票据中的购销方信息、商品信息、开票日期等文字字符进行鲁棒、高精度地定位与识别。票据图像识别能够进行方便的检索。该系统具有处理与识别精度高、成本较低、鲁棒性好、自动化程度高等特点,可广泛应用于票据的计算机自动化管理中,如票据的认证、票据的归档和查询等。
搜索关键词: 一种 基于 ocr 票据 自动识别 处理 系统
【主权项】:
1.一种基于OCR的票据自动识别与处理系统,其特征在于包括票据图像采集模块、快速图像二值化模块、文本块检测与定位模块、单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块、文本识别模块和票据图像检索模块;图像采集模块采集发票票据图像后,快速图像二值化模块对图像进行二值化处理,文本块检测与定位模块进行文本块检测与定位,并根据检测中确定的水平分割线倾角,对图像进行倾斜检测和校正;根据定位的文本块,分别通过单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块进行精确定位与分割,从而得到待识别的票据信息文本行;文本行识别模块将文本行分为纯数字串和中文字符串两种,分别进行识别处理;票据图像检索模块将采集的票据图像与识别结果进行关联存储,完成票据图像数据中的检索,检索内容包括票据图像的购方信息、销方信息、商品信息、开票日期;用户启动系统后,本系统处于等待状态,用户将平整发票放置于摄像头下方,由图像采集模块根据连续帧图像计算触发信号,并触发摄像头进行发票图像采集,并保存到PC电脑的指定目录;然后,系统进行票据图像的自动处理与识别,分别提取与识别增值税发票票据中的购销双方名称与纳税人识别号、商品信息、开票日期信息,并完成票据图像的压缩保存,以及识别信息关联;根据生成的票据图像与识别信息数据,系统完成票据图像检索与归档自动化管理,并能依据识别信息,实现与税务机关数据库中相关票据信息进行认证管理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610070970.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top