[发明专利]一种基于OCR的多票据自动识别方法及识别系统在审

专利信息
申请号: 201911192294.1 申请日: 2019-11-28
公开(公告)号: CN111008635A 公开(公告)日: 2020-04-14
发明(设计)人: 章珏 申请(专利权)人: 的卢技术有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06K9/22
代理公司: 南京禹为知识产权代理事务所(特殊普通合伙) 32272 代理人: 王晓东
地址: 211103 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 ocr 票据 自动识别 方法 识别 系统
【权利要求书】:

1.一种基于OCR的多票据自动识别方法,其特征在于:包括以下步骤,

获取OCR的票据样本;

图像采集模块(100)采集待识别的票据图像;

所述票据图像输入图像预处理模块(200)中处理得到次级图像;

去嘈杂模块(300)将所述次级图像去嘈杂后获得标准图像;

所述标准图像输入票据识别模块(400)内进行检测完成识别。

2.如权利要求1所述的基于OCR的多票据自动识别方法,其特征在于:所述图像预处理模块(200)包括以下预处理步骤,

将所述票据图像旋转或透视缩放;

旋转或透视缩放后将所述票据图像中的文字沿水平垂直方向对齐;

经对齐的图像进行剪裁得到所述次级图像。

3.如权利要求1或2所述的基于OCR的多票据自动识别方法,其特征在于:所述去嘈杂模块(300)包括以下步骤,

对所述次级图像进行去色处理;

调整所述次级图像的直方图信息;

保留浅色区域中的浅色像素和深色区域中的深色像素;

获得高反差样本的所述标准图像。

4.如权利要求3所述的基于OCR的多票据自动识别方法,其特征在于:所述票据识别模块(400)包括以下识别处理步骤,

包含待识别字符的所述标准图像进行分析结构;

运用阈值对待测对象进行去噪和矫正;

对文本信息做行列分割;

将分割后的字符图像导入识别模型中进行处理得到原图中的字符信息。

5.如权利要求1~2或4任一所述的基于OCR的多票据自动识别方法,其特征在于:所述识别模型采用CTPN算法模型,包括以下识别步骤,

对复杂场景内横排的文字分割成的不同单元块检测;

加入竖直Anchor检测竖直文字;

利用双向LSTM层学习图像中的空间特征及序列特征;

使用正则表达来查找票据图像中的每个字符对应含义。

6.如权利要求5所述的基于OCR的多票据自动识别方法,其特征在于:所述文字分割包括以下步骤,

通过图像非均匀分割方法对单个文字进行切割;

利用函数得出每个字符的宽度,在多个近似分类中选出切分合适的一组;

使用CNN算法模型对分类后这组字符进行识别辨认。

7.如权利要求6所述的基于OCR的多票据自动识别方法,其特征在于:所述CTPN算法模型包括以下步骤,

用VGG16的前5个Convstage得到feature map,大小为W*H*C;

用3*3的滑动窗口在所述feature map上提取特征;

利用提取的特征来对多个anchor界定出的目标待选区域进行预测;

将提取的特征输入值双向的LSTM层中输出W*256的结果;

再将所述结果输入到至512维的全连接层;

最后通过分类或回归得到识别后的输出。

8.如权利要求7所述的基于OCR的多票据自动识别方法,其特征在于:所述输出包括选择框的高度和中心的y轴的坐标、k个anchor的类别信息、选择框的水平偏移量;所述类别信息能够说明其是否为字符。

9.如权利要求8所述的基于OCR的多票据自动识别方法,其特征在于:所述图像预处理模块(200)包括以下步骤,

经统一尺寸、对齐获得所述次级图像;

所述次级图像设定一个全局的阈值T;

用T将图像的数据分成两部分,包括大于T的像素群和小于T的像素群;

将大于T的像素群的像素值设定为白色和小于T的像素群的像素值设定为黑色。

10.一种基于OCR的多票据自动识别系统,其特征在于:包括图像采集模块(100)、图像预处理模块(200)、去嘈杂模块(300)和票据识别模块(400);

所述图像采集模块(100)用于采集待识别的票据图像;

所述图像预处理模块(200)用于处理采集的图像获得次级图像;

所述去嘈杂模块(300)用于将所述次级图像去嘈杂后获得标准图像;

所述票据识别模块(400)用于检测识别所述标准图像生成识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911192294.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top