[发明专利]一种面向办公场景的光学文字识别方法在审
申请号: | 202010010967.3 | 申请日: | 2020-01-06 |
公开(公告)号: | CN111222572A | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 周智 | 申请(专利权)人: | 紫光云技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34 |
代理公司: | 天津滨海科纬知识产权代理有限公司 12211 | 代理人: | 耿树志 |
地址: | 300459 天津市滨海新区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 办公 场景 光学 文字 识别 方法 | ||
1.一种面向办公场景的光学文字识别方法,其特征在于:包括如下步骤:
S1:数据样本采集,包括数据处理以及原始样本分割;
S2:文字检测部分训练,包括预训练与再训练;
S3:文字识别部分训练,包括标签生成与训练;
S4:模型验证,包括检测部分验证和识别部分验证,并最终得到检测和识别的分析报告;
S5:改进流程,包括数据质量改进和算法改进。
2.根据权利要求1所述的一种面向办公场景的光学文字识别方法,其特征在于:所述步骤S1中,数据处理过程包括数据获取、数据清洗和数据集制作,其中,
数据获取:向相关部门申请发票数据,在得到采样许可后进行实地数据采样,对采集到的数据简单归一化整理、并按照采集样本质量进行打分,完成粗粒度的数据分析;
数据清洗:对粗粒度清洗后的数据进行细粒度的清洗,对于不满足最低尺度、分辨率和所占比例的图片予以滤除;
数据集制作:将数据制作成类VOC数据集格式,这个数据集包含以下四项:Annotation装载着标定的数据、JPEG包含着各个jpg格式的图像、score包含着对于各个评分档的数据样本、layout包含了用于训练、训练-验证和验证的样本编号。
3.根据权利要求1所述的一种面向办公场景的光学文字识别方法,其特征在于:所述步骤S1中,原始样本分割过程使用训练得到的模型区分出粗粒度的发票种类。
4.根据权利要求1所述的一种面向办公场景的光学文字识别方法,其特征在于:所述步骤S2中,
预训练:在EAST预训练部分要更改数据集路径、在多核V100上根据资源调节训练参数、将前置训练予以清理,并在tmux下启动训练流程、然后训练得到检测模型;
再训练:在EAST再训练部分要保留前置训练的checkpoint,然后输入相关图像和对应的json文件,restore预训练的参数完成再训练。
5.根据权利要求1所述的一种面向办公场景的光学文字识别方法,其特征在于:所述步骤S3中,
标签生成:将需要识别的发票放在同一个文件夹地址之下,然后根据检测结果裁剪出基于QUAD的八点坐标,将这幅子图和对应的标签打包形成label和path的文件,然后更改CRNN的训练标签集合,以避免预测字符的自动转义;
训练:在CRNN预训练部分要更改数据集路径、在多核V100上根据资源调节训练参数、将前置训练予以清理,并在tmux下启动训练流程、然后训练得到检测模型。
6.根据权利要求1所述的一种面向办公场景的光学文字识别方法,其特征在于:所述步骤S40中,
检测部分验证:分为查看具体的检测结果和查看宏观的检测指标,具体的检测结果包括发票的代码、号码、日期、时间、里程和金额的画框;宏观的检测指标包括对于字段级别的正确率、回归率和F1数值;
识别部分验证:分为查看具体的识别结果和查看宏观的检测指标,具体的识别结果包括发票的代码、号码、日期、时间、里程和金额的具体字段值;宏观的检测指标包括对于字段级别的正确率、回归率和F1数值。
7.根据权利要求1所述的一种面向办公场景的光学文字识别方法,其特征在于:所述步骤S5中,
数据质量改进:对于少量样本的采样,主取补充发票重采样策略改进数据质量;对于特定用途的数据样本,采取数据增强等图像处理方式进行数据质量改进;
算法改进:分为API图像处理层级改进和核心算法改进两个层级,在宏观上选择目标检测+聚类+文字检测+文字识别的核心算法,在API层面进行图像的运算操作。
8.一种面向办公场景的光学文字识别云服务,其特征在于:包括部署基本环境和部署集群环境,
部署基本环境包括部署Docker环境、制作Docker镜像并上传到仓库、以及利用Docker在集群中安装深度学习镜像;
部署集群环境包括深度学习集群框架组件安装、创建K8S部署和服务、调用K8S部署和服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于紫光云技术有限公司,未经紫光云技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010010967.3/1.html,转载请声明来源钻瓜专利网。