[发明专利]基于深度学习和自然语言的光学字符识别优化方法和系统有效

专利信息
申请号: 201811057725.9 申请日: 2018-09-11
公开(公告)号: CN109034147B 公开(公告)日: 2020-08-11
发明(设计)人: 姚毅 申请(专利权)人: 上海唯识律简信息科技有限公司
主分类号: G06K9/20 分类号: G06K9/20;G06K9/34;G06K9/62;G06N3/04
代理公司: 上海专利商标事务所有限公司 31100 代理人: 施浩
地址: 200120 上海市浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 自然语言 光学 字符 识别 优化 方法 系统
【权利要求书】:

1.一种基于深度学习和自然语言的光学字符识别优化方法,其特征在于,包括针对原始文档的预处理过程和之后的识别优化处理过程,其中:

针对原始文档的预处理过程包括:

对原始文档以灰度图像的形式读取,得到灰度矩阵;

对灰度图像进行灰色聚类处理,以使灰度图像分为多个图层;

通过逐层处理的方式找出图像中的文字区域,得到预处理后的特征层和连通区域数据;

识别优化处理过程包括:

以邻近搜索的方式进行膨胀操作,将可能成字的连通区域进行粘合;

采用均匀切割和统计切割结合的方式进行文本切割;

采用卷积神经网络进行单字识别,转换为结构化文档,其中采用卷积神经网络进行单字识别的步骤进一步包括:

采用多层卷积网络构建用于单字识别的神经网络模型;

对构建好的神经网络模型进行模型训练,得到相对收敛的模型;

对训练好的神经网络模型进行模型测试;

基于测试成功的神经网络模型,对文本切割后的图像进行单字识别;

采用隐马尔可夫模型和维特比算法进行词法切分,以实现语法修复,其中用隐马尔可夫模型和维特比算法进行词法切分的步骤进一步包括:

采用隐马尔科夫模型输入大量语料文本构建转移概率矩阵;

采用维特比算法求解动态规划中的最优路径。

2.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,针对原始文档的预处理过程还包括在得到灰度矩阵和灰色聚类处理之间的步骤:

判断图像尺寸是否大于一阈值,如果大于阈值则直接进行灰色聚类处理,否则对图像进行幂次变换处理,将部分灰度区域映射到更宽的区域中。

3.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,针对原始文档的预处理过程还包括在找出图像中的文字区域之后的步骤:

基于连通区域的密度,在特征层中将一些未处理好的区域进行排除;

从特征层中排除孤立区。

4.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,在灰色聚类处理中采用核概率密度估计方法进行处理。

5.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,在查找图像中的文字区域的步骤中,包括:

基于连通区域这一粒度对图像的每个图层进行分解,每个图层被分割为若干个连通区域;

对多个图层进行抗腐蚀能力筛选分解,得到多个特征层;

在多个特征层的基础上,采用池化方法对多个特征层进行整合,其中包括直接叠加特征,根据叠加后的特征进行连通区域划分,再逐步检测连通区域的主要贡献来源于哪个特征层,该连通区域就只保留该特征层的来源。

6.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,识别优化处理过程还包括词法切分步骤之后的步骤:

用语法匹配的方式进行单字词修复。

7.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,膨胀操作是从一个连通区域出发找到该连通区域的水平外切矩形,将连通区域扩展到整个水平外切矩形,当该连通区域与最邻近连通区域的距离小于某一阈值时对该水平外切矩形进行膨胀,膨胀的方向是最邻近连通区域的所在方向,其中当且仅当所在方向是水平时才执行膨胀操作。

8.根据权利要求1所述的基于深度学习和自然语言的光学字符识别优化方法,其特征在于,采用均匀切割和统计切割结合的方式进行文本切割的步骤进一步包括:

通过统计求和得出候选切割线;

判断该候选切割线到左右两条邻近的候选切割线的距离之和与宽长度比例,超出设定阈 值即判断为有效切割线,然后采用统计切割方式进行处理;

在判断出区域属于长条矩形且无法以上述统计切割方式切割时,采用均匀切割方式进行处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海唯识律简信息科技有限公司,未经上海唯识律简信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811057725.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top