[发明专利]文本识别方法、装置、设备及存储介质在审
申请号: | 202210159017.6 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114549816A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 陈昊 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/80;G06K9/62 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 吴江维 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 设备 存储 介质 | ||
本申请提供一种文本识别方法、装置、设备及计算机可读存储介质,该方法包括:获取待识别文本图像,并进行特征提取得到第一特征矩阵;将第一特征矩阵输入文本识别模型的第一特征计算子模型,基于第一特征计算子模型的第一字符特征计算路径得到字符组合特征矩阵,以及基于第二字符特征计算路径得到字符特征矩阵;根据第一特征矩阵、字符组合特征矩阵以及字符特征矩阵确定第二特征矩阵;基于第二特征计算子模型,根据第一、第二特征矩阵、字符组合特征矩阵、字符特征矩阵确定目标特征矩阵;对目标特征矩阵进行解码得到文本排布信息。本申请能够提升识别的准确性以及适用于多种应用场景。本申请还涉及区块链技术,文本排布信息可存储于区块链中。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种文本识别方法、装置、设备及计算机可读存储介质。
背景技术
光学字符识别(OCR)技术是一种应用十分广泛的技术,在字符识别相关系统中,判定文本排布是基本任务,对文本排布分析的质量高低直接影响了最终识别的展示效果,现有方法有通过滑动窗口的文本检测方法,设置大量不同大小的窗口进行逐步分析,但这种方法计算量过大,需要耗费大量计算资源,耗时较长,也容易出现过拟合的情况。另一些方法是基于人工设计的各种特征指标来进行分析,这十分有赖于设计者的经验,并且这些指标特征并不能很好的适用于各种场景,方法的适用性不高。
发明内容
本申请的主要目的在于提供一种文本识别方法、装置、设备及计算机可读存储介质,旨在提升文本排布识别的准确性。
第一方面,本申请提供一种文本识别方法,所述文本识别方法包括以下步骤:
获取待识别文本图像,以及对所述待识别文本图像进行特征提取,得到所述待识别文本图像的第一特征矩阵;
将所述第一特征矩阵输入训练好的文本识别模型的第一特征计算子模型,基于所述第一特征计算子模型的第一字符特征计算路径得到所述待识别文本图像中的字符组合特征矩阵,以及基于所述第一特征计算子模型的第二字符特征计算路径得到所述待识别文本图像中的字符特征矩阵;
基于所述文本识别模型的池化子模型,对所述第一特征矩阵、所述字符组合特征矩阵以及所述字符特征矩阵进行池化处理,得到第二特征矩阵;
基于所述文本识别模型的第二特征计算子模型,对所述第二特征矩阵与预设的激活函数进行非线性计算,以及将计算得到的矩阵与所述第一特征矩阵、所述字符组合特征矩阵、所述字符特征矩阵进行融合,得到目标特征矩阵;
基于所述文本识别模型的解码子模型,对所述目标特征矩阵进行解码处理,得到所述待识别文本图像中的文本排布信息。
第二方面,本申请还提供一种文本识别装置,所述文本识别装置包括:
图像特征获取模块,用于获取待识别文本图像,以及对所述待识别文本图像进行特征提取,得到所述待识别文本图像的第一特征矩阵;
第一特征计算模块,用于将所述第一特征矩阵输入训练好的文本识别模型的第一特征计算子模型,基于所述第一特征计算子模型的第一字符特征计算路径得到所述待识别文本图像中的字符组合特征矩阵,以及基于所述第一特征计算子模型的第二字符特征计算路径得到所述待识别文本图像中的字符特征矩阵;
池化处理模块,用于基于所述文本识别模型的池化子模型,对所述第一特征矩阵、所述字符特征矩阵以及所述字符组合特征矩阵进行池化处理,得到第二特征矩阵;
第二特征计算模块,用于基于所述文本识别模型的第二特征计算子模型,对所述第二特征矩阵与预设的激活函数进行非线性计算,以及将计算得到的矩阵与所述第一特征矩阵、所述字符组合特征矩阵、所述字符特征矩阵进行融合,得到目标特征矩阵;
解码处理模块,用于基于所述文本识别模型的解码子模型,对所述目标特征矩阵进行解码处理,得到所述待识别文本图像中的文本排布信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210159017.6/2.html,转载请声明来源钻瓜专利网。