[发明专利]一种图像中字符识别方法、装置和介质有效
申请号: | 201711285566.3 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108288078B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 麻文华;江修才;刘海龙;刘博 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 字符 识别 方法 装置 介质 | ||
本发明公开了一种图像中字符识别方法、装置和介质,降低图像中字符识别的复杂度,提高字符识别效率。所述图像中字符识别方法,包括:确定输入图像中包含的文本串区域图像;利用特征提取模型提取所述文本串区域图像的特征得到多个特征图像,所述特征提取模型为利用卷积神经网络算法对预先生成的训练图像样本进行训练得到的;基于所述多个特征图像组成的特征图像序列,利用识别概率模型确定所述特征图像序列中每一特征图像对应于预先定义的每一字符的概率值,所述识别概率模型为利用循环神经网络算法对训练图像样本进行训练得到;根据识别概率模型输出的每一特征图像对应于预先定义的每一字符概率值,确定所述特征图像序列对应的字符序列。
技术领域
本发明涉及计算机技术领域,尤其涉及一种图像中字符识别方法、装置和介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
图像中的文本信息作为其内容描述的一种形式,包含了十分丰富且重要的表达信息。采用文本这种高级语义形式,在对图像内容理解和索引方面,具有十分重要的价值。另外,对图像中的文字进行识别,将其转换为文本文字,从而减轻了用户输入对应文字信息的负担,方便用户存储、编辑对应的文字信息。因此,如何识别图像中包含的文字成为当下研究的热点问题之一。
发明内容
本发明实施例提供一种通用的图像中字符识别方法、装置和介质,用以识别图像中包含的字符。
第一方面,提供一种图像中字符识别方法,包括:
确定输入图像中包含的文本串区域图像;
利用特征提取模型提取所述文本串区域图像的特征得到多个特征图像,所述特征提取模型为利用卷积神经网络算法对预先生成的训练图像样本进行训练得到的;
基于所述多个特征图像组成的特征图像序列,利用识别概率模型确定所述特征图像序列中每一特征图像对应于预先定义的每一字符的概率值,所述识别概率模型为利用循环神经网络算法对所述训练图像样本进行训练得到;
根据所述识别概率模型输出的每一特征图像对应于预先定义的每一字符概率值,确定所述特征图像序列对应的字符序列。
可选地,针对不同长度的字符串分别进行训练得到对应的特征提取模型和识别概率模型;以及
在利用预先训练得到的特征提取模型提取所述文本串区域图像的特征得到多个特征图像之前,还包括:
确定所述文本串区域图像的宽高比;
根据确定出的宽高比确定所述文本串区域图像对应的特征提取模型和识别概率模型。
可选地,在特征提取模型和识别概率模型训练结束后,还包括:
针对每一训练图像样本,确定利用所述特征提取模型和识别概率模型对该训练样本进行处理后得到的概率矩阵中所包含的每一概率向量对应的特征图像,所述特征图像为针对该训练样本,利用所述特征提取模型进行处理得到;
针对该训练图像样本包含的每一特征图像,根据该特征图像对应的概率向量中最大概率值对该特征图像进行标注得到标注图像样本;
利用所述标注图像样本对所述特征提取模型继续进行训练,直至利用所述特征提取模型对所述标注图像样本处理得到的每一特征图像对应的概率值达到预设阈值。
可选地,针对每一训练图像样本,按照以下公式确定所述概率矩阵中所包含的每一概率向量对应的特征图像:
recWidthi=recWidthi-1*SWi+KWi,其中:
i为预先定义的网络结构的层标识;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711285566.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序