[发明专利]一种图像中字符识别方法、装置和介质有效
申请号: | 201711285566.3 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108288078B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 麻文华;江修才;刘海龙;刘博 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 字符 识别 方法 装置 介质 | ||
1.一种图像中字符识别方法,其特征在于,包括:
在视频图像序列中,选择边缘密度满足预设阈值的视频图像作为输入图像;
确定输入图像中包含的文本串区域图像;
确定所述文本串区域图像的宽高比;
根据确定出的宽高比确定所述文本串区域图像对应的特征提取模型和识别概率模型;所述特征提取模型和所述识别概率模型是针对不同长度的字符串分别进行训练得到的;
利用特征提取模型提取所述文本串区域图像的特征得到多个特征图像,所述特征提取模型为利用卷积神经网络算法对预先生成的训练图像样本进行训练得到的;
基于所述多个特征图像组成的特征图像序列,利用识别概率模型确定所述特征图像序列中每一特征图像对应于预先定义的每一字符的概率值,所述识别概率模型为利用循环神经网络算法对所述训练图像样本进行训练得到;
根据所述识别概率模型输出的每一特征图像对应于预先定义的每一字符概率值,确定所述特征图像序列对应的字符序列;
结合多帧视频图像的识别结果对得到的字符序列进行校验;
根据所述识别概率模型输出的每一特征图像对应于预先定义的每一字符概率值,确定所述特征图像序列对应的字符序列,包括:
按照以下任一方式获得特征图像序列对应的字符序列:
第一种方式,分别输出所述特征图像序列中每一特征图像对应的概率值最大的字符组成所述特征图像序列对应的字符序列;
第二种方式,分析前后N个字符共同出现的概率,根据分析结果输出组成所述特征图像序列对应的字符序列;
所述训练图像样本是按照以下流程生成的:
从给定的图像中随机截取预设大小的图像;
按照预设概率随机从字符集中选择若干个字符组成字符串;
将得到的字符串按照随机选择的字体和排列形状渲染到截取的图像中并添加噪声干扰后得到所述训练图像样本;
在特征提取模型和识别概率模型训练结束后,所述方法还包括:
针对每一训练图像样本,确定利用所述特征提取模型和识别概率模型对该训练样本进行处理后得到的概率矩阵中所包含的每一概率向量对应的特征图像,所述特征图像为针对该训练样本,利用所述特征提取模型进行处理得到;
针对该训练图像样本包含的每一特征图像,根据该特征图像对应的概率向量中最大概率值对该特征图像进行标注得到标注图像样本;
利用所述标注图像样本对所述特征提取模型继续进行训练,直至利用所述特征提取模型对所述标注图像样本处理得到的每一特征图像对应的概率值达到预设阈值。
2.如权利要求1所述的方法,其特征在于,针对每一训练图像样本,按照以下公式确定所述概率矩阵中所包含的每一概率向量对应的特征图像:
recWidthi=recWidthi-1*SWi+KWi,其中:
i为预先定义的网络结构的层标识;
recWidthi为第i层对应的概率矩阵中所包含的每一概率向量对应的特征图像;
recWidthi-1为第(i-1)层对应的概率矩阵中所包含的每一概率向量对应的特征图像;
SWi为第i层对应的卷积前进步长;
KWi为第i层对应的卷积核的宽度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711285566.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序