[发明专利]一种基于深度学习的维文图片识别方法有效

申请号：	201810324450.4	申请日：	2018-04-12
公开（公告）号：	CN108509934B	公开（公告）日：	2021-12-21
发明（设计）人：	王康;王俊涛;汪洋	申请（专利权）人：	南京烽火天地通信科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06K9/32
代理公司：	南京经纬专利商标代理有限公司 32200	代理人：	杨海军
地址：	211161 江苏省南京***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于深度学习的维文图片识别方法，基于深度学习技术所设计的新神经网络Smart Text Anchor Net(STAN)，针对传统文字检测算法在复杂背景多变图像中检测效果不理想的问题，由STAN抽取图像的抽象特征，在复杂背景图像中效果更加理想；并且STAN网络对模糊图像检测效果更好，传统算法一般基于边缘、连通域或纹理，模糊图像对此类算法影响更大；不仅如此，STAN网络使用了smart text anchor，并且进行边界再优化，使其对维文定位的准确率大幅提高，对维文所在位置定位更加精确。
搜索关键词：	一种基于深度学习维文图片识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于深度学习的维文图片识别方法，其特征在于：初始化采用不包含维文的样本图片，以及包含维文、且已知其中维文位置的样本图片，针对预选卷积神经网络进行训练，获得维文图片识别初级神经网络，其中，维文图片识别初级神经网络中卷积层、池化层的层数根据预设图像感受野和预设步长所决定，所述维文图片识别方法，包括如下步骤：步骤A.针对各帧目标图像帧进行归一化处理，然后进入步骤B；步骤B.分别针对各帧目标图像帧，采用维文图片识别初级神经网络中各层卷积层、各层池化层进行训练，获得目标图象帧所对应的各个特征，即获得各帧目标图像帧分别所对应的各个特征，然后进入步骤C；步骤C.分别针对各帧目标图像帧，按图像区域上下文联系，采用长短期记忆网络层针对目标图像帧所对应的各个特征进行训练，更新目标图象帧所对应的各个特征，构成目标图象帧所对应的特征图，即获得各帧目标图像帧所对应的特征图，然后进入步骤D；步骤D.分别针对各帧目标图像帧所对应的特征图，分别针对特征图中的各个像素点，构建像素点所对应预设数量、预设尺寸的各个图像预选框，然后进入步骤E；步骤E.分别针对各帧目标图像帧所对应的特征图，采用预设卷积核大小的滤波器，针对特征图进行滑动卷积，获得该特征图所对应预设数量维度特征，然后进入步骤F；步骤F.分别针对各帧目标图像帧所对应的特征图，根据特征图所对应预设数量维度特征，针对该特征图上对应的各个图像预选框，采用维文图片识别初级神经网络中各层卷积层、各层池化层进行训练，实现图像预选框的边界优化回归，并进行位置回归，更新该特征图上所对应的各个图像预选框，然后进入步骤G；步骤G.分别针对各帧目标图像帧所对应的特征图，采用预设回归方式，针对特征图上所对应的各个图像预选框，获得图像预选框中包含维文的置信度，以及维文在所对应目标图像帧中的位置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京烽火天地通信科技有限公司，未经南京烽火天地通信科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810324450.4/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的维文图片识别方法有效

专利文献下载