[发明专利]一种基于深度学习的维文图片识别方法有效

专利信息
申请号: 201810324450.4 申请日: 2018-04-12
公开(公告)号: CN108509934B 公开(公告)日: 2021-12-21
发明(设计)人: 王康;王俊涛;汪洋 申请(专利权)人: 南京烽火天地通信科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06K9/32
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 杨海军
地址: 211161 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于深度学习的维文图片识别方法,基于深度学习技术所设计的新神经网络Smart Text Anchor Net(STAN),针对传统文字检测算法在复杂背景多变图像中检测效果不理想的问题,由STAN抽取图像的抽象特征,在复杂背景图像中效果更加理想;并且STAN网络对模糊图像检测效果更好,传统算法一般基于边缘、连通域或纹理,模糊图像对此类算法影响更大;不仅如此,STAN网络使用了smart text anchor,并且进行边界再优化,使其对维文定位的准确率大幅提高,对维文所在位置定位更加精确。
搜索关键词: 一种 基于 深度 学习 维文 图片 识别 方法
【主权项】:
1.一种基于深度学习的维文图片识别方法,其特征在于:初始化采用不包含维文的样本图片,以及包含维文、且已知其中维文位置的样本图片,针对预选卷积神经网络进行训练,获得维文图片识别初级神经网络,其中,维文图片识别初级神经网络中卷积层、池化层的层数根据预设图像感受野和预设步长所决定,所述维文图片识别方法,包括如下步骤:步骤A.针对各帧目标图像帧进行归一化处理,然后进入步骤B;步骤B.分别针对各帧目标图像帧,采用维文图片识别初级神经网络中各层卷积层、各层池化层进行训练,获得目标图象帧所对应的各个特征,即获得各帧目标图像帧分别所对应的各个特征,然后进入步骤C;步骤C.分别针对各帧目标图像帧,按图像区域上下文联系,采用长短期记忆网络层针对目标图像帧所对应的各个特征进行训练,更新目标图象帧所对应的各个特征,构成目标图象帧所对应的特征图,即获得各帧目标图像帧所对应的特征图,然后进入步骤D;步骤D.分别针对各帧目标图像帧所对应的特征图,分别针对特征图中的各个像素点,构建像素点所对应预设数量、预设尺寸的各个图像预选框,然后进入步骤E;步骤E.分别针对各帧目标图像帧所对应的特征图,采用预设卷积核大小的滤波器,针对特征图进行滑动卷积,获得该特征图所对应预设数量维度特征,然后进入步骤F;步骤F.分别针对各帧目标图像帧所对应的特征图,根据特征图所对应预设数量维度特征,针对该特征图上对应的各个图像预选框,采用维文图片识别初级神经网络中各层卷积层、各层池化层进行训练,实现图像预选框的边界优化回归,并进行位置回归,更新该特征图上所对应的各个图像预选框,然后进入步骤G;步骤G.分别针对各帧目标图像帧所对应的特征图,采用预设回归方式,针对特征图上所对应的各个图像预选框,获得图像预选框中包含维文的置信度,以及维文在所对应目标图像帧中的位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火天地通信科技有限公司,未经南京烽火天地通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810324450.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top