[发明专利]一种基于深度学习的维文图片识别方法有效
| 申请号: | 201810324450.4 | 申请日: | 2018-04-12 |
| 公开(公告)号: | CN108509934B | 公开(公告)日: | 2021-12-21 |
| 发明(设计)人: | 王康;王俊涛;汪洋 | 申请(专利权)人: | 南京烽火天地通信科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/32 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 杨海军 |
| 地址: | 211161 江苏省南京*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 维文 图片 识别 方法 | ||
本发明涉及一种基于深度学习的维文图片识别方法,基于深度学习技术所设计的新神经网络Smart Text Anchor Net(STAN),针对传统文字检测算法在复杂背景多变图像中检测效果不理想的问题,由STAN抽取图像的抽象特征,在复杂背景图像中效果更加理想;并且STAN网络对模糊图像检测效果更好,传统算法一般基于边缘、连通域或纹理,模糊图像对此类算法影响更大;不仅如此,STAN网络使用了smart text anchor,并且进行边界再优化,使其对维文定位的准确率大幅提高,对维文所在位置定位更加精确。
技术领域
本发明涉及一种基于深度学习的维文图片识别方法,属于文字识别技术领域。
背景技术
维吾尔语是新疆维吾尔自治区的一种重要的少数民族语言,随着新疆地区的快速发展,维语文字的检测和识别技术被广泛地应用于文档识别、视频会议、网络安全监管、文献检索等各个领域。维语识别的效果依赖于检测技术的精确定位,是维语文字识别的先验条件。简单背景的维语文字检测技术已经比较成熟稳定,复杂背景图像中的维语检测还有许多的难点需要克服。
传统的文字检测技术包括使用文字的颜色特征、结构特征或空间特征,由此衍生出的具体算法包括基于边缘特征的文字检测、基于连通域的检测、基于纹理特征的检测以及使用分类器的文字检测算法等等。目前市面上也有专门针对维语检测识别的产品(OCR,Optical Character Recognition)推出,如汉王,文通。
现在中国境内官方的维吾尔语是以阿拉伯字母书写的,同时以拉丁字母书写的拉丁维吾尔作为补充,构词和构型成分比较复杂,现有的一般文字检测技术对维语的检测效果不够理想。此外,对于背景复杂的维文图像,市面上现有的维语检测识别产品,一般都存在着检测召回率较低或位置定位不准确的问题。
发明内容
本发明所要解决的技术问题是提供一种基于深度学习的维文图片识别方法,基于深度学习技术所设计的新神经网络,能够更加精确的定位多媒体图像中的维文文字,并且可以满足复杂背景下的检测识别要求。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种基于深度学习的维文图片识别方法,初始化采用不包含维文的样本图片,以及包含维文、且已知其中维文位置的样本图片,针对预选卷积神经网络进行训练,获得维文图片识别初级神经网络,其中,维文图片识别初级神经网络中卷积层、池化层的层数根据预设图像感受野和预设步长所决定,所述维文图片识别方法,包括如下步骤:
步骤A.针对各帧目标图像帧进行归一化处理,然后进入步骤B;
步骤B.分别针对各帧目标图像帧,采用维文图片识别初级神经网络中各层卷积层、各层池化层进行训练,获得目标图像 帧所对应的各个特征,即获得各帧目标图像帧分别所对应的各个特征,然后进入步骤C;
步骤C.分别针对各帧目标图像帧,按图像区域上下文联系,采用长短期记忆网络层针对目标图像帧所对应的各个特征进行训练,更新目标图像 帧所对应的各个特征,构成目标图像 帧所对应的特征图,即获得各帧目标图像帧所对应的特征图,然后进入步骤D;
步骤D.分别针对各帧目标图像帧所对应的特征图,分别针对特征图中的各个像素点,构建像素点所对应预设数量、预设尺寸的各个图像预选框,然后进入步骤E;
步骤E.分别针对各帧目标图像帧所对应的特征图,采用预设卷积核大小的滤波器,针对特征图进行滑动卷积,获得该特征图所对应预设数量维度特征,然后进入步骤F;
步骤F.分别针对各帧目标图像帧所对应的特征图,根据特征图所对应预设数量维度特征,针对该特征图上对应的各个图像预选框,采用维文图片识别初级神经网络中各层卷积层、各层池化层进行训练,实现图像预选框的边界优化回归,并进行位置回归,更新该特征图上所对应的各个图像预选框,然后进入步骤G;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火天地通信科技有限公司,未经南京烽火天地通信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810324450.4/2.html,转载请声明来源钻瓜专利网。





