[发明专利]一种基于卷积神经网络的古彝文识别方法有效
申请号: | 201810638037.5 | 申请日: | 2018-06-20 |
公开(公告)号: | CN108960301B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陈善雄;王明贵;王小龙;马辉;刘云;张仕学 | 申请(专利权)人: | 西南大学;贵州工程应用技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京元本知识产权代理事务所(普通合伙) 11308 | 代理人: | 常桑 |
地址: | 400715*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 彝文 识别 方法 | ||
1.一种基于卷积神经网络的古彝文识别方法,其特征在于:先构建一个由4个卷积层、2个全连接层和1个softmax层构成的卷积神经网络,然后在每个所述卷积层的前方添加额外的卷积层;接着将ResBlock、Inception以及SEBlock相结合形成一个混合结构,并将SEBlock附加在Incpetion结构的后面替换原始ResBlock中的权重层,再将所述混合结构添加至每个所述卷积层的前方得到改进后的卷积神经网络;再在Inception结构中分别使用1×1,3×3,5×5三种卷积核进行卷积并将它们的输出进行通道叠加,随后使用SEBlock对Inception结构的输出进行特征重新标定,将重新标定后的残差累加到改进后的卷积神经网络原始的输入上,最后将改进后的卷积神经网络输出的类概率分布向量中概率最大的类别作为最终的字符分类识别的结果,其中改进后的卷积神经网络原始的输入为古彝文手写样板,要先对原始样本进行宽度变化和弹性形变,然后进行仿射变换,且对于仿射变换的旋转、缩放、平移按序进行,接着进行模糊加噪,最后进行亮度及对比度变换,最终经过增量后的样本均为黑底白字。
2.如权利要求1所述的基于卷积神经网络的古彝文识别方法,其特征在于:每个所述卷积层的上方还添加有BatchNorm层。
3.如权利要求1所述的基于卷积神经网络的古彝文识别方法,其特征在于:使用ReLU函数max(0,x)作为所述改进后的卷积神经网络的激活函数。
4.如权利要求1所述的基于卷积神经网络的古彝文识别方法,其特征在于:所述改进后的卷积神经网络使用Adam算法作为优化算法;所述Adam算法拥有4个参数即α,β1,β2以及ε;其中α是学习率,默认为0.0001;β1为一阶矩估计指数衰减率,默认为0.9;β2为二阶矩估计指数衰减率,默认为0.999;ε为添加到分母中的最小值,用于防止分母为0,默认为1e-8。
5.如权利要求1所述的基于卷积神经网络的古彝文识别方法,其特征在于:改进后的卷积神经网络模型的输入为大小64×64且通道数为1的灰度图,改进后的卷积神经网络模型的输出为2162维的类概率分布向量;
且改进后的卷积神经网络模型中每一个卷积层的后方都跟随着一个最大池化层,各卷积层的感受大小均为3×3,步长为1,其特征通道数分别为100、200、300、400,输出的特征图的大小分别为32×32,16×16,8×8,4×4;在整个网络的末尾的全连接层的隐藏单元数则分别为2048、1024,并对第一个全连接层的输出使用概率为0.5的Dropout层对其进行随机失活,以增强模型的泛化能力,最后使用一个softmax层对全连接的输出进行评分,得到分类的概率分布,并将概率最大的类别作为字符分类识别的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学;贵州工程应用技术学院,未经西南大学;贵州工程应用技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810638037.5/1.html,转载请声明来源钻瓜专利网。