[发明专利]一种基于卷积神经网络的古彝文识别方法有效

专利信息
申请号: 201810638037.5 申请日: 2018-06-20
公开(公告)号: CN108960301B 公开(公告)日: 2021-09-10
发明(设计)人: 陈善雄;王明贵;王小龙;马辉;刘云;张仕学 申请(专利权)人: 西南大学;贵州工程应用技术学院
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04
代理公司: 北京元本知识产权代理事务所(普通合伙) 11308 代理人: 常桑
地址: 400715*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 彝文 识别 方法
【说明书】:

发明基于卷积神经网络的古彝文识别方法,先构建一个由4个卷积层、2个全连接层和1个softmax层构成的卷积神经网络,在每个卷积层的前方添加额外的卷积层;将ResBlock、Inception以及SEBlock相结合形成一个混合结构,并将SEBlock附加在Incpetion结构的后面替换原始ResBlock中的权重层,再将混合结构添加至每个卷积层的前方得到改进后的卷积神经网络;在Inception结构中分别使用1×1,3×3,5×5三种卷积核进行卷积并将它们的输出进行通道叠加,再次使用一个1×1的卷积核将通道数还原,使用SEBlock对Inception结构的输出进行特征重新标定,将重新标定后的残差累加到原始的输入上。本发明构思合理,识别效果好,能避免识别中出现性能下降的问题。

技术领域

本发明涉及文字识别技术领域,具体涉及一种基于卷积神经网络的古彝文识别方法。

背景技术

文字识别技术是计算机视觉领域的重要课题,其涉及到了机器学习、自然语言处理、统计学等诸多领域,一直是一个比较热门的话题。文字识别的目的是将图像中的文本通过一系列的处理转换为数字形式。文字识别并不是一个新的问题,早在计算机发明前,人们就尝试对文字识别进行研究。传统的文字识别主要依赖于先验规则和人工特征,人们往往需要对原始图像进行繁琐的预处理及特征提取工作,但这些往往并不能完全的表示一个事物,或多或少会遗漏一些比较重要的特征。而以卷积神经网络(Convolutional NerualNetwork,CNN)为代表的深度学习能够通过大量的样本自动发现内在特征,避免了繁琐的特征提取工作,使得设计一个端到端的文字识别系统成为可能。当前深度学习已经在英文、中文识别上得到了相当广泛的应用,并取得了比较满意的结果。但相较于比较成熟的汉字识别而言,国内的古彝文识别当前仅处于起步阶段。现存的古彝文基本都为手写体,相较于标准印刷体而言,手写体的多样性无疑加大了识别的难度。古彝文拥有这庞大的字符集,2004年出版的《滇川黔桂彝文字集》就包含着87000多个字。整理后的贵州彝文楷体字体中也拥有着9000多个古彝文字。对如此庞大的字符集进行分类是一个比较困难的任务。此外,手写样本库是古彝文识别成功的关键因素,直接决定着识别结果的效果。然而当前的古彝文研究仍然主要集中在古彝文整理,没有人专门对古彝文识别进行研究,找不到可用的古彝文手写样本库。再则随着时间的流逝古彝文通晓者越来越少,这也给古彝文的识别带来了新的挑战。

相较于操作繁琐的传统文字识别技术,以卷积神经网络为代表的深度学习可以自动从样本中发现特征,避免了繁琐的样本提取工作,从而简化设计并大幅度提高识别准确率。使得设计一个端到端的文字识别系统成为可能。

近些年来,卷积神经网络发展迅猛,各种变体层出不穷,卷积神经网络的深度不断增加,比较具有影响力主要有ResNet、Inception、SENet等等。然而这些网络大多是面向GPU优化的,同时其训练往往需要耗费大量的内存与计算资源,普通的个人计算机往往无法负担这种重负。例如Inception V4结构,将其中所有Inception-resnet结构重复次数缩减1,也将消耗约11GB的内存,随着批数据大小的增大,所消耗的内存更加庞大,而当前大多数的个人计算机仅有8GB内存。此外,由于大多数个人计算机无法提供相应的显卡加速功能,其训练时间将会以月为单位。鉴于此,在修改卷积神经网络提升准确率时,应当尽量避免带入新的计算量或减少网络已有的计算量。而对于传统的卷积神经网络(如图1所示),单纯地向网络中添加额外的卷积层,其带来的性能是有限的,同时随着添加的卷积层的增多,其训练时间急剧增加,但模型的性能却出现了下降。

发明内容

针对上述背景技术中所指的问题,本发明提出了一种基于卷积神经网络的古彝文识别方法,能够避免古彝文识别中随着卷积层数的增加而出现性能下降的问题,同时在带入有限计算量的情况下,进一步提升模型的性能;同时提出了一套样本增量流程对于手写样本进行增量,扩大样本集,提升模型的稳定性,改善模型性能,避免了繁琐的预处理技术,是一种端到端的古彝文识别方法。

本发明的技术方案如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学;贵州工程应用技术学院,未经西南大学;贵州工程应用技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810638037.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top