[发明专利]一种混合字体的数字序列识别方法在审
| 申请号: | 201711079179.4 | 申请日: | 2017-11-06 |
| 公开(公告)号: | CN107886065A | 公开(公告)日: | 2018-04-06 |
| 发明(设计)人: | 马忠丽;李倩倩;佘静;李帅阳;何江达 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 混合 字体 数字 序列 识别 方法 | ||
技术领域
本发明属于图像识别领域,具体涉及一种混合字体的数字序列识别方法。
背景技术
手写数字识别是光学字符识别技术的一个分支,是光学字符识别技术领域的重要研究方向,它要实现的功能是,如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。手写数字识别在现实生活中有着广泛的应用。由于手写数字随意性大,研究的难度大,所以近年来对于手写数字的研究也是热门的话题。
混合字体的数字序列识别技术属于图像识别技术,目的是为了智能的识别混合数字尤其是人类手写的数字,能提高机器设备的智能性。尽管人们对手写数字的研究已从事了很长的时间,并已经取得了很多成果,但到目前为止,机器的识别本领还是无法与人的认知能力相比。如今,对于单个手写数字的识别,研究效果已经非常成熟,但是对于混合字体的数字序列的识别,在字符领域中,还是一项具有挑战性的课题,对于识别的准确度和速度都具有相当的难度。所以,一个可靠、精准、快速的数字识别系统具有重要的意义。
在人工智能领域的发展中,机器学习的地位可谓是举足轻重,它的发展历程大致经历了浅层学习和深度学习两个研究阶段,机器学习借助模型通过算法,使机器能够从海量的训练数据集中学习数据的统计规律,从而可以对新的未知的数据做识别,对未知的事件做预测。随着深度学习在近年的兴起,基于深度学习的各种研究成了新的突破口。针对数字的识别,使用传统方法,每次识别都需要进行特征提取,速度较慢,准确率还有提升的空间,并且识别的算法是固定不变的,适应性差。而利用深度学习的方法训练模型,特征提取的工作将由模型来完成,并且速度更快,准确率更高,模型是可以不断迭代更新、学习新的特征的,因此具有较强的适应能力。因此对于手写数字识别采取深度学习的方法具有很高的现实意义。
发明内容
针对目前现有技术中存在的不足,本发明旨在提供一种利用卷积神经网络训练神经网络分类器、对待识别图像进行数字检测的混合字体的数字序列识别方法。
本发明的目的是这样实现的:
本发明为一种混合字体的数字序列识别方法,包括待识别图像、图像采集装置、卷积神经网络、神经网络分类器、检测系统;其特征是:所述的检测系统使用滑动窗口,建立同一个图像的不同分辨率的金字塔结构,使用NMS非极大值抑制去除重复的检测;所述的方法分为以下几个步骤:
1利用卷积神经网络训练神经网络分类器;
2神经网络分类器对待识别图像进行数字检测。
所述的待识别图像为印刷字体和手写字体的混合字体数字序列。
所述的卷积神经网络使用LeNet5。
所述的图像采集装置使用PC机上的摄像头。
所述的步骤1具体为:
1.1定义一个网络结构,输入大小32×32,caffemodel大小约2.2M,测试集分类准确率97.2%;
1.2使用全卷积网络方法改造网络结构,使之只包含卷积层。
所述的步骤2具体为:
2.1输入待识别图像,得到候选目标区域:候选目标区域采用滑动窗口,建立同一幅图不同分辨率的图像金字塔;采用非极大值抑制方法去除重复的检测,非极大值抑制采用两个参数,分别为该候选区域的分数,和两个区域的重叠率;
2.2卷积神经网络对候选目标区域进行特征选取:用卷积的方法从原始像素中提取特征,使用反向传播算法修正卷积核参数;
2.3神经网络分类器判断这个区域是否是目标;
2.4对检测的候选目标区域进行定位校正。
本发明与现有技术相比,有益效果在于:
一种混合字体的数字序列识别方法能检测出混合字体的数字序列,识别准确率非常高,适用于所有的视觉系统。
附图说明
图1为本发明的检测系统的结构框图。
图2为本发明的大小为2×2步长为1的滑动窗口的移动过程。
图3为本发明的卷积计算举例。
图4为本发明的deploy文件中最后一层改造前和改造后的对比。
图5为本发明的deploy文件中倒数第三层改造前和改造后的对比。
具体实施方式
下面结合附图对本发明做更详细地描述:
一种混合字体的数字序列识别方法是在原卷积神经网络LeNet5应用的基础上,设计出一个网络结构,从而实现印刷字体和手写字体混合在一起的数字序列识别的目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711079179.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种桶盖自锁装置
- 下一篇:一种液晶面板基材存放装置





