[发明专利]一种混合字体的数字序列识别方法在审

专利信息
申请号: 201711079179.4 申请日: 2017-11-06
公开(公告)号: CN107886065A 公开(公告)日: 2018-04-06
发明(设计)人: 马忠丽;李倩倩;佘静;李帅阳;何江达 申请(专利权)人: 哈尔滨工程大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江省哈尔滨市南岗区*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 混合 字体 数字 序列 识别 方法
【说明书】:

技术领域

发明属于图像识别领域,具体涉及一种混合字体的数字序列识别方法。

背景技术

手写数字识别是光学字符识别技术的一个分支,是光学字符识别技术领域的重要研究方向,它要实现的功能是,如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。手写数字识别在现实生活中有着广泛的应用。由于手写数字随意性大,研究的难度大,所以近年来对于手写数字的研究也是热门的话题。

混合字体的数字序列识别技术属于图像识别技术,目的是为了智能的识别混合数字尤其是人类手写的数字,能提高机器设备的智能性。尽管人们对手写数字的研究已从事了很长的时间,并已经取得了很多成果,但到目前为止,机器的识别本领还是无法与人的认知能力相比。如今,对于单个手写数字的识别,研究效果已经非常成熟,但是对于混合字体的数字序列的识别,在字符领域中,还是一项具有挑战性的课题,对于识别的准确度和速度都具有相当的难度。所以,一个可靠、精准、快速的数字识别系统具有重要的意义。

在人工智能领域的发展中,机器学习的地位可谓是举足轻重,它的发展历程大致经历了浅层学习和深度学习两个研究阶段,机器学习借助模型通过算法,使机器能够从海量的训练数据集中学习数据的统计规律,从而可以对新的未知的数据做识别,对未知的事件做预测。随着深度学习在近年的兴起,基于深度学习的各种研究成了新的突破口。针对数字的识别,使用传统方法,每次识别都需要进行特征提取,速度较慢,准确率还有提升的空间,并且识别的算法是固定不变的,适应性差。而利用深度学习的方法训练模型,特征提取的工作将由模型来完成,并且速度更快,准确率更高,模型是可以不断迭代更新、学习新的特征的,因此具有较强的适应能力。因此对于手写数字识别采取深度学习的方法具有很高的现实意义。

发明内容

针对目前现有技术中存在的不足,本发明旨在提供一种利用卷积神经网络训练神经网络分类器、对待识别图像进行数字检测的混合字体的数字序列识别方法。

本发明的目的是这样实现的:

本发明为一种混合字体的数字序列识别方法,包括待识别图像、图像采集装置、卷积神经网络、神经网络分类器、检测系统;其特征是:所述的检测系统使用滑动窗口,建立同一个图像的不同分辨率的金字塔结构,使用NMS非极大值抑制去除重复的检测;所述的方法分为以下几个步骤:

1利用卷积神经网络训练神经网络分类器;

2神经网络分类器对待识别图像进行数字检测。

所述的待识别图像为印刷字体和手写字体的混合字体数字序列。

所述的卷积神经网络使用LeNet5。

所述的图像采集装置使用PC机上的摄像头。

所述的步骤1具体为:

1.1定义一个网络结构,输入大小32×32,caffemodel大小约2.2M,测试集分类准确率97.2%;

1.2使用全卷积网络方法改造网络结构,使之只包含卷积层。

所述的步骤2具体为:

2.1输入待识别图像,得到候选目标区域:候选目标区域采用滑动窗口,建立同一幅图不同分辨率的图像金字塔;采用非极大值抑制方法去除重复的检测,非极大值抑制采用两个参数,分别为该候选区域的分数,和两个区域的重叠率;

2.2卷积神经网络对候选目标区域进行特征选取:用卷积的方法从原始像素中提取特征,使用反向传播算法修正卷积核参数;

2.3神经网络分类器判断这个区域是否是目标;

2.4对检测的候选目标区域进行定位校正。

本发明与现有技术相比,有益效果在于:

一种混合字体的数字序列识别方法能检测出混合字体的数字序列,识别准确率非常高,适用于所有的视觉系统。

附图说明

图1为本发明的检测系统的结构框图。

图2为本发明的大小为2×2步长为1的滑动窗口的移动过程。

图3为本发明的卷积计算举例。

图4为本发明的deploy文件中最后一层改造前和改造后的对比。

图5为本发明的deploy文件中倒数第三层改造前和改造后的对比。

具体实施方式

下面结合附图对本发明做更详细地描述:

一种混合字体的数字序列识别方法是在原卷积神经网络LeNet5应用的基础上,设计出一个网络结构,从而实现印刷字体和手写字体混合在一起的数字序列识别的目的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711079179.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top