[发明专利]基于深度神经网络的未知手写体数字识别方法有效
申请号: | 202010385802.4 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111695645B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 何行;赵生妹 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V30/244 | 分类号: | G06V30/244;G06N3/04;G06N3/08 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 未知 手写体 数字 识别 方法 | ||
1.一种基于深度神经网络的未知手写体数字识别方法,其特征在于:所述方法包括以下步骤:
步骤一:以频谱中心为原点,选取频谱(fx,fy),-h/2≤fx≤h/2,-v/2≤fy≤V/2,其中h为所取中心区域的宽度,v为所取中心区域的高度为频谱中心区域,根据选取的傅里叶频谱中心区域每个位置,设计一组傅里叶的正弦散斑(P0,Pπ/2,Pπ,P3π/2),其中每组有相差π/2相位的四幅散斑,因此,正弦散斑有M=h×v组正弦散斑的大小与手写体数字图片的大小相同,均为N×N,然后将设计好的散斑依次加载到数字微镜阵列设备上;
步骤二:将经过DMD调制后的正弦散斑照射到手写体数字图片上,透过光强经过透镜聚焦后都由一个无空间分辨的桶探测器接收,分别获得到四个相位相差π/2的桶探测器值Dφ(fx,fy),φ(0,π/2,π,3π/2);
步骤三:将傅里叶四步相移的正弦散斑照射到已知手写体数字图片上,通过关联成像系统,记录桶探测器值通过计算[D0(fx,fy)-Dπ(fx,fy)]+j·[Dπ/2(fx,fy)-D3π/2(fx,fy)]获取手写体数字图片对应(fx,fy)的频谱系数,从而获得手写体数字的特征信息;
步骤四:重复以上过程,当获得M个频谱系数后,将M频谱系数构成矢量且作为特征信息输入至一设计的深度神经网络中进行训练;
步骤五:不断重复步骤一至四,完成神经网络的训练;
步骤六:对于未知的手写体数字,根据步骤一至四,获得它傅里叶频谱中心区域的M个频谱系数,并输入至已训练好的神经网络中,获得它的数字类别,从而实现对未知手写体数字图片的识别。
2.如权利要求1所述的基于深度神经网络的未知手写体数字识别方法,其特征在于:所述步骤四中的深度神经网络包含一个输入层、三个隐藏层和一个输出层,层与层之间为全连接,且每一层的输出和输入之间存在一个线性关系和非线性的激活函数,为了防止出现过拟合,在全连接层加入了dropout函数,深度神经网络的输出层采用了softmax分类器实现对0~9十种手写体数字图片的分类识别,将概率值最大的神经元索引确认为神经网络对手写体数字图片的预测结果;同时为了使预测结果更接近真实值,在网络中引入了损失函数J,J沿着梯度下降方向优化,采用了Adam算法动态调整每个参数的学习率,以便获得更为准确的预测结果。
3.如权利要求1所述的基于深度神经网络的未知手写体数字识别方法,其特征在于:所述方法为了实现未知的手写体数字的识别,将关联成像的技术引入深度神经网络,在不成像的情况下就能对手写体数字进行识别。
4.如权利要求1所述的基于深度神经网络的未知手写体数字识别方法,其特征在于:所述步骤一中根据所选取的傅里叶频谱中心区域每个位置设计散斑的公式为Pφ(x,y,fx,fy)=a+c·cos(2πfxx+2πfxy+φ),其中Pφ(x,y,fx,fy)是一个与手写体数字图片大小相同的且相位为φ的正弦散斑;a表示平均图像强度,c是一个常量,φ表示相位,取值是φ(0,π/2,π,3π/2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010385802.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泵用双端面机械密封装置
- 下一篇:加热控制方法、加热装置及计算机存储介质