[发明专利]栈式降噪自编码神经网络手势图像的识别方法在审

专利信息
申请号: 201611180941.3 申请日: 2016-12-20
公开(公告)号: CN106803062A 公开(公告)日: 2017-06-06
发明(设计)人: 马苗;朱青青;郭敏;武杰 申请(专利权)人: 陕西师范大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/08
代理公司: 西安永生专利代理有限责任公司61201 代理人: 申忠才
地址: 710062 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 栈式降噪 编码 神经网络 手势 图像 识别 方法
【权利要求书】:

1.一种栈式降噪自编码神经网络手势图像的识别方法,其特征在于它是由训练步骤和测试步骤组成,所述的训练步骤为:

(1)对训练样本图像进行预处理

包括彩图灰度化、大小归一化步骤;

彩图灰度化:用(1)式对被训练的样本图像进行灰度化处理,将彩色图像转为灰度图像:

I=Wr×R+Wg×G+Wb×B (1)

式中I为灰度化后的亮度,R为彩色图像的红色分量,G为彩色图像的绿色分量,B为彩色图像的蓝色分量,Wr为彩色图像的红色分量的权重,Wg为彩色图像的绿色分量的权重,Wb为彩色图像的蓝色分量的权重;

大小归一化:将上述灰度化后的图像用双三次插值法或B样条插值法或拉格朗日插值法,归一化为32×32的图像,像素总个数为322

(2)训练第一个降噪自动编码器

第一个降噪自动编码器结构为:输入层神经元个数为32×32,隐含层神经元个数为500~700,输出层神经元个数为32×32,输入层的每一个神经元分别与隐含层的所有神经元相连接,隐含层的每一个神经元分别与输出层的所有神经元相连接,设定最大迭代次数,在预处理后的32×32训练样本图像中加入噪声,即个数为322×0.3像素的灰度值置为0,形成含噪声的样本图像作为输入层,输入层与隐含层之间共(1024+1)×(500~700)个训练参数,经过前向传播和反向传播,迭代训练至最大迭代次数,得到以列序为主序的500~700维的多尺度特征和输入层与隐含层之间1024×(500~700)维的连接权重;

(3)训练第二个降噪自动编码器

第二个降噪自动编码器结构为:输入层神经元个数为500~700,隐含层神经元个数为100~300,输出层神经元个数为500~700,输入层的每一个神经元分别与隐含层的所有神经元相连接,隐含层的每一个神经元分别与输出层的所有神经元相连接,设定最大迭代次数,在500~700维的多尺度特征中加入噪声,即个数为(500~700)×0.3像素的灰度值置为0,形成输入层,输入层与隐含层之间共((500~700)+1)×(100~300)个训练参数,经过前向传播和反向传播,迭代训练至最大迭代次数,得到以列序为主序的100~300维的多尺度特征和输入层与隐含层之间(500~700)×(100~300)维的连接权重;

(4)训练用于分类的栈式降噪自编码神经网络

用训练好的第一个降噪自动编码器中输入层与隐含层的权重初始化栈式降噪自编码神经网络中第一层每一个神经元分别与第二层中所有神经元的连接权重,用训练好的第二个降噪自动编码器的权重初始化栈式降噪自编码神经网络中第二层的每一个神经元分别与第三层中所有神经元的连接权重,将训练样本输入到栈式降噪自编码神经网络中,经前向传播提取训练样本的多尺度特征,把多尺度特征输入到Softmax分类器中,Softmax分类器按照式(2)进行计算,得到的结果与样本标签的误差值进行反向传播,调整网络的权重直至最大迭代次数,得到训练好的栈式降噪自编码神经网络;

<mrow><mfenced open = "[" close = "]"><mtable><mtr><mtd><msub><mi>z</mi><mn>1</mn></msub></mtd></mtr><mtr><mtd><msub><mi>z</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><mo>...</mo></mtd></mtr><mtr><mtd><msub><mi>z</mi><mi>k</mi></msub></mtd></mtr></mtable></mfenced><mo>=</mo><mfrac><mn>1</mn><mrow><msubsup><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>k</mi></msubsup><msup><mi>e</mi><mrow><msubsup><mi>w</mi><mi>j</mi><mi>T</mi></msubsup><mi>x</mi></mrow></msup></mrow></mfrac><mfenced open = "[" close = "]"><mtable><mtr><mtd><msup><mi>e</mi><mrow><msubsup><mi>w</mi><mn>1</mn><mi>T</mi></msubsup><mi>x</mi></mrow></msup></mtd></mtr><mtr><mtd><msup><mi>e</mi><mrow><msubsup><mi>w</mi><mn>2</mn><mi>T</mi></msubsup><mi>x</mi></mrow></msup></mtd></mtr><mtr><mtd><mo>...</mo></mtd></mtr><mtr><mtd><msup><mi>e</mi><mrow><msubsup><mi>w</mi><mi>k</mi><mi>T</mi></msubsup><mi>x</mi></mrow></msup></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>

式中,x为样本图像,k为总类别数,zk为样本x属于类别k的概率,w为第三层与Softmax

分类器之间的连接权重矩阵;

所述的测试步骤为:

(1)对测试样本图像进行预处理

测试样本图像进行预处理与训练样本图像进行预处理步骤(1)相同;

(2)对输入的测试样本图像进行识别

将预处理后的测试样本输入到栈式降噪自编码神经网络中,经前向传播提取训练样本的多尺度特征,把多尺度特征输入到Softmax分类器中,计算出该样本所属a、b、c、d、e、f、g、h、i、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y共24个英文字母的每个字母的概率,得到一个由概率值组成的24维向量,置概率值最大的位置值为1,其余位置值为0,1所在的位置为所属的类别,[1 0 0…0]中1所在的位置为第1位,表示该样本属于第1类,表示手势字母a;[0 1 0…0]中1所在的位置为第2位,表示该样本属于第2类,表示手势字母b;…;[0 0 0 0 0 0 0 0 1 0…]中1所在的位置为第9位,表示该样本属于第9类,表示手势字母i;[0 0 0 0 0 0 0 0 0 1 0…]中1所在的位置为第10位,表示该样本属于第10类,表示手势字母k;…;[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1]中1所在的位置为第24位,表示该样本属于第24类,表示手势字母y。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611180941.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top