[发明专利]栈式降噪自编码神经网络手势图像的识别方法在审
申请号: | 201611180941.3 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106803062A | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 马苗;朱青青;郭敏;武杰 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 西安永生专利代理有限责任公司61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 栈式降噪 编码 神经网络 手势 图像 识别 方法 | ||
技术领域
本发明属于图像处理及模式识别技术领域,具体涉及到栈式降噪自编码神经网络手势图像的识别方法。
背景技术
手势作为一种新兴的人机交互模式,目前已成为计算机视觉领域备受瞩目的研究热点之一。最初研究人员借助数据手套等专用仪器或硬件设备来完成数据的采集,这需要实验人员在采集过程中始终佩戴这些专用设备,使用不便且不易推广。近年来,随着微软的Kinect等非接触式的手势采集产品的产生,人机交互有望做到像人与人之间的信息交互一样自然、方便和快捷。
现有手势识别的研究方法分为两类。一类是把人手区域先从图像中分割出来,再进行手势识别,其不足在于可能引入复杂的预处理环节、分割的准确性直接影响后续手势识别的效果;另一类是从感兴趣的手势区域图像中人工设计手势特征,再根据提取的手势特征识别手势,该类方法的不足在于人工提取特征会不可避免的丢失信息且带有一定的主观性。寻找不受光照、种族、相似颜色干扰和人为主观因素影响的手势识别方法,成为一项具有挑战性的研究课题。
发明内容
本发明所要解决的技术问题在于克服上述手势识别方法的缺点,提供一种不受光照、种族、相似颜色背景干扰以及人为设计手势特征的主观性因素影响的栈式降噪自编码神经网络手势图像的识别方法。
解决上述技术问题所采用的技术方案它是由训练步骤和测试步骤组成,训练步骤为:
(1)对训练样本图像进行预处理
包括彩图灰度化、大小归一化步骤。
彩图灰度化:用(1)式对被训练的样本图像进行灰度化处理,将彩色图像转为灰度图像:
I=Wr×R+Wg×G+Wb×B (1)
式中I为灰度化后的亮度,R为彩色图像的红色分量,G为彩色图像的绿色分量,B为彩色图像的蓝色分量,Wr为彩色图像的红色分量的权重,Wg为彩色图像的绿色分量的权重,Wb为彩色图像的蓝色分量的权重。
大小归一化:将上述灰度化后的图像用双三次插值法或B样条插值法或拉格朗日插值法,归一化为32×32的图像,像素总个数为322。
(2)训练第一个降噪自动编码器
第一个降噪自动编码器结构为:输入层神经元个数为32×32,隐含层神经元个数为500~700,输出层神经元个数为32×32,输入层的每一个神经元分别与隐含层的所有神经元相连接,隐含层的每一个神经元分别与输出层的所有神经元相连接,设定最大迭代次数,在预处理后的32×32训练样本图像中加入噪声,即个数为322×0.3像素的灰度值置为0,形成含噪声的样本图像作为输入层,输入层与隐含层之间共(1024+1)×(500~700)个训练参数,经过前向传播和反向传播,迭代训练至最大迭代次数,得到以列序为主序的500~700维的多尺度特征和输入层与隐含层之间1024×(500~700)维的连接权重。
(3)训练第二个降噪自动编码器
第二个降噪自动编码器结构为:输入层神经元个数为500~700,隐含层神经元个数为100~300,输出层神经元个数为500~700,输入层的每一个神经元分别与隐含层的所有神经元相连接,隐含层的每一个神经元分别与输出层的所有神经元相连接,设定最大迭代次数,在500~700维的多尺度特征中加入噪声,即个数为(500~700)×0.3像素的灰度值置为0,形成输入层,输入层与隐含层之间共((500~700)+1)×(100~300)个训练参数,经过前向传播和反向传播,迭代训练至最大迭代次数,得到以列序为主序的100~300维的多尺度特征和输入层与隐含层之间(500~700)×(100~300)维的连接权重。
(4)训练用于分类的栈式降噪自编码神经网络
用训练好的第一个降噪自动编码器中输入层与隐含层的权重初始化栈式降噪自编码神经网络中第一层每一个神经元分别与第二层中所有神经元的连接权重,用训练好的第二个降噪自动编码器的权重初始化栈式降噪自编码神经网络中第二层的每一个神经元分别与第三层中所有神经元的连接权重,将训练样本输入到栈式降噪自编码神经网络中,经前向传播提取训练样本的多尺度特征,把多尺度特征输入到Softmax分类器中,Softmax分类器按照式(2)进行计算,得到的结果与样本标签的误差值进行反向传播,调整网络的权重直至最大迭代次数,得到训练好的栈式降噪自编码神经网络。
式中,x为样本图像,k为总类别数,zk为样本x属于类别k的概率,w为第三层与Softmax
分类器之间的连接权重矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611180941.3/2.html,转载请声明来源钻瓜专利网。