[发明专利]手势识别方法和系统在审
申请号: | 201611115801.8 | 申请日: | 2016-12-07 |
公开(公告)号: | CN107239727A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 姚颂;倪剑桥 | 申请(专利权)人: | 北京深鉴智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙)11452 | 代理人: | 屠长存 |
地址: | 100083 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手势 识别 方法 系统 | ||
技术领域
本发明涉及图像识别领域,特别是涉及一种手势识别方法和系统。
背景技术
神经网络是一种基于仿生设计的数学模型,近年来被广泛应用于图像识别,语音识别等任务。
神经元的积累的刺激是由其他神经元传递过来的刺激量和对应的权重之和,用Xj表示这种积累,Yi表示某个神经元传递过来的刺激量,Wi表示链接某个神经元刺激的权重,得到公式:Xj=(y1*W1)+(y2*W2)+...+(yi*Wi)+...+(yn*Wn),而当Xj完成积累后,完成积累的神经元本身对周围的一些神经元传播刺激,将其表示为yj得到如下所示:yj=f(Xj),神经元根据积累后Xj的结果进行处理后,对外传递刺激yj。用f函数映射来表示这种处理,将它称之为激活函数。
卷积神经网络是将人工神经网络和深度学习技术相结合而产生的新型人工神经网络方法,是为了识别二维形状而设计的多层感知器,具有局部感知区域、层次结构化、特征抽取和分类过程结合的全局训练的特点。Fukushima提出的基于神经元之间的局部连接型和层次结构组织的Neocogition模型是卷积神经网络的第一个实现网络。LeCun等人设计并采用基于误差梯度的算法训练了卷积神经网络,在一些模式识别领域取得非常好的性能,并且给出了卷积神经网络公式的推导和证明。
卷积神经网络已经成功地应用到了文档分析、人脸检测、语音检测、车牌识别、手写数字识别、视频中的人体动作识别等各个方面。
发明内容
本发明的主要目的是提供一种手势识别方法和系统,其能够准确、快速地识别出待检测图像中的手势。
根据本发明的一个方面,提供了一种手势识别方法,用于从输入图像中识别手势,该方法包括:通过对输入图像进行亮度和色彩分析,获取输入图像中的潜在人手区域;使用人手识别模型获取输入图像中各个潜在人手区域属于人手区域的概率值;选择概率值大于预定阈值的潜在人手区域作为人手区域;从输入图像中截取人手区域图像;以及将人手区域图像输入手势识别模型,以识别其对应的手势。
优选地,该方法还可以包括:根据人手区域的长宽比例,计算该人手区域图像到标准人手图像的仿射变换矩阵;使用仿射变换矩阵对人手区域图像进行仿射变换,得到标准化的人手区域图像,其中,将标准化的人手区域图像输入手势识别模型,以识别其所对应的手势。
优选地,通过对输入图像进行亮度和色彩分析获取输入图像中的潜在人手区域的步骤可以包括:选择输入图像中光流特征绝对值大于预设阈值且色彩属于预设肤色区间的区域为潜在人手区域。
优选地,该方法还可以包括:在确定人手区域后,计算后续一帧或多帧输入图像中对应于人手区域的图像区域的光流特征值,以确定后续一帧或多帧输入图像中的人手区域。
优选地,在对输入图像进行亮度和色彩分析之前,该方法还可以包括:对输入图像进行检测,以确定用户是否发出预定肢体动作;在检测到用户发出预定肢体动作的情况下,执行对输入图像进行亮度和色彩分析的步骤。
优选地,在获取输入图像中的潜在人手区域之后,该方法还可以包括:基于预定的模型或算法,识别出输入图像中的人脸潜在区域和/或人体潜在区域;根据识别出的人脸潜在区域和/或人体潜在区域,删除处于不合理范围的潜在人手区域。
优选地,该方法还可以包括:对输入图像进行多尺度缩放,以得到不同尺度的输入图像;对不同尺度的输入图像执行对输入图像进行亮度和色彩分析的步骤。
优选地,人手识别模型和手势识别模型均为卷积神经网络模型。
根据本发明的另一个方面,还提供了一种手势识别系统,用于从输入图像中识别手势,该系统包括:存储器,用于存储输入图像;CPU模块,用于控制FPGA模块,并对输入图像进行亮度和色彩分析,以获取输入图像中的潜在人手区域;FPGA模块,用于在其上实现人手识别模型和手势识别模型,其中,人手识别模型用于获取输入图像中各个潜在人手区域属于人手区域的概率值,以便选择概率值大于预定阈值的潜在人手区域作为人手区域,并从输入图像中截取人手区域图像,手势识别模型用于从人手区域图像中识别出对应的手势。
优选地,CPU模块根据人手区域的长宽比例,计算该人手区域图像到标准人手图像的仿射变换矩阵,该系统还可以包括:几何变换模块,用于使用仿射变换矩阵对人手区域图像进行仿射变换,得到标准化的人手区域图像,其中,手势识别模型从标准化的人手区域图像中识别出对应的手势。
优选地,CPU模块选择输入图像中光流特征绝对值大于预设阈值且色彩属于预设肤色区间的区域为潜在人手区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深鉴智能科技有限公司,未经北京深鉴智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611115801.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:终端省电方法、终端及计算机可读存储介质
- 下一篇:一种含有钛白粉的香皂配方