[发明专利]手势识别、手势控制及多层神经网络训练方法、装置及电子设备有效
申请号: | 201710208528.1 | 申请日: | 2017-03-31 |
公开(公告)号: | CN108229277B | 公开(公告)日: | 2020-05-01 |
发明(设计)人: | 王权;刘文韬;钱晨 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京康达联禾知识产权代理事务所(普通合伙) 11461 | 代理人: | 兰淑铎;刘洁 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手势 识别 控制 多层 神经网络 训练 方法 装置 电子设备 | ||
1.一种手势识别方法,包括:所述方法利用多层神经网络,所述多层神经网络包括复用网络输入层和部分卷积层的第一神经网络和第二神经网络;
通过所述第一神经网络检测图像中的手可能区域;所述第一神经网络由正样本训练得到,所述手可能区域为所述图像中包含手的区域或者为所述图像中不包含手的区域;
通过所述第二神经网络检测所述手可能区域中的手势可能类别及其概率;所述手势可能类别包括:无手势类别以及至少一种手势类别;
如果检测得到的最大概率的手势可能类别为所述无手势类别,不输出所述图像的所述手可能区域的位置信息;否则,输出所述图像的所述手可能区域的位置信息以及检测得到的最大概率的手势可能类别。
2.根据权利要求1所述的方法,其中,
所述至少一种手势类别包括:至少一种预定具体手势类别;或者,
所述至少一种手势类别包括:至少一种预定具体手势类别和其他手势类别。
3.根据权利要求1所述的方法,其中,
所述手势可能类别包括第一手势可能类别和第二手势可能类别;所述第一手势可能类别包括:有手势类别和无手势类别;所述第二可能手势类别包括:至少两种预定具体手势类别,或者,至少一种预定具体手势类别和其他手势类别;
所述如果检测得到的最大概率的手势可能类别为所述无手势类别,不输出所述图像的所述手可能区域的位置信息;否则,输出所述图像的所述手可能区域的位置信息以及检测得到的最大概率的手势可能类别,包括:如果检测到的最大概率的第一手势可能类别为无手势类别,不输出所述图像的所述手可能区域的位置信息;否则,输出所述图像的所述手可能区域的位置信息以及检测得到的最大概率的第二手势可能类别。
4.根据权利要求3所述的方法,其中,所述第二神经网络包括复用所述网络输入层和部分卷积层的第一子神经网络和第二子神经网络;
所述通过所述第二神经网络检测所述手可能区域中的手势可能类别及其概率,包括:
通过所述第一子神经网络检测所述手可能区域中的第一手势可能类别及其概率;
通过所述第二子神经网络检测所述手可能区域中的第二手势可能类别及其概率。
5.根据权利要求1-4任一项所述的方法,其中,所述通过所述第一神经网络检测所述图像中的手可能区域之前,还包括:
如果当前视频帧的前一视频帧检测得到的最大概率的手势可能类别不是无手势类别,则至少根据所述前一视频帧输出的手可能区域的位置信息,裁取所述当前视频帧的局部区域,裁取得到的局部区域为输入所述第一神经网络的所述图像。
6.根据权利要求5所述的方法,其中,所述至少根据所述前一视频帧输出的手可能区域的位置信息,裁取所述当前视频帧的局部区域,裁取得到的局部区域为输入所述第一神经网络的所述图像,包括:
基于所述位置信息拉大所述前一视频帧输出的手可能区域;
根据拉大后的手可能区域进行所述当前视频帧的局部区域裁取,裁取得到的局部区域为输入所述第一神经网络的所述图像。
7.根据权利要求5所述的方法,其中,所述至少根据所述前一视频帧输出的手可能区域的位置信息,裁取所述当前视频帧的局部区域,裁取得到的局部区域为输入所述第一神经网络的所述图像,包括:
基于所述位置信息拉大所述前一视频帧输出的手可能区域;
将拉大后的手可能区域相对所述位置信息的不同方向分别偏移一预定距离并分别进行裁取;
对裁取得到的多个手可能区域分别进行手势信息检测,并确定手势可能类别为无手势类别的概率最小的手可能区域为输入所述第一神经网络的所述图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710208528.1/1.html,转载请声明来源钻瓜专利网。