[发明专利]手势追踪方法和装置、电子设备、计算机存储介质有效
申请号: | 201711248850.3 | 申请日: | 2017-11-30 |
公开(公告)号: | CN108229324B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 杜天元;钱晨;王权 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/62;G06T7/246 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手势 追踪 方法 装置 电子设备 计算机 存储 介质 | ||
本发明实施例公开了一种手势追踪方法和装置、电子设备、计算机存储介质,其中,方法包括:从获取的待识别图像中提取得到至少一个兴趣区域,基于所述兴趣区域获得兴趣图像;利用第一神经网络,对所述兴趣图像执行识别操作,获得候选区域,基于所述候选区域获得候选图像;基于所述候选图像进行手势追踪。本发明上述实施例通过识别获得兴趣图像可以将待识别图像中占比较小或不易识别的手势图像突出显示,使待识别图像中的手势图像可以被识别和追踪;增大了人机交互的距离。
技术领域
本发明涉及计算机视觉技术,尤其是一种手势追踪方法和装置、电子设备、计算机存储介质。
背景技术
随着计算机视觉技术的发展,人机交互的方式渐渐由接触式交互转换为非接触式交互,目前主流的非接触式交互包括语音输入和视频输入。其中,视频输入的人机交互十分依赖图像识别和定位等计算机视觉任务。
在物体检测领域中,小物体的检测一直是难度很大的任务;当摄像头和物体距离较远时,目标物体在获取到的图片中就变成了小物体,原有的检测算法可能因此失灵。
发明内容
本发明实施例提供一种手势追踪技术。
本发明实施例提供的一种手势追踪方法,包括:
从获取的待识别图像中提取得到至少一个兴趣区域,基于所述兴趣区域获得兴趣图像;所述兴趣区域用于表示存在手部图像的概率超出设定阈值的区域,每个所述兴趣图像对应一个所述兴趣区域;
利用第一神经网络,对所述兴趣图像执行识别操作,获得候选区域,基于所述候选区域获得候选图像;所述第一神经网络经过样本手部图像训练获得,所述样本手部图像标注有手部图像的坐标,所述候选区域中包括手部图像的概率超出预设阈值,每个所述候选图像对应一个所述候选区域;
基于所述候选图像识别获得手势坐标信息,基于所述手势坐标信息实现手势追踪;所述手势坐标信息包括手势框坐标和/或关键点坐标。
在基于本发明上述方法的另一个实施例中,所述从获取的待识别图像中提取得到至少一个兴趣区域,包括:
利用人体识别网络,识别获取的待识别图像中的人体区域,基于所述获得的人体区域获得兴趣区域;所述人体识别网络经过样本人体图像训练获得,所述样本人体图像中标注有人体图像的坐标。
在基于本发明上述方法的另一个实施例中,所述从获取的待识别图像中提取得到至少一个兴趣区域,包括:
利用人脸识别网络,识别获取的待识别图像中的人脸区域,基于所述获得的人脸区域获得兴趣区域;所述人脸识别网络经过样本人脸图像训练获得,所述样本人脸图像中标注有人脸图像的坐标。
在基于本发明上述方法的另一个实施例中,所述基于所述兴趣区域获得兴趣图像,包括:
基于所述兴趣区域在所述待识别图像中的坐标,将所述兴趣区域从所述待识别图像中分离获得兴趣图像。
在基于本发明上述方法的另一个实施例中,所述基于所述兴趣区域获得兴趣图像之后,还包括:
将所述兴趣图像缩放到预设大小;
利用第一神经网络,对所述兴趣图像执行识别操作,获得候选区域,包括:
利用第一神经网络,对所述缩放后的兴趣图像执行识别操作,获得候选区域。
在基于本发明上述方法的另一个实施例中,利用第一神经网络,对所述兴趣图像执行识别操作,获得候选区域,基于所述候选区域获得候选图像,包括:
利用第一神经网络,对所述兴趣图像执行识别操作,获得包括手部图像的概率超出预设阈值的矩形框的坐标;所述第一神经网络经过样本手部图像训练获得,所述样本手部图像标注有手部图像的坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711248850.3/2.html,转载请声明来源钻瓜专利网。