[发明专利]一种人手识别方法、装置、电子设备及存储介质在审
申请号: | 202210264476.0 | 申请日: | 2022-03-17 |
公开(公告)号: | CN114627503A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 林哲 | 申请(专利权)人: | 广州虎牙科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 蔡舒野 |
地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人手 识别 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种人手识别方法、装置、电子设备及存储介质。人手识别方法具体可以包括:获取待识别图像,并在待识别图像中提取低层图像特征;对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;根据掌心点和人手描述信息,在待识别图像中识别人手区域。本发明实施例的技术方案能够减少人手识别过程中的计算量,简化人手识别任务,从而提高人手识别效率。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种人手识别方法、装置、电子设备及存储介质。
背景技术
随着科技的发展,对图像中的人手进行识别的应用越来越广泛,如虚拟/增强现实、人机交互、动作识别、辅助驾驶等领域,人手识别作为手势理解、手指关键点检测等任务的上游任务,也备受人们的重视。
在不同场景下(如站立、坐姿或手持物品),人手离摄像头的远近不同,导致人手在图像中的大小不一,人手识别难以学习,而且存在物体遮挡部分手的情况(如握住物体,部分手指不可见),为人手识别增加了难度。手的形态会随着手势的改变而改变,各个手指的相对位置也并非固定的,这又增大了学习难度。手都是由皮肤覆盖,缺乏明显辨别的特征,故当手贴在脸上或者接近肤色的地方,以及手指并拢的情况,会加大识别的难度。
目前,主要的人手识别方法通常是直接预测人手矩形框,或者,通过预测预设的人手矩形框的偏移量,选择最匹配的预测人手矩形框作为输出,预测人手矩形框一般是左上角或矩形框中心点的坐标,以及矩形框的宽高。发明人在实现本发明的过程中,发现:直接预测矩形框或者矩形框的偏移量,手中心点没有固定的位置,无法清晰定义手中心点,需要拟合的样例变得无穷多,也即需要很多预设的矩形框,导致人手识别过程中运算量较大,而且需要进行矩形框匹配选择,导致人手识别过程中复杂度较高。
发明内容
本发明实施例提供一种人手识别方法、装置、电子设备及存储介质,能够减少人手识别过程中的计算量,简化人手识别任务,从而提高人手识别效率。
根据本发明的一方面,提供了一种人手识别方法,包括:
获取待识别图像,并在待识别图像中提取低层图像特征;
对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
根据掌心点和人手描述信息,在待识别图像中识别人手区域。
根据本发明的另一方面,提供了一种人手识别方法,包括:
获取待识别图像,并将所述待识别图像输入至预先训练的人手识别模型中;所述人手识别模型包括:第一标准卷积网络,以及分别与第一标准卷积网络相连的形变卷积分支网络和第二标准卷积分支网络;
通过第一标准卷积网络,在待识别图像中提取低层图像特征,并将低层图像特征分别输入至形变卷积分支网络和第二标准卷积分支网络中;
通过形变卷积分支网络,对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
通过第二标准卷积分支网络,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
根据所述人手识别模型输出的掌心点和人手描述信息,在待识别图像中识别人手区域。
根据本发明的另一方面,提供了一种人手识别装置,包括:
低层图像特征提取模块,用于获取待识别图像,并在待识别图像中提取低层图像特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210264476.0/2.html,转载请声明来源钻瓜专利网。