[发明专利]一种人手识别方法、装置、电子设备及存储介质在审
| 申请号: | 202210264476.0 | 申请日: | 2022-03-17 |
| 公开(公告)号: | CN114627503A | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 林哲 | 申请(专利权)人: | 广州虎牙科技有限公司 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06N3/04 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 蔡舒野 |
| 地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 人手 识别 方法 装置 电子设备 存储 介质 | ||
1.一种人手识别方法,其特征在于,包括:
获取待识别图像,并在待识别图像中提取低层图像特征;
对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
根据掌心点和人手描述信息,在待识别图像中识别人手区域。
2.根据权利要求1所述的方法,其特征在于,对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点,包括:
对低层图像特征进行特征偏移量提取,获取与所述低层图像特征中各特征点分别对应的水平偏移矩阵和垂直偏移矩阵;
按照所述水平偏移矩阵和所述垂直偏移矩阵,对所述低层图像特征进行特征重排,得到重排图像特征;
对所述重排图像特征进行标准卷积处理,得到重排特征提取结果,并根据所述重排特征提取结果,获取所述掌心点。
3.根据权利要求2所述的方法,其特征在于,在按照所述水平偏移矩阵和所述垂直偏移矩阵,对所述低层图像特征进行特征重排,得到重排图像特征之前,还包括:
按照预设的限制规则,对所述水平偏移矩阵和垂直偏移矩阵中的矩阵元素进行缩限处理,以约束低层图像特征中各特征点的偏移范围。
4.根据权利要求2所述的方法,其特征在于,根据所述重排特征提取结果,获取所述掌心点,包括:
将所述重排特征提取结果输入至掌心点热力图生成网络中,获取左手掌心点热力图和右手掌心点热力图;
在所述左手掌心点热力图和所述右手掌心点热力图中,分别提取左手掌心点和右手掌心点。
5.根据权利要求1所述的方法,其特征在于,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,包括:
将所述低层图像特征逐次输入至多个标准卷积层,获取与左右手的每项人手描述信息分别对应的标准特征提取结果;
对各所述标准特征提取结果进行平均池化处理,得到与左右手分别对应的各所述人手描述信息。
6.根据权利要求1所述的方法,其特征在于,获取待识别图像,包括:
在检测到满足单人直播场景,或者单人短视频场景条件时,获取待识别图像。
7.一种人手识别方法,其特征在于,包括:
获取待识别图像,并将所述待识别图像输入至预先训练的人手识别模型中;所述人手识别模型包括:第一标准卷积网络,以及分别与第一标准卷积网络相连的形变卷积分支网络和第二标准卷积分支网络;
通过第一标准卷积网络,在待识别图像中提取低层图像特征,并将低层图像特征分别输入至形变卷积分支网络和第二标准卷积分支网络中;
通过形变卷积分支网络,对低层图像特征进行形变卷积处理,并获取与形变处理结果匹配的掌心点;
通过第二标准卷积分支网络,对低层图像特征进行标准卷积处理,并获取与标准处理结果匹配的人手描述信息,人手描述信息包括:掌心点与人手中心点间的偏移量,和人手宽高值;
根据所述人手识别模型输出的掌心点和人手描述信息,在待识别图像中识别人手区域。
8.根据权利要求7所述的方法,其特征在于,在训练得到所述人手识别模型时,所使用的损失函数包括:掌心点热力图损失项、人手宽高值损失项以及掌心点与人手中心点间的偏移量损失项,其中:
在确定所述掌心点热力图损失项中,分别计算掌心点预测值,与掌心点标注值以及掌心点标注值周围的各掌心点偏移值之间的损失值,并将各损失值的最小值,确定为所述掌心点热力图损失项的损失值;
在所述人手宽高值损失项以及掌心点与人手中心点间的偏移量损失项中,均使用平滑损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210264476.0/1.html,转载请声明来源钻瓜专利网。





