[发明专利]动作识别方法、控制方法及装置、电子设备和存储介质在审
申请号: | 201910028493.2 | 申请日: | 2019-01-11 |
公开(公告)号: | CN111435422A | 公开(公告)日: | 2020-07-21 |
发明(设计)人: | 蔡金雨;侯军;伊帅;闫俊杰;王晓刚 | 申请(专利权)人: | 商汤集团有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 中国香港沙田科学园*** | 国省代码: | 香港;81 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作 识别 方法 控制 装置 电子设备 存储 介质 | ||
本公开涉及一种动作识别方法、控制方法及装置、电子设备和存储介质。所述方法包括:提取图像中目标对象的特征;根据所述目标对象的特征进行预设的多类动作的识别,得到各类动作的识别结果;根据各类动作的识别结果确定所述图像中目标对象的动作识别结果。本公开实施例利用提取到的特征同时进行多类动作的识别,可以将差别较小的动作进行精确的区分,提高动作识别的效率和准确率。本公开实施例可以同时对多类动作进行动作识别。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种动作识别方法、控制方法及装置、电子设备和存储介质。
背景技术
通过识别图像中目标对象的动作,可以实现对设备进行自动控制等多种类型的应用。在传统的动作识别方法中,需要将图像中不同的动作单独进行识别。
发明内容
本公开提出了一种动作识别技术方案。
根据本公开的一方面,提供了一种动作识别方法,包括:
提取图像中目标对象的特征;
根据所述目标对象的特征进行预设的多类动作的识别,得到各类动作的识别结果;
根据各类动作的识别结果确定所述图像中目标对象的动作识别结果。
在一种可能的实现方式中,所述目标对象的动作识别结果,包括:所述目标对象的至少两类动作的动作识别结果。
在一种可能的实现方式中,所述方法还包括:
将图像输入神经网络中的特征提取模块,经由所述特征提取模块提取所述图像中目标对象的特征;
将所述目标对象的特征输入所述神经网络中的多动作识别模块,经由所述多动作识别模块根据所述特征进行预设的多类动作的识别,得到各动作的识别结果;
将所述各动作的识别结果输入神经网络中的动作确定模块,经由所述动作确定模块根据各动作的识别结果确定所述图像中目标对象的动作识别结果。
在一种可能的实现方式中,所述多动作识别模块包括多个动作识别子模块,每一动作识别子模块用于对预设的一类动作进行动作识别,将所述目标对象的特征输入所述神经网络中的多动作识别模块,经由所述多动作识别模块根据所述特征进行预设的多类动作的识别,得到各动作的识别结果,包括:
将所述目标对象的特征输入目标识别子模块进行动作识别,经由所述目标识别子模块根据所述特征进行动作识别,得到所述目标识别子模块的动作识别结果,所述目标识别子模块为任一所述动作识别子模块。
在一种可能的实现方式中,所述神经网络的训练方法,包括:
将样本图像输入所述特征提取模块,提取所述样本图像中目标对象的特征;
将所述目标对象的特征输入所述多动作识别模块进行预设的多类动作的识别,得到各动作的预测结果;
根据目标动作的预测结果和所述样本图像中目标动作的实际标注信息,确定所述目标动作的预测结果的损失,所述目标动作为所述目标对象的任一动作;
根据各动作的预测结果的损失确定综合损失,根据所述综合损失调整所述特征提取模块和所述动作分类模块的网络参数。
在一种可能的实现方式中,将所述目标对象的特征输入所述多动作识别模块进行预设的多类动作的识别,得到各动作的预测结果,包括:
将所述目标对象的特征输入各动作识别子模块进行动作识别,分别得到与各动作识别子模块对应的动作的预测结果。
在一种可能的实现方式中,所述样本图像中包括预设的多类动作中的至少一类动作的标注信息。
在一种可能的实现方式中,所述样本图像的实际标注信息包括预设的多类动作中各动作的标注信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于商汤集团有限公司,未经商汤集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910028493.2/2.html,转载请声明来源钻瓜专利网。