[发明专利]动作识别方法及装置在审
申请号: | 202110998032.5 | 申请日: | 2021-08-27 |
公开(公告)号: | CN115937962A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王凯 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06N20/00;G06V10/82;H04N23/611;H04N5/76;G06V10/80;H04N23/667 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动作 识别 方法 装置 | ||
1.一种动作识别方法,其特征在于,包括:
获取包括目标物体的第一图像;
确定所述第一图像中所述目标物体的动作信息;
计算所述第一图像中所述目标物体的光流类型;其中,所述光流类型包括:运动类型、静止类型或者无光流类型;
根据所述动作信息和所述光流类型,确定所述目标物体的动作。
2.根据权利要求1所述的方法,其特征在于,
所述目标物体为教室内的学生;
所述目标物体的动作包括:起立和坐下。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一图像中所述目标物体的动作信息,包括:
将所述第一图像输入机器学习模型,得到所述机器学习模型所输出的所述目标物体的动作信息,以及所述第一图像中所述目标物体的特征区域。
4.根据权利要求3所述的方法,其特征在于,所述机器学习模型包括:
空间注意力模块,用于提取所述第一图像中,所述目标物体边缘与周围物体的空间关联特征;
跨阶段部分模块CSP,用于提供所述机器学习模型的基础网络Backbone,提取所述第一图像的Backbone特征;
特征金字塔网络模块FPN,用于将所述CSP提取的Backbone特征与Backbone网络的第一深层特征相融合,得到多尺度特征;
路径增强网络模块PAN,用于将FPN得到的多尺度特征与所述Backbone网络的第二深层特征相融合;
检测头模块Yolo,用于根据所述FPN和PAN融合后的特征,学习并解析出所述第一图像中,目标物体的动作信息、所述特征区域以及置信度信息。
5.根据权利要求3或4所述的方法,其特征在于,所述计算所述第一图像中所述目标物体的光流类型,包括:
确定所述第一图像中所述目标物体的特征区域内,多个特征点的光流长度和光流方向;
根据所述第一图像中多个特征点的光流长度和光流方向,以及第二图像中多个特征点的光流长度和光流方向,确定所述目标物体的光流类型;其中,所述第二图像为所述第一图像前一帧的图像。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一图像中多个特征点的光流长度和光流方向,以及第二图像中多个特征点的光流长度和光流方向,确定所述目标物体的光流类型,包括:
从所述多个特征点中,确定在所述第一图像和在所述第二图像中水平方向上光流长度之差,小于竖直方向上光流长度之差,且竖直方向上光流值之差小于第一预设阈值的负数的第一特征点;
从所述多个特征点中,确定在所述第一图像和在所述第二图像中水平方向上光流长度之差,小于竖直方向上光流长度之差,且竖直方向上光流值之差大于第一预设阈值的第二特征点;
从所述多个特征点中,确定在所述第一图像和在所述第二图像中竖直方向上光流长度之差,小于水平方向上光流长度之差,且水平方向上光流值之差大于第一预设阈值的第三特征点;
当所述第一特征点、所述第二特征点和所述第三特征点的数量之和大于第二预设阈值,则确定所述目标物体的光流为运动类型、当所述第一特征点、所述第二特征点和所述第三特征点的数量之和小于所述第二预设阈值,则确定所述目标物体的光流为静止类型、当确定所述第一图像中不包括所述特征点时,则确定所述目标物体的光流为无光流类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110998032.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息预览方法、相关设备及存储介质
- 下一篇:护具