[发明专利]模型训练方法、动作识别方法、装置、设备以及存储介质在审
| 申请号: | 202010617391.7 | 申请日: | 2020-06-30 |
| 公开(公告)号: | CN111783650A | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 刘栩辰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 动作 识别 装置 设备 以及 存储 介质 | ||
1.一种分类模型训练方法,包括:
提取训练集中多个视频样本的关键帧;
针对每个所述视频样本的关键帧,基于所述关键帧及所述关键帧的前后N帧,获取所述关键帧的候选特征,所述N为正整数,所述候选特征用于描述所述关键帧的时间和/或空间特性;
根据所述多个视频样本的关键帧的候选特征,确定所述多个视频样本间的相似度;
基于所述多个视频样本间的相似度调整所述分类模型的模型参数,并对所述分类模型进行训练。
2.根据权利要求1所述的方法,其中,所述获取所述关键帧的候选特征包括:
将所述关键帧、所述关键帧之前N帧以及所述关键帧之后N帧作为与所述关键帧对应的观察样本,获取所述观察样本中所有帧的点云;
基于所述观察样本中所有帧的点云,获取所述关键帧的候选特征。
3.根据权利要求2所述的方法,其中,所述基于所述观察样本中所有帧的点云,获取所述关键帧的候选特征,包括:
针对所述关键帧的每个点云,获取所述点云的特征向量和特征值,并将所述点云的特征向量在预设多面体上的投影量作为所述点云的主成分直方图特征;
根据所述关键帧的各点云的特征值,筛选满足预设条件的点云作为所述关键帧的关键点云;
基于所述关键帧的所有关键点云的主成分直方图特征,得到所述关键帧的候选特征。
4.根据权利要求3所述的方法,其中,所述获取所述点云的特征向量和特征值,包括:
基于所述关键帧之前N帧中与所述点云对应的点云,以及所述关键帧之后N帧中与所述点云对应的点云,获得所述点云的轨迹;
根据所述点云的轨迹,确定所述点云的特征向量及特征值。
5.根据权利要求1-4中任一项所述的方法,其中,所述根据所述多个视频样本的关键帧的候选特征,确定所述多个视频样本间的相似度,包括:
针对每个所述视频样本,计算所述视频样本的关键帧之间的帧间距离;
根据各所述视频样本的关键帧之间的帧间距离,利用动态时间规划算法获得所述多个视频样本间的相似度。
6.根据权利要求1-4中任一项所述的方法,其中,所述提取所述训练集中多个视频样本的关键帧,包括:
针对每个所述视频样本,通过以预设采样频率对所述视频样本进行采样,获得所述视频样本的关键帧。
7.根据权利要求1-4中任一项所述的方法,其中,在提取训练集中多个视频样本的关键帧之前,还包括:
从由视频样本组成的待训练数据集中将所述多个视频样本确定为所述训练集。
8.根据权利要求1-4中任一项所述的方法,其中,每个所述视频样本由多帧深度图构成。
9.根据权利要求1-4中任一项所述的方法,其中,所述分类模型为支持向量机SVM分类器。
10.根据权利要求9所述的方法,其中,所述模型参数为径向基函数RBF。
11.一种动作识别方法,包括:
获取待识别视频;
提取所述待识别视频的关键帧;
基于所述关键帧及所述关键帧的前后N帧,获取所述关键帧的候选特征,所述N为正整数,所述候选特征用于描述所述关键帧的时间和/或空间特性;
将所述关键帧的候选特征,输入至分类模型中,获得所述待识别视频中动作对象的动作类型,所述分类模型根据权利要求1-10中任一项所述的分类模型训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010617391.7/1.html,转载请声明来源钻瓜专利网。





