[发明专利]一种操作动作辨识方法及装置在审
申请号: | 201711387866.2 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108171134A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 唐海川;李欣旭;龚明;孙帮成;田寅 | 申请(专利权)人: | 中车工业研究院有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100070 北京市丰台区南*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种操作动作辨识方法及装置。所述方法包括:获取待识别的视频片段,其中,所述待识别的视频片段中包含一种动作类型;根据所述待识别的视频片段和预先建立的动作识别标识模型,识别出所述待识别视频的动作类型。本发明提供的操作动作辨识方法及装置能够从像素级原始数据到抽象的语义概念逐层提取信息,其所抽取的特征比人工设计的特征更具有高效的表达能力,能快速准确地对操作动作进行辨识。 1 | ||
搜索关键词: | 操作动作 辨识 视频片段 动作类型 标识模型 动作识别 人工设计 提取信息 语义概念 预先建立 原始数据 像素级 抽取 视频 抽象 | ||
获取待识别的视频片段,其中,所述待识别的视频片段中包含一种动作类型;
根据所述待识别的视频片段和预先建立的动作辨识模型,识别出所述待识别视频片段中的动作类型。
2.根据权利要求1所述的方法,其特征在于,所述动作辨识模型采用如下步骤建立:根据采集的视频选择不同种类的操作动作的视频,建立操作动作数据库;
根据所述操作动作数据库,对预先建立的深度学习网络模型进行训练,确定所述动作辨识模型。
3.根据权利要求2所述的方法,其特征在于,所述深度学习网络模型包括3D卷积神经网络与长短时记忆网络。4.根据权利要求3所述的方法,其特征在于,所述深度学习网络模型具体结构包括:多个卷积层、多个池化层、一个全连接层、一个长短时记忆层以及一个Softmax输出层。5.根据权利要求2所述的方法,其特征在于,所述不同种类的操作动作的视频的获取步骤如下:将原始视频被分割成多个连续16帧图片的片段集合,再依次输入所述深度学习网络模型。所述视频包含时间信息和所述图片中动作执行主体的空间位置信息。
6.根据权利要求2所述的方法,其特征在于,所述动作类型至少包括:指差操作、推操作、拉操作、安检操作及手势操作。7.一种操作动作辨识装置,其特征在于,包括:获取模块,用于获取待识别的视频片段,其中,所述待识别的视频片段中包含一种动作类型;
识别模块,用于根据所述待识别的视频片段和预先建立的动作辨识模型,识别出所述待识别视频的动作类型。
8.根据权利要求7所述的装置,其特征在于,所述动作辨识模型采用如下步骤建立:根据采集的视频选择不同种类的操作动作的视频,建立操作动作数据库;
根据所述操作动作数据库,对预先建立的深度学习网络模型进行训练,确定所述动作辨识模型。
9.根据权利要求8所述的装置,其特征在于,所述深度学习网络模型包括3D卷积神经网络与长短时记忆网络。10.根据权利要求9所述的装置,其特征在于,所述深度学习网络模型具体结构包括:多个卷积层、多个池化层、一个全连接层、一个长短时记忆层以及一个Softmax输出层。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中车工业研究院有限公司,未经中车工业研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711387866.2/,转载请声明来源钻瓜专利网。