[发明专利]一种基于稀疏低秩编码的视频动作识别方法有效
申请号: | 201610377217.3 | 申请日: | 2016-05-31 |
公开(公告)号: | CN106056082B | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 李平;彭勇;计忠平;徐向华 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于稀疏低秩编码的视频动作识别方法。本发明对给定的视频集合进行如下操作:1)对每个视频从空间和时间两个维度使用立方体检测和描述视频动作的兴趣点,并形成相应的局部时空特征;2)利用稀疏低秩矩阵分解对局部时空特征做编码,形成对应兴趣点的稀疏低秩编码表示,并用改进的平均池化技术获得全局时空特征向量作为视频的数据表示;3)对所有视频样本实施上述步骤获得相应的时空数据表示,并分为训练样本和测试样本,再利用支持向量机建立分类模型用于识别测试样本的视频动作。本发明能够从局部和全局角度利用视频兴趣点的时空特征有力刻画视频动作,并通过稀疏低秩编码获得更优的视频数据表示,提高了视频动作识别的准确率。 | ||
搜索关键词: | 一种 基于 稀疏 编码 视频 动作 识别 方法 | ||
【主权项】:
1.一种基于稀疏低秩编码的视频动作识别方法,该方法的特征在于对给定的视频集合,进行如下操作:1)对每个视频从空间和时间两个维度使用立方体算子检测和描述视频动作的兴趣点,并形成相应的局部时空特征;2)利用稀疏低秩矩阵分解对局部时空特征做编码,形成对应兴趣点的稀疏低秩编码表示,并采用改进的平均池化技术获得全局时空特征向量作为一个视频的数据表示;3)对所有的视频样本实施上述步骤后,可获得相应的时空数据表示,将其分为训练样本和测试样本,利用支持向量机建立分类模型用于识别测试样本的视频动作;所述的步骤2)中的利用稀疏低秩矩阵分解对局部时空特征做编码,形成对应兴趣点的稀疏低秩编码表示,并采用改进的平均池化技术获得全局时空特征向量作为一个视频的数据表示,具体是:2.1)视频的特征矩阵X分解为两部分,一部分为从数据字典
重构获得的低秩矩阵
另一部分为噪声矩阵
并对低秩矩阵Z添加l1范式约束||Z||1,使得重构矩阵Z尽可能逼近视频中兴趣点的局部时空特性结构;2.2)数据字典A通过对视频的特征矩阵X运用k均值聚类算法获得,即将视频的所有兴趣点表示聚为500个簇,而簇中心以列向量的形式组成数据字典A;2.3)根据视频的特征矩阵及其数据字典,计算最优稀疏低秩编码矩阵Z的目标函数为
其中,常数a>0,λ>0,符号||·||*表示矩阵的核范数为矩阵的奇异值之和,符号||·||2,1表示矩阵的l2,1范数,即先求矩阵各列向量的l2范式再求其l1范式;2.4)为了减少求解核范数的时间复杂度,将矩阵Z分解为两个矩阵,即
和
用Frobenius范数||·||F近似替换核范数,则计算效率更高的目标函数为
这样,该目标函数中共有四个变量需要优化;2.5)利用变量交替迭代优化方法求解2.4)中目标函数的最优解,可得到视频的最优稀疏低秩编码表示Z*,其中变量交替迭代方法的本质特点在于每轮迭代中依次固定其他变量的同时仅优化一个变量;2.6)最优稀疏低秩编码表示Z*由500个维度为n的行向量组成,即{z1,z2,…,z500},对其运用改进的平均池化技术,即对矩阵Z*中各行向量依次取前20个最大元素值的算术平均值,便可以得到视频的全局时空特征向量x,其维度为500。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610377217.3/,转载请声明来源钻瓜专利网。
- 上一篇:风干香辣鸡的制作方法
- 下一篇:一种氨氯吡啶酸盐的水溶性粒剂及其制备方法