[发明专利]基于张量量化的动作识别方法有效
申请号: | 201610938569.1 | 申请日: | 2016-10-24 |
公开(公告)号: | CN106529435B | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 苏育挺;徐传忠;张静 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于张量量化的动作识别方法:将原始的视频序列表征为一个三阶视频序列张量A;对视频序列张量A进行Tucker‑2分解获得空域维度减少的核张量:将视频序列张量A,表示成一个低阶的核张量G,找到两个映射矩阵U(1)和U(2),将最初的视频序列张量A展开为用Tucker‑2分解的视频序列张量A,核张量G也就是所要求的新张量,最小化目标函数,求解出所要寻找的维度减少的核张量G和映射矩阵U(1)和U(2);应用张量量化技术将空域维度减少的核张量编码到统一的长度;动态学习以上的步骤更新结果直到算法收敛结果达到最优。本发明能够将视频序列处理为统一的长度,通过在张量分解的框架中适应性挑选出信息量最多的帧去构建出具有统一视频序列长度的新的视频序列。 | ||
搜索关键词: | 基于 张量 量化 动作 识别 方法 | ||
【主权项】:
1.一种基于张量量化的动作识别方法,其特征在于,包括如下步骤:1)将原始的视频序列表征为一个三阶视频序列张量
其中I1,I2和K分别表示为一个视频序列的宽度、高度和时间轴的长度;2)对视频序列张量A进行Tucker‑2分解获得空域维度减少的核张量,包括:将视频序列张量
表示成一个低阶的核张量
J1<I1,J2<I2,找到两个映射矩阵
和
将最初的视频序列张量A展开为用Tucker‑2分解的视频序列张量A=G×1U(1)×2U(2)+ε,G是核张量也就是所要求的新张量,ε是误差,最小化以下的目标函数,求解出所要寻找的维度减少的核张量G和映射矩阵U(1)和U(2):
3)应用张量量化技术将空域维度减少的核张量编码到统一的长度;包括:将任意长度K的核张量G都编码为一个统一的长度为
的新的视频序列张量
同时满足
对于一个给定的核张量G产生一个大小为
的码书;假设核张量G被分割为w个子张量{gi|i=1,2,…,w},其中gi是第i个子张量,l是码字的长度;在张量量化中一个码字用来表示一些相似的子张量,一个张量量化器Q就是一个从欧几里得空间的子张量到一个有限集
的映射:Q:
H是一个含有长度为
的码书叫做码字,与一个含有长度为
的码字的张量量化器相联系,最初的空间被分割成长度为
个子空间
该式中
为了得到最主要的子张量去建立码书,引入了两个限制条件:最近邻条件和重心条件,首先用一个随机的码书进行初始化,然后根据最近邻条件找到最佳的分割空间
最后依据重心条件循环的更新码书,其中,最近邻条件对于一个给定的码书,最佳的分割
应满足:
该式中d(·)是欧几里得测度;重心条件对一个给定的分割区域
其中
最佳的重构码字意味着hi=Cent(Ci),式中Cent(·)定义为:
除此之外,我们也引入了平均扭曲度去测量重构的码字的质量,平均扭曲度定义如下:
4)动态学习以上的步骤更新结果直到算法收敛结果达到最优。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610938569.1/,转载请声明来源钻瓜专利网。