[发明专利]基于张量量化的动作识别方法有效

申请号：	201610938569.1	申请日：	2016-10-24
公开（公告）号：	CN106529435B	公开（公告）日：	2019-10-15
发明（设计）人：	苏育挺;徐传忠;张静	申请（专利权）人：	天津大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	天津市北洋有限责任专利代理事务所 12201	代理人：	杜文茹
地址：	300072***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于张量量化的动作识别方法：将原始的视频序列表征为一个三阶视频序列张量A；对视频序列张量A进行Tucker‑2分解获得空域维度减少的核张量：将视频序列张量A，表示成一个低阶的核张量G，找到两个映射矩阵U⁽¹⁾和U⁽²⁾，将最初的视频序列张量A展开为用Tucker‑2分解的视频序列张量A，核张量G也就是所要求的新张量，最小化目标函数，求解出所要寻找的维度减少的核张量G和映射矩阵U⁽¹⁾和U⁽²⁾；应用张量量化技术将空域维度减少的核张量编码到统一的长度；动态学习以上的步骤更新结果直到算法收敛结果达到最优。本发明能够将视频序列处理为统一的长度，通过在张量分解的框架中适应性挑选出信息量最多的帧去构建出具有统一视频序列长度的新的视频序列。
搜索关键词：	基于张量量化动作识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于张量量化的动作识别方法，其特征在于，包括如下步骤：1)将原始的视频序列表征为一个三阶视频序列张量其中I₁，I₂和K分别表示为一个视频序列的宽度、高度和时间轴的长度；2)对视频序列张量A进行Tucker‑2分解获得空域维度减少的核张量，包括：将视频序列张量表示成一个低阶的核张量J₁＜I₁，J₂＜I₂，找到两个映射矩阵和将最初的视频序列张量A展开为用Tucker‑2分解的视频序列张量A＝G×₁U⁽¹⁾×₂U⁽²⁾+ε，G是核张量也就是所要求的新张量，ε是误差，最小化以下的目标函数，求解出所要寻找的维度减少的核张量G和映射矩阵U⁽¹⁾和U⁽²⁾：3)应用张量量化技术将空域维度减少的核张量编码到统一的长度；包括：将任意长度K的核张量G都编码为一个统一的长度为的新的视频序列张量同时满足对于一个给定的核张量G产生一个大小为的码书；假设核张量G被分割为w个子张量{g_i|i＝1,2,…,w}，其中g_i是第i个子张量，l是码字的长度；在张量量化中一个码字用来表示一些相似的子张量，一个张量量化器Q就是一个从欧几里得空间的子张量到一个有限集的映射：Q:H是一个含有长度为的码书叫做码字，与一个含有长度为的码字的张量量化器相联系，最初的空间被分割成长度为个子空间该式中为了得到最主要的子张量去建立码书，引入了两个限制条件：最近邻条件和重心条件，首先用一个随机的码书进行初始化，然后根据最近邻条件找到最佳的分割空间最后依据重心条件循环的更新码书，其中，最近邻条件对于一个给定的码书，最佳的分割应满足：该式中d(·)是欧几里得测度；重心条件对一个给定的分割区域其中最佳的重构码字意味着h_i＝Cent(C_i)，式中Cent(·)定义为：除此之外，我们也引入了平均扭曲度去测量重构的码字的质量，平均扭曲度定义如下：4)动态学习以上的步骤更新结果直到算法收敛结果达到最优。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津大学，未经天津大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610938569.1/，转载请声明来源钻瓜专利网。

上一篇：双刀轴切割揉碎装置
下一篇：一种农业生产专用的输送式秸秆放置板切割农业机械设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于张量量化的动作识别方法有效

专利文献下载