[发明专利]基于张量量化的动作识别方法有效

专利信息
申请号: 201610938569.1 申请日: 2016-10-24
公开(公告)号: CN106529435B 公开(公告)日: 2019-10-15
发明(设计)人: 苏育挺;徐传忠;张静 申请(专利权)人: 天津大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 杜文茹
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于张量量化的动作识别方法:将原始的视频序列表征为一个三阶视频序列张量A;对视频序列张量A进行Tucker‑2分解获得空域维度减少的核张量:将视频序列张量A,表示成一个低阶的核张量G,找到两个映射矩阵U(1)和U(2),将最初的视频序列张量A展开为用Tucker‑2分解的视频序列张量A,核张量G也就是所要求的新张量,最小化目标函数,求解出所要寻找的维度减少的核张量G和映射矩阵U(1)和U(2);应用张量量化技术将空域维度减少的核张量编码到统一的长度;动态学习以上的步骤更新结果直到算法收敛结果达到最优。本发明能够将视频序列处理为统一的长度,通过在张量分解的框架中适应性挑选出信息量最多的帧去构建出具有统一视频序列长度的新的视频序列。
搜索关键词: 基于 张量 量化 动作 识别 方法
【主权项】:
1.一种基于张量量化的动作识别方法,其特征在于,包括如下步骤:1)将原始的视频序列表征为一个三阶视频序列张量其中I1,I2和K分别表示为一个视频序列的宽度、高度和时间轴的长度;2)对视频序列张量A进行Tucker‑2分解获得空域维度减少的核张量,包括:将视频序列张量表示成一个低阶的核张量J1<I1,J2<I2,找到两个映射矩阵将最初的视频序列张量A展开为用Tucker‑2分解的视频序列张量A=G×1U(1)×2U(2)+ε,G是核张量也就是所要求的新张量,ε是误差,最小化以下的目标函数,求解出所要寻找的维度减少的核张量G和映射矩阵U(1)和U(2)3)应用张量量化技术将空域维度减少的核张量编码到统一的长度;包括:将任意长度K的核张量G都编码为一个统一的长度为的新的视频序列张量同时满足对于一个给定的核张量G产生一个大小为的码书;假设核张量G被分割为w个子张量{gi|i=1,2,…,w},其中gi是第i个子张量,l是码字的长度;在张量量化中一个码字用来表示一些相似的子张量,一个张量量化器Q就是一个从欧几里得空间的子张量到一个有限集的映射:Q:H是一个含有长度为的码书叫做码字,与一个含有长度为的码字的张量量化器相联系,最初的空间被分割成长度为个子空间该式中为了得到最主要的子张量去建立码书,引入了两个限制条件:最近邻条件和重心条件,首先用一个随机的码书进行初始化,然后根据最近邻条件找到最佳的分割空间最后依据重心条件循环的更新码书,其中,最近邻条件对于一个给定的码书,最佳的分割应满足:该式中d(·)是欧几里得测度;重心条件对一个给定的分割区域其中最佳的重构码字意味着hi=Cent(Ci),式中Cent(·)定义为:除此之外,我们也引入了平均扭曲度去测量重构的码字的质量,平均扭曲度定义如下:4)动态学习以上的步骤更新结果直到算法收敛结果达到最优。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610938569.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top