[发明专利]应用于数据压缩与分析的张量分解性能优化方法和系统在审

专利信息
申请号: 202310181406.3 申请日: 2023-02-20
公开(公告)号: CN116401503A 公开(公告)日: 2023-07-07
发明(设计)人: 杨超;李敏;肖传福;丁明朔;陈畅 申请(专利权)人: 北京大学;北京大学长沙计算与数字经济研究院
主分类号: G06F17/16 分类号: G06F17/16;G06F18/2135;G06F16/901
代理公司: 北京冠和权律师事务所 11399 代理人: 郑延斌
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 应用于 数据压缩 分析 张量 分解 性能 优化 方法 系统
【说明书】:

发明提出了应用于数据压缩与分析的张量分解性能优化方法和系统。所述张量分解算法的主要性能瓶颈是连续的张量矩阵乘运算,本发明性能优化方法将张量分解过程建模成树的形式,通过尽量重用操作,从而减少关键操作的计算量,提升计算性能。具体包括:树的构建:首先,将要压缩的N阶输入数据张量χ作为根节点,并将N个数据子节点与根节点相连,其中,一个数据节点对应一颗子树;以分治的方式对每颗子树进行结构创建。计算过程:从根节点,以深度优先方式遍历树,每遍历到一个节点,进行一次张量矩阵乘操作计算,最终完成全部运算。该优化方法可以大幅减少张量矩阵乘操作的次数,从而提升计算性能。

技术领域

本发明提出了应用于数据压缩与分析的张量分解性能优化方法和系统,属于数据压缩技术领域。

背景技术

Tucker分解是张量计算中最常用的分解形式之一,被广泛应用于数据分析、科学计算、人工智能等领域。Tucker分解将一个规模为I1×I2×......×IN的张量χ,分解成:χ≈g×1U(1)×2U(2)......NU(N)的形式,其中,g是核张量,其规模为R1×R2×......×RN,U(n)为因子矩阵(n=1,2,...,N),其规模为且一般满足列正交性。HOOI(高阶正交迭代)算法是Tucker分解最常用的方法之一,其是一种迭代算法,如图1所示。HOOI算法包括两层循环有两层:外层循环(第2-9行)控制算法的收敛,一般地,循环终止准则是固定迭代次数上限或者相邻两步误差低于指定水平;在每个外循环内部,会对张量的每个mode进行循环(第3-8行),每次循环包括TTMc计算模块(第5行)和因子矩阵更新模块(第7-8行)。其中TTMc计算模块是HOOI算法最耗时的部分,该计算模块由一系列连续的TTM(张量矩阵乘)运算组成。

针对TTMc计算模块,涌现了一些高性能的计算优化工作。对直接计算方法来说,它没有利用HOOI算法的特点,对所有TTM操作进行重新计算,具有比较差的性能;在直接计算方法之上,balanced-tree方法在内迭代范围内展开重用,尽可能重用了不同迭代步间的TTM结果,减少TTM操作的计算次数,提升了一些性能。但是balanced-tree方法同样存在压缩效率和压缩性能较差的问题。

发明内容

本发明提供了应用于数据压缩与分析的张量分解性能优化方法和系统,用以解决现有数据压缩过程中压缩效率和压缩性能较差的问题,所采取的技术方案如下:

应用于数据压缩与分析的张量分解性能优化方法,所述张量分解性能优化方法包括:

将要压缩的N阶输入数据张量作为根节点,并将N个数据子节点与根节点相连,其中,一个数据子节点对应一颗子树;

以分治的方式对每颗子树进行结构创建;

从根节点,以深度优先方式遍历树,完成对应的连续张量矩阵乘计算。

进一步地,每颗子树的根节点的标记号为i,其中,i的取值范围为i∈[1,N]。

进一步地,以分治的方式对每颗子树进行结构创建,包括:

将数据子节点对应的除了i以外的标号进行提取,形成标号集合A={j,j∈[1,N],j≠i};

将标号集合A中的标号分成两组:A1={1,2,...,m},A2={m+1,...,N};

判断A1中包含的节点个数m是否为1,如果m为1,则直接将A1中的节点挂在i节点上;如果m不为1,则将A1中的标号按照预设连续原则形成m个连续节点串,并按照所述预设连续原则在所述m个连续节点串中提取首节点,将所述首节点挂在i节点上;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北京大学长沙计算与数字经济研究院,未经北京大学;北京大学长沙计算与数字经济研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310181406.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top