[发明专利]基于分布式环境的张量CP分解实现方法有效
申请号: | 201711426277.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108170639B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 周维;麦超;蔡莉;何靖;姚绍文 | 申请(专利权)人: | 云南大学 |
主分类号: | G06F17/15 | 分类号: | G06F17/15 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平;陈靓靓 |
地址: | 650091*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种基于分布式环境的张量CP分解实现方法,基于ALS算法,对每次迭代过程中因子矩阵A |
||
搜索关键词: | 基于 分布式 环境 张量 cp 分解 实现 方法 | ||
其特征在于,因子矩阵A(n)的更新采用以下方法:
S1:令集合D={1,2,…,N}‑{n},将集合D中元素按升序排列,记第j个元素为dj,j=1,2,…,N‑1;令矩阵Y=X(n)(A(N)⊙…⊙A(n+1)⊙A(n‑1)⊙…⊙A(1)),
S2:通过拆分Khatri‑Rao乘积的方式计算Y=X(n)(A(N)⊙…⊙A(n+1)⊙A(n‑1)⊙…⊙A(1)),具体步骤包括:
S2.1:初始化秩序号r=1;
S2.2:初始化j=1,
S2.3:Map:按照mode‑dj拆分得到张量的纤维,当n>dj,则以
作为key,
作为value,否则以
作为key,
作为value,进行map操作即可将张量
的纤维分发到Spark集群的各台主机上;同时将因子矩阵
的列向量
的转置
作为广播变量,分发到Spark集群的各台主机上;
S2.4:Reduce:Spark集群的每台主机在接收到为key,
或
为value的数据以及列向量
后,由
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711426277.0/,转载请声明来源钻瓜专利网。