[发明专利]基于分布式环境的张量CP分解实现方法有效

申请号：	201711426277.0	申请日：	2017-12-26
公开（公告）号：	CN108170639B	公开（公告）日：	2021-08-17
发明（设计）人：	周维;麦超;蔡莉;何靖;姚绍文	申请（专利权）人：	云南大学
主分类号：	G06F17/15	分类号：	G06F17/15
代理公司：	成都行之专利代理事务所(普通合伙) 51220	代理人：	温利平;陈靓靓
地址：	650091***	国省代码：	云南;53
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于分布式环境的张量CP分解实现方法，基于ALS算法，对每次迭代过程中因子矩阵A(n)的更新，首先通过拆分Khatri‑Rao乘积的方式计算Y＝X(n)(A(N)⊙…⊙A(n+1)⊙A(n‑1)⊙…⊙A(1))，然后采用并行计算外积的方式计算最后将矩阵Y和矩阵V进行分块，采用Map操作将矩阵Y和矩阵V中对应的分块矩阵分发到Spark集群的主机上，采用Reduce操作进行矩阵乘法，然后再将乘法结果采用Map操作发送到一台主机上采用Reduce操作进行合并，得到A(n)＝YV。本发明基于MapReduce和Spark技术来实现张量CP分解，可以有效提高张量CP分解的效率。
搜索关键词：	基于分布式环境张量 cp 分解实现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于分布式环境的张量CP分解实现方法，对于秩为R的N阶张量初始化N个因子矩阵A⁽ⁿ⁾，每次迭代时轮流更新的每个因子矩阵，计算时固定其他的因子矩阵不变，重复迭代直到目标函数的值为零或小于给定的阈值为止，此时的N个因子矩阵A⁽ⁿ⁾即为张量的CP分解结果，其中因子矩阵A⁽ⁿ⁾的更新公式为：

其特征在于，因子矩阵A⁽ⁿ⁾的更新采用以下方法：

S1：令集合D＝{1,2,…,N}‑{n}，将集合D中元素按升序排列，记第j个元素为d_j，j＝1,2,…,N‑1；令矩阵Y＝X_(n)(A^(N)⊙…⊙A⁽ⁿ⁺¹⁾⊙A^(n‑1)⊙…⊙A⁽¹⁾)，

S2：通过拆分Khatri‑Rao乘积的方式计算Y＝X_(n)(A^(N)⊙…⊙A⁽ⁿ⁺¹⁾⊙A^(n‑1)⊙…⊙A⁽¹⁾)，具体步骤包括：

S2.1：初始化秩序号r＝1；

S2.2：初始化j＝1，

S2.3：Map：按照mode‑d_j拆分得到张量的纤维，当n＞d_j，则以作为key，作为value，否则以作为key，作为value，进行map操作即可将张量的纤维分发到Spark集群的各台主机上；同时将因子矩阵的列向量的转置作为广播变量，分发到Spark集群的各台主机上；

S2.4：Reduce：Spark集群的每台主机在接收到为key，或为value的数据以及列向量后，由

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于云南大学，未经云南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711426277.0/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载