[发明专利]数据处理的方法、电子设备和存储介质在审
申请号: | 202010480676.0 | 申请日: | 2020-05-30 |
公开(公告)号: | CN113743571A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 倪宁曦;王敏;王紫东;于璠;陈雷 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 电子设备 存储 介质 | ||
1.一种数据处理的方法,所述方法用于数据处理设备,所述方法包括:
获取用于指示神经网络模型的高阶信息矩阵的克罗内克因子矩阵,所述高阶信息矩阵用于校正所述神经网络模型的一阶梯度;
对所述克罗内克因子矩阵进行切分以得到多个方阵,所述多个方阵为所述克罗内克因子矩阵的子矩阵,所述多个方阵的主对角线一一与所述克罗内克因子矩阵主对角线的一部分对应;以及
基于所述多个方阵,调整所述神经网络模型的参数。
2.根据权利要求1所述的方法,其中所述数据处理设备包括用于执行所述调整的计算资源,并且其中对所述克罗内克因子矩阵进行切分包括:
基于所述计算资源的资源标识和所述神经网络模型的模型标识对所述克罗内克因子矩阵进行切分。
3.根据权利要求2所述的方法,其中所述数据处理设备中存储有所述资源标识、所述模型标识和维度之间的对应关系,所述维度指示所述克罗内克因子矩阵被切分成得到所述多个方阵中至少一个方阵的秩。
4.根据权利要求1所述的方法,其中所述数据处理设备包括用于执行所述调整的计算资源,并且其中对所述克罗内克因子矩阵进行切分包括:
基于多个维度对应的性能信息,从所述多个维度中选择目标维度来切分所述克罗内克因子矩阵,其中,一个维度对应的性能信息指示所述计算资源处理与所述维度对应的方阵的效率,所述目标维度指示所述克罗内克因子矩阵被切分成得到所述多个方阵中至少一个方阵的秩。
5.根据权利要求4所述的方法,其中所述维度对应的性能信息的值与所述数据处理设备计算与所述维度对应的方阵的逆矩阵所需的时间有关。
6.根据权利要求1所述的方法,其中对所述克罗内克因子矩阵进行切分包括:
基于多个维度对应的信息损失,从所述多个维度中选择目标维度来切分所述克罗内克因子矩阵,其中,一个维度对应的信息损失指示由于利用所述维度来切分参考克罗内克因子矩阵造成的信息损失,所述目标维度指示所述克罗内克因子矩阵被切分成得到所述多个方阵中至少一个方阵的秩。
7.根据权利要求6所述的方法,其中所述维度对应的信息损失是利用所述维度切分参考克罗内克因子矩阵所得到的多个方阵的联合矩阵的谱范数与所述参考克罗内克因子矩阵的谱范数之间的差。
8.根据权利要求1所述的方法,其中所述数据处理设备包括用于执行所述调整的计算资源,其中对所述克罗内克因子矩阵进行切分包括:
基于多个维度对应的性能信息和所述多个维度对应的信息损失,从所述多个维度中选择目标维度来切分所述克罗内克因子矩阵,其中,一个维度对应的性能信息指示所述计算资源处理与所述维度对应的方阵的效率,一个维度对应的信息损失指示由于利用所述维度来切分参考克罗内克因子矩阵造成的信息损失,所述目标维度指示所述克罗内克因子矩阵被切分成得到所述多个方阵中至少一个方阵的秩。
9.根据权利要求1-8中任一项所述的方法,其中调整所述神经网络模型的所述参数包括:
并行处理所述多个方阵,以确定所述多个方阵的多个逆矩阵;以及
基于所述多个方阵的多个逆矩阵的组合,调整所述神经网络模型的所述参数。
10.根据权利要求1-8中任一项所述的方法,其中所述神经网络模型为图像处理模型,并且其中获取所述克罗内克因子矩阵包括:
获取图像训练数据;以及
将所述图像训练数据应用于所述图像处理模型以获取所述克罗内克因子矩阵。
11.根据权利要求1-8中任一项所述的方法,其中所述神经网络模型为文本处理模型,并且其中获取所述克罗内克因子矩阵包括:
获取文本训练数据;以及
将所述文本训练数据应用于所述文本处理模型以获取所述克罗内克因子矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010480676.0/1.html,转载请声明来源钻瓜专利网。