[发明专利]数据处理方法、装置及电子设备有效
申请号: | 201811604698.2 | 申请日: | 2018-12-26 |
公开(公告)号: | CN111368992B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王路路;陈冠豪;孟晓楠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 广州铸智知识产权代理有限公司 44886 | 代理人: | 徐瑞红 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 | ||
本发明实施例提供一种数据处理方法、装置及电子设备,其中,该方法应用于深度学习模型的嵌入层中,嵌入层包括第一参数矩阵和第二参数矩阵,第一参数矩阵与第二参加矩阵的乘积作为嵌入层的向量字典,该方法包括:接收输入数据,在第一参数矩阵中获取与该输入数据对应的第一特征向量;将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;将该第二特征向量作为输入数据对应的特征向量进行输出。本发明实施例利用矩阵分解的特性将嵌入层中庞大的参数矩阵分解为小矩阵的乘积,从而减少了参数矩阵的存储空间,进而也减小了整个深度学习模型的存储空间。
技术领域
本申请涉及一种数据处理方法、装置及电子设备,属于计算机技术领域。
背景技术
深度学习技术在图像、语音、文本等领域都取得了巨大的成功,推动了一系列智能产品发展。尤其在搜索、广告、推荐等场景取得了很大的突破。但是,深度学习模型存在参数矩阵庞大,导致模型所占空间较大,严重占用存储资源。
发明内容
本发明实施例提供一种数据处理方法、装置及电子设备,以压缩深度学习模型中嵌入层参数矩阵所占的存储空间。
为了实现上述目的,本发明实施例提供了一种数据处理方法,该方法应用于深度学习模型的嵌入层中,所述嵌入层包括第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参数矩阵的乘积作为所述嵌入层的向量字典,该方法包括:
接收输入数据,并在第一参数矩阵中获取与该输入数据对应的第一特征向量;
将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
将该第二特征向量作为所述输入数据对应的特征向量进行输出。
本发明实施例还提供了一种数据处理装置,该装置设置于深度学习模型的嵌入层中,其包括:
输入数据接收模块,用于接收输入数据;
参数矩阵存储模块,用于存储第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参数矩阵的乘积作为所述嵌入层的向量字典;
特征向量获取模块,用于在第一参数矩阵中获取与该输入数据对应的第一特征向量,并将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
向量输出模块,用于将该第二特征向量作为所述输入数据对应的特征向量进行输出。
本发明实施例还提供了一种电子设备,包括:
存储器,用于存储程序;
处理器,耦合至所述存储器,用于执行所述程序,该程序应用于针对深度学习模型的嵌入层所进行的处理,该嵌入层包括第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参数矩阵的乘积作为所述嵌入层的向量字典,所述处理包括:
接收输入数据,在第一参数矩阵中获取与该输入数据对应的第一特征向量;
将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
将该第二特征向量作为所述输入数据对应的特征向量进行输出。
本发明实施例还提供了一种数据处理方法,该方法应用于语义分析模型的词嵌入层中,所述词嵌入层包括第一参数矩阵和第二参数矩阵,所述第一参数矩阵与第二参数矩阵的乘积作为所述词嵌入层的词向量字典,该方法包括:
接收输入文本数据,并在第一参数矩阵中获取与该输入文本数据对应的第一特征向量;
将该第一特征向量与第二参数矩阵进行矩阵乘法,生成第二特征向量;
将该第二特征向量作为所述输入文本数据对应的语义特征向量进行输出。
本发明实施例还提供了一种电子设备,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811604698.2/2.html,转载请声明来源钻瓜专利网。