[发明专利]压缩/解压缩神经网络模型的装置、设备和方法在审

申请号：	201611159629.6	申请日：	2016-12-15
公开（公告）号：	CN108229644A	公开（公告）日：	2018-06-29
发明（设计）人：	陈天石;韦洁;陈云霁;刘少礼;支天;郭崎	申请（专利权）人：	上海寒武纪信息科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06F17/30
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	任岩
地址：	201203 上海市浦东***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络模型解压缩压缩神经网络参数神经网络算法压缩参数低维自动编码解压存储传输恢复
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种压缩/解压缩神经网络模型的装置、设备和方法。其中包括步骤：获取神经网络模型的待压缩参数；采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；解压所述低维的神经网络参数，恢复神经网络模型的参数。本发明用自动编码神经网络算法实现压缩/解压缩神经网络模型的装置，可减少神经网络模型的参数，有利于模型的存储和传输。

技术领域

本发明涉及神经网络模型压缩/解压缩算法应用技术领域，更具体地涉及一种压缩/解压缩神经网络模型的装置和设备，还涉及一种压缩/解压缩神经网络模型的方法。

背景技术

近年来，神经网络算法被广泛应用到各个领域，随着问题复杂度和对准确率要求的不断提高，神经网络模型深度不断增加，随之而来的是参数数量的爆炸式增长，这给神经网络模型的存储和传输带来了极大的不便。设想将来手机上每一个应用都具备深度学习的能力，但每一个应用都要传输、存储上G的神经网络模型参数，这显然是不合理的。

传统的降维方法大多是线性的，例如PCA(Principal Component Analysis，主成分分析)选取高维数据中方差最大的部分方向，通过选择这些方向，得到包含最多信息的低维表示。然而，PCA方法的线性性导致抽取出的特征类型有很大限制。

发明内容

有鉴于此，本发明的目的在于提供一种用自动编码神经网络算法压缩/解压缩神经网络模型的装置和方法，以解决上述至少一个技术问题。

根据本发明的一方面，提供一种压缩/解压缩神经网络模型的方法，包括步骤：

S1：获取神经网络模型的待压缩参数；

S2：采用神经网络算法对所述待压缩参数进行压缩和训练，获得低维的神经网络参数；

S3：解压所述低维的神经网络参数，恢复神经网络模型的参数。

进一步的，步骤S1包括：对神经网络模型的待压缩参数进行遍历选取，直至选取的待压缩参数的数量等于设定的维数。

进一步的，步骤S1包括：对神经网络模型的待压缩参数进行遍历选取，对所述待压缩参数进行稀疏化，对选取的待压缩参数进行判断，小于设定阈值的待压缩参数被设置为0，选取稀疏化后的非零元并标记非零元的位置坐标，直至选取的待压缩参数的数量等于设定的维数。

进一步的，所述遍历选取按照构建神经网络模型的先后顺序依次获取各层的待压缩参数。

进一步的，步骤S2包括子步骤：

S21：以多层感知器为基础搭建自动编码神经网络，自动编码神经网络的输入层和输出层节点数相同，并且隐层节点数少于输入层节点数；