[发明专利]模型压缩方法、系统、终端及存储介质在审
申请号: | 202211085770.1 | 申请日: | 2022-09-06 |
公开(公告)号: | CN115456169A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 王光勇;关海欣;梁家恩 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06F17/16;G06V10/762 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 压缩 方法 系统 终端 存储 介质 | ||
本发明提供了一种模型压缩方法、系统、终端及存储介质,该方法包括:对待压缩模型进行模型训练,在待压缩模型中添加正则项和奇异值分解,得到奇异值矩阵,根据奇异值矩阵返回执行对待压缩模型进行模型训练的步骤及后续步骤,直至待压缩模型满足性能下降条件,输出待压缩模型;根据待压缩模型的权重张量进行参数聚类,得到权重参数矩阵,对权重参数矩阵进行权值量化,得到聚类量化矩阵;根据聚类量化矩阵对待压缩模型进行参数设置,得到压缩模型。本发明基于稀疏正则化、迭代剪枝和聚类量化的联合模型压缩方式,从全局的角度上对待压缩模型进行模型压缩,在保障精度不减的前提下,实现了最大化的模型压缩。
技术领域
本发明涉及模型处理技术领域,尤其涉及一种模型压缩方法、系统、终端及存储介质。
背景技术
现如今,机器学习已经广泛应用于各行各业中。复杂的模型固然具有更好的性能,但是高额的存储空间、计算资源消耗是制约其应用效率的一大重要原因,因此,针对模型压缩方法越来越受人们所重视。
现有的模型压缩过程中,一般是将模型中不重要的通道、卷积核、某一层等直接从模型中删除,进而实现了减小模型中的参数量和计算量的效果,但由于直接删除了模型中的通道、卷积核或网络层,导致压缩后的模型性能较低,降低了用户的使用体验。
发明内容
本发明实施例的目的在于提供一种模型压缩方法、系统、终端及存储介质,旨在解决现有的模型压缩过程中,压缩后的模型性能较低的问题。
本发明实施例是这样实现的,一种模型压缩方法,所述方法包括:
获取待压缩模型,并对所述待压缩模型进行模型训练;
在模型训练后的所述待压缩模型中添加正则项,并对添加所述正则项后的所述待压缩模型的权重张量进行奇异值分解,得到奇异值矩阵,所述正则项用于对所述待压缩模型中的权重参数进行参数稀疏;
根据所述奇异值矩阵返回执行所述对所述待压缩模型进行模型训练的步骤及后续步骤,直至所述待压缩模型满足性能下降条件,输出所述待压缩模型;
根据输出的所述待压缩模型的权重张量进行参数聚类,得到权重参数矩阵,并对所述权重参数矩阵进行权值量化,得到聚类量化矩阵;
根据所述聚类量化矩阵对所述待压缩模型进行参数设置,得到压缩模型。
更进一步的,所述根据所述奇异值矩阵返回执行所述对所述待压缩模型进行模型训练的步骤及后续步骤之前,所述方法还包括:
将测试数据输入训练后的所述待压缩模型进行数据处理,得到输出数据,并获取所述测试数据的标准数据;
根据所述标准数据和所述输出数据,对所述待压缩模型进行性能检测,得到主观评价指标、音频可懂指标和语音质量评价指标;
若所述主观评价指标、所述音频可懂指标和所述语音质量评价指标满足预设指标条件,则判定所述待压缩模型满足性能下降条件。
更进一步的,所述根据所述标准数据和所述输出数据,对所述待压缩模型进行性能检测,包括:
获取所述输出数据中的输出图像,并获取所述标准数据中的标准图像;
根据所述标准图像和所述输出图像进行信噪比计算,得到所述主观评价指标;
获取所述输出数据中的输出音频,并获取所述标准数据中的标准音频;
根据所述输出音频和所述标准音频进行短时客观可懂度计算,得到所述音频可懂指标;
获取所述输出数据中的输出语音,并获取所述标准数据中的标准语音;
根据所述输出语音和所述标准语音进行感知语音质量评价计算,得到所述语音质量评价指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211085770.1/2.html,转载请声明来源钻瓜专利网。