[发明专利]模型的精度量化方法、装置、电子设备和存储介质在审

申请号：	202211205415.3	申请日：	2022-09-29
公开（公告）号：	CN115526304A	公开（公告）日：	2022-12-27
发明（设计）人：	王佳辰;张广勇;段亦涛	申请（专利权）人：	网易有道信息技术（北京）有限公司
主分类号：	G06N3/063	分类号：	G06N3/063;G06N3/04;G06N3/08
代理公司：	北京华夏泰和知识产权代理有限公司 11662	代理人：	韩来兵
地址：	100085 北京市海淀区西北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型精度量化方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明的实施方式提供了一种模型的精度量化方法、装置、电子设备和存储介质。该模型的精度量化方法包括：获取目标模型中的待量化张量；基于所述待量化张量确定目标量化等级，所述目标量化等级用于指示量化结果所占空间的等级；基于所述目标量化等级对所述待量化张量进行量化，得到量化结果。以解决现有技术中，设备的算力和存储有限，往往会导致模型计算过程中计算效率低，使得运算性能较差的问题。

技术领域

本发明的实施方式涉及计算机技术领域，更具体地，本发明的实施方式涉及模型的精度量化方法、装置、电子设备和存储介质。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

近年来，随着科技的飞速发展，大数据时代已经到来。深度学习以神经网络作为模型，在许多人工智能的关键领域取得了十分显著的成果，如图像识别、增强学习、语义分析等。

端侧AI推理相对于云侧，受到网络影响小，对实时性和用户隐私有更好的保障，因此，往往将模型设置于端侧。

但是，由于端侧AI推理受限于设备的算力和存储，因此，往往会导致模型计算过程中计算效率低，使得运算性能较差。

发明内容

本申请提供了一种模型的精度量化方法、装置、电子设备和存储介质，用以解决现有技术中，设备的算力和存储有限，往往会导致模型计算过程中计算效率低，使得运算性能较差的问题。

在本上下文中，本发明的实施方式期望提供一种模型的精度量化方法、装置、电子设备和存储介质。

在本发明实施方式的第一方面中，提供了一种模型的精度量化方法，包括：

获取目标模型中的待量化张量；