[发明专利]蛋白质语言模型的量化方法、装置、设备和存储介质有效

专利信息
申请号: 202310431440.1 申请日: 2023-04-21
公开(公告)号: CN116153389B 公开(公告)日: 2023-07-18
发明(设计)人: 彭爽;杨非;张逸;孙柠 申请(专利权)人: 之江实验室
主分类号: G16B5/00 分类号: G16B5/00;G16B40/00
代理公司: 杭州华进联浙知识产权代理有限公司 33250 代理人: 何晓春
地址: 311121 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 蛋白质 语言 模型 量化 方法 装置 设备 存储 介质
【权利要求书】:

1.一种蛋白质语言模型的量化方法,其特征在于,所述方法包括:

采用均匀对称量化方法对蛋白质语言模型的权重值进行量化;

通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围,并基于第一断点pl和第二断点pu将所述第一截断范围划分为至少两个第一截断子范围,基于各所述第一截断子范围的中心,将各所述第一截断子范围划分为至少两个量化区间;所述第一断点pl的确定方式如下:

所述第二断点pu的确定方式如下:

其中,mn表示超参数,rl表示第一截断范围的最小值,ru表示第一截断范围的最大值;

通过分段线性量化方法分别对所述至少两个量化区间的激活值进行量化;

基于量化后的权重值以及量化后的激活值,配置得到量化后的蛋白质语言模型。

2.根据权利要求1所述的方法,其特征在于,所述通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围包括:

选取校准数据集输入给蛋白质语言模型,以获取模型每一个张量对应激活值的第一截断范围[rlru];其中,

其中,表示对应张量激活值最小topk的中位数,表示对应张量激活值最大topk的中位数,r表示对应张量激活值。

3.根据权利要求1所述的方法,其特征在于,所述通过分段线性量化方法分别对所述至少两个量化区间的激活值进行量化包括:

其中,b表示激活值量化的bits数,表示量化后又经过反量化的近似激活值,uni()表示均匀对称量化。

4.根据权利要求1所述的方法,其特征在于,所述采用均匀对称量化方法对蛋白质语言模型的权重值进行量化包括:

确定所述蛋白质语言模型的权重值的第二截断范围;

针对所述第二截断范围,采用均匀对称量化方法对蛋白质语言模型的权重值进行量化。

5.根据权利要求4所述的方法,其特征在于,所述采用均匀对称量化方法对蛋白质语言模型的权重值进行量化包括:

其中,表示量化之后又反量化的近似权重值,表示蛋白质语言模型的权重值,b表示要量化到的bit数,N表示量化级别的数量,[rlru]表示第二截断范围,rq表示量化之后的权重值,clamp表示截断函数,s表示量化的比例因子,Z表示量化偏移值,表示取整函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310431440.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top