[发明专利]蛋白质语言模型的量化方法、装置、设备和存储介质有效
申请号: | 202310431440.1 | 申请日: | 2023-04-21 |
公开(公告)号: | CN116153389B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 彭爽;杨非;张逸;孙柠 | 申请(专利权)人: | 之江实验室 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00 |
代理公司: | 杭州华进联浙知识产权代理有限公司 33250 | 代理人: | 何晓春 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蛋白质 语言 模型 量化 方法 装置 设备 存储 介质 | ||
1.一种蛋白质语言模型的量化方法,其特征在于,所述方法包括:
采用均匀对称量化方法对蛋白质语言模型的权重值进行量化;
通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围,并基于第一断点
;
所述第二断点
;
其中,
通过分段线性量化方法分别对所述至少两个量化区间的激活值进行量化;
基于量化后的权重值以及量化后的激活值,配置得到量化后的蛋白质语言模型。
2.根据权利要求1所述的方法,其特征在于,所述通过校准数据集确定所述蛋白质语言模型的激活值的第一截断范围包括:
选取校准数据集输入给蛋白质语言模型,以获取模型每一个张量对应激活值的第一截断范围[
其中,表示对应张量激活值最小
3.根据权利要求1所述的方法,其特征在于,所述通过分段线性量化方法分别对所述至少两个量化区间的激活值进行量化包括:
;
其中,
4.根据权利要求1所述的方法,其特征在于,所述采用均匀对称量化方法对蛋白质语言模型的权重值进行量化包括:
确定所述蛋白质语言模型的权重值的第二截断范围;
针对所述第二截断范围,采用均匀对称量化方法对蛋白质语言模型的权重值进行量化。
5.根据权利要求4所述的方法,其特征在于,所述采用均匀对称量化方法对蛋白质语言模型的权重值进行量化包括:
其中,表示量化之后又反量化的近似权重值,表示蛋白质语言模型的权重值,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310431440.1/1.html,转载请声明来源钻瓜专利网。