[发明专利]一种终端部署方法和装置有效
申请号: | 201811150239.1 | 申请日: | 2018-09-29 |
公开(公告)号: | CN110163367B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 侯金龙;黄俊洲;吴家祥;张尧 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/092;G06N3/0985 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了一种模型压缩方法及装置,在获取待压缩模型和针对该待压缩模型的压缩偏好配置时,可以根据待压缩模型的模型类型和压缩偏好配置确定出压缩算法组件和对应的算法超参数取值,并利用上述压缩算法组件和算法超参数取值对待压缩模型进行第一次压缩,得到第一次压缩对应的候选压缩结果。若第一次压缩对应的候选压缩结果的性能参数与压缩偏好配置的符合程度未满足预设条件,继续生成调参策略以调整下一次压缩所用的压缩算法组件和算法超参数取值,直到某一次压缩对应的候选压缩结果的性能参数与所述压缩偏好配置的符合程度满足预设条件为止。不需要人工调整压缩算法,避免了人为经验带来的影响,提高了压缩效率。 | ||
搜索关键词: | 一种 终端 部署 方法 装置 | ||
【主权项】:
1.一种模型压缩方法,其特征在于,所述方法包括:获取待压缩模型和压缩偏好配置,所述压缩偏好配置用于标识所述待压缩模型被压缩后具有的性能参数;根据所述待压缩模型的模型类型和所述压缩偏好配置,确定第一次压缩对应的压缩算法组件和算法超参数取值;根据第一次压缩对应的算法超参数取值,通过第一次压缩对应的压缩算法组件对所述待压缩模型进行压缩,得到第一次压缩对应的候选压缩结果;若第一次压缩对应的候选压缩结果的性能参数与所述压缩偏好配置的符合程度不满足预设条件,根据确定出的调参策略调整压缩算法组件和算法超参数取值继续进行压缩;其中,第i次压缩的压缩对象为第i‑1次压缩得到的候选压缩结果,第i次压缩对应的压缩算法组件和算法超参数取值是根据第i次压缩对应的调参策略调整得到的,第i次压缩对应的调参策略是基于第i‑1次压缩对应的候选压缩结果的性能参数与所述压缩偏好配置的符合程度确定的;若第i次压缩对应的候选压缩结果的性能参数与所述压缩偏好配置的符合程度满足预设条件,将第i次压缩对应的候选压缩结果作为所述待压缩模型的压缩模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811150239.1/,转载请声明来源钻瓜专利网。