[发明专利]一种轻量级微处理器AI推理框架在审

专利信息
申请号: 202211046072.0 申请日: 2022-08-30
公开(公告)号: CN115586958A 公开(公告)日: 2023-01-10
发明(设计)人: 何辞;张亚生;黄子勤;陈晨 申请(专利权)人: 中国电子科技集团公司第五十四研究所;西安电子科技大学
主分类号: G06F9/50 分类号: G06F9/50;G06F16/16;G06F16/182;G06N5/04;G06N3/02
代理公司: 西安弘理专利事务所 61214 代理人: 王奇
地址: 050499 河*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 轻量级 微处理器 ai 推理 框架
【权利要求书】:

1.一种轻量级微处理器AI推理框架,其特征在于,步骤包括:

步骤1,在上位机使用量化器对称量化算法将.h5模型量化为numpy数组;

步骤2,创建数组头文件用于存储numpy数组;

步骤3,创建算子头文件,将解析.h5模型中所使用的算子,将MicroInfer库中与.h5模型中所使用的算子适配的算子存入算子头文件;

在步骤1~步骤3的过程中生成计算图并计算算子头文件在下位机上部署所需内存空间的大小;

步骤4,生成MicroInfer核心代码软件包对数组头文件、算子头文件进行解析与调用;

步骤5获取用户BSP工程,根据计算的内存空间大小重新分配用户BSP工程的内存大小;将MicroInfer软件包文件扩充到用户BSP工程中得到更新的BSP工程并保存到下位机;

步骤6,生成模板工程代码和API调用注释供用户在下位机进行实际开发时进行使用。

2.如权利要求1所述的一种轻量级微处理器AI推理框架,其特征在于,步骤1包括:

步骤1.1,获取用户所指定的.h5模型目录,对.h5模型目录进行解析得到权重数组和计算层的输出数据;

步骤1.2,计算.h5模型中权重数组xf的input_dec并计算量化尺度input_scale:

input_scale=7-input_dec (4)

步骤1.3,对.h5模型中计算层的输出数据xo的output_dec,并计算其量化尺度output_scale用于后续做数据矫正:

output_scale=7-out_dec (6)

其中xo为.h5模型中计算层的输出数据,out_dec为对xo取2为底的对数;

步骤1.4,对乘法因子进行矩阵转秩计算得到乘法因子的量化尺度kernel_scale;

步骤1.5,计算每一层的左移参数layer_RSHIFT和右移参数layer_LSHIFT,用于计算过程中的数据修正:

layer_RSHIFT=input_scale+kernel_scale-output_scale (7)

layer_LSHIFT=input_scale+kernel_scale-bias_scale (8)

其中kernel_scale表示乘法因子的量化尺度,input_scale表示.h5模型中权重数组的输入量化尺度,output_scale表示.h5模型中输出数据的量化尺度,bias_scale表示偏置项的量化尺度;

步骤1.6,采用以下公式完成量化输出值的计算:

yq=round(∑xq×wq+bq<<layer_LSHIFT)>>layer_RSHIFT (9)

其中round表示向下取整运算,xq表示量化后的层输入参数,wq表示经过转秩和量化后的乘积因子,bq表示量化后的偏执项,yq表示量化后的numpy数组。

3.如权利要求1所述的一种轻量级微处理器AI推理框架,其特征在于,步骤3包括:利用tensorflow所提供的model.layer方法,遍历所需处理的.h5模型获取.h5模型中所用到的算子;利用open()函数创建算子头文件,若获取.h5模型中所用到的算子已被MicroInfer适配,则利用fp.write()函数写入算子头文件中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所;西安电子科技大学,未经中国电子科技集团公司第五十四研究所;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211046072.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top