[发明专利]一种面向FPGA的多目标网络结构的构建方法有效
| 申请号: | 202111051377.6 | 申请日: | 2021-09-08 |
| 公开(公告)号: | CN113780542B | 公开(公告)日: | 2023-09-12 |
| 发明(设计)人: | 姜宏旭;田方正;李波;李晓宾;张润华;胡宗琦;常云洋 | 申请(专利权)人: | 北京航空航天大学杭州创新研究院;北京航空航天大学 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/084;G06N3/0464 |
| 代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
| 地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 fpga 多目标 网络 结构 构建 方法 | ||
1.一种面向FPGA的多目标网络结构的构建方法,其特征在于,包括:
构建轻量化、可伸缩并易收敛的网络结构搜索候选模块,对所述候选模块在FPGA平台上的时延进行测试并记录,并设计可微化的时延指标约束函数;
设计有向无环图的过参数化网络搜索空间和设计无代理的二阶段网络搜索策略,加速网络结构的搜索过程;
将所述时延指标约束函数加入基于梯度下降的反向传播算法中,构建多目标综合搜索损失函数;根据所述多目标综合搜索损失函数,生成适配FPGA的轻量级网络结构;
其中,所述构建轻量化、可伸缩并易收敛的网络结构搜索候选模块,包括:
将卷积计算算子,激活算子,跳链接操作进行组合;所述卷积计算算子采用深度可分离算子,外加设计通道扩展因子,引入了残差结构,添加跳链接,组合成网络结构搜索候选模块;
所述设计有向无环图的过参数化网络搜索空间,包括:
根据目标任务的输入数据,预设定若干固定模块,分别在网络结构的前后两端;中间是可学习块部分,由轻量候选单元进行填充,以此形成搜索空间;
所述无代理的二阶段网络搜索策略,包括:
二值化路径的网络结构搜索优化和基于梯度的网络结构参数训练。
2.根据权利要求1所述的一种面向FPGA的多目标网络结构的构建方法,其特征在于,所述时延指标约束函数为:
其中,i表示当前的可学习块在搜索空间中的位置索引,也即代表第i个可学习块,j代表可学习块中候选路径的位置索引,p表示路径的可能性,也称为路径的权重值;E[latencyi]表示第i个可学习块的时延期望,F(·)表示时延预测模型,表示候选单元的时延。
3.根据权利要求1所述的一种面向FPGA的多目标网络结构的构建方法,其特征在于,在构建的所述多目标综合搜索损失函数中引入尺度因子,
其中Loss表示多目标综合搜索损失函数;LossCE表示训练网络的时候通常使用的交叉熵损失函数,通过反向传播对于网络权重进行优化;表示搜索得到的总体网络结构硬件时延的期望;λ表示尺度因子,λ∈[0,1]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学杭州创新研究院;北京航空航天大学,未经北京航空航天大学杭州创新研究院;北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111051377.6/1.html,转载请声明来源钻瓜专利网。





