[发明专利]面向深度神经网络的边缘计算方法有效
申请号: | 202110870123.0 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113312183B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 罗喜伶;潘洋洋;王雪檬;董赋然 | 申请(专利权)人: | 北京航空航天大学杭州创新研究院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310051 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 深度 神经网络 边缘 计算方法 | ||
1.一种面向深度神经网络的边缘计算方法,其特征在于,包括以下步骤:
步骤1:获取可用边缘设备中卷积层、激活层、池化层的计算时间-浮点运算数的线性回归方程;所述的步骤1具体为:
1.1)在不同的边缘设备中,针对卷积层、激活层、池化层中某一层类型,设置不同的参数,根据输入的不同大小的特征图记录其平均执行时间作为计算时间;
1.2)针对不同参数设置下的各卷积层、激活层、池化层,分别计算浮点运算数,其中卷积层的浮点运算数Fc计算公式为:
Fc=2HW(CinK2+1)Cout
激活层的浮点运算数Fr计算公式为:
Fr=HWCin
池化层的浮点运算数Fp计算公式为:
Fp=K2HoutWoutCout
其中,H、W分别为特征图的高度和宽度,Cin为输入通道数,Cout为输出通道数,K为卷积层中的卷积核或池化层中的过滤器的大小,Hout为输出特征图的高度,Wout为输出特征图的宽度;
1.3)对计算时间和浮点运算数进行线性拟合:
y=kx+b
其中,y用于表示预测的计算时间,x为各层在对应参数设置下的浮点运算数;k为斜率,用于表示算力参数;b为截距,用于表示固有开销参数;
步骤2:端设备将待计算的深度神经网络模型各层参数信息发送至各边缘设备,各边缘设备根据接收到的参数信息重建神经网络模型,并将自身不同层的计算时间-浮点运算数的线性回归方程中的算力、固有开销参数回传至端设备;
步骤3:获取边-端网络环境,得到边缘设备与端设备之间的数据传输速率;
步骤4:根据数据传输速率计算预测数据传输时长,结合预测数据传输时长与预测计算时长,分割输入特征图,获得初始数据分配方案;
步骤5:对分割点附近的数据进行填充,实现对分配至相邻边缘设备的数据交换,得到最终数据分配方案;所述的步骤5具体为:
5.1)标记不可正常卷积的数据部分:
按照卷积层的卷积核大小和步长,获取沿未分割输入特征图较长边方向每次卷积的位置,标记因分割后数据不足而无法完成相应部分卷积的数据,由于该部分数据在初始数据分配方案中被分配至相邻两个边缘设备的卷积层中,分别记为第一边缘设备和第二边缘设备,并记录该部分数据相对于输入特征图较长边的起始位置Si与终止位置Ei,将分割点记为Segi;
5.2)数据填充:
将分配至第二边缘设备中的Seg1至(K+S1)部分的数据填充至第一边缘设备,将分配至第一边缘设备中的(S1+Str)至Seg1部分的数据填充至第二边缘设备,实现数据填充;K为卷积层中的卷积核或池化层中的过滤器的大小,Str为卷积核长度;
5.3)计算步骤5.2)的填充方案下第一边缘设备和第二边缘设备的预测计算时长和数据传输时长,得到各边缘设备对应的总预测时长中的最大值,其中传输数据大小为发送数据大小与回传数据大小之和,回传数据为此种填充方案下输出结果作为下一层卷积层输入部分、以及因数据分割无法完成正常卷积部分的数据;
5.4)重复步骤5.2)至步骤5.3),此次填充至第一边缘设备的数据为前一次填充至第一边缘设备的数据向后扩展一个卷积核长度Str的数据,填充至第二边缘设备的数据为前一次填充至第二边缘设备的数据从开始位置向后缩短一个卷积核长度Str的数据;不断循环直至填充至第一边缘设备的数据为分配至第二边缘设备中的Seg1至E1部分的数据,且填充至第二边缘设备的数据为分配至第一边缘设备中的 (E1-K)至Seg1部分的数据,得到每一次循环下的各边缘设备对应的总预测时长中的最大值;
5.5)比较所有方案下的各边缘设备对应的总预测时长中的最大值Tmax,挑选最小的Tmax作为第一边缘设备和第二边缘设备的填充方案;
5.6)将第二边缘设备作为第一边缘设备,将与第二边缘设备相邻的第三边缘设备作为第二边缘设备,重复步骤5.2)至步骤5.5),直至获取所有可用边缘设备间的最终数据填充方案;
步骤6:将初始分配数据最多的边缘设备作为最强算力边缘设备,端设备将待计算的深度神经网络模型中除卷积层及相邻激活层、以及第一个卷积层至最后一个卷积层之间的池化层之外的剩余层卸载至最强算力边缘设备上,将其余各边缘设备的输出结果发送至最强算力边缘设备中进行数据拼接,将拼接结果在最强算力边缘设备加载的剩余层中继续计算,将最终计算结果发送至端设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学杭州创新研究院,未经北京航空航天大学杭州创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110870123.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于芯片级电路板的焊接夹持工装
- 下一篇:一种绝缘电缆及其制备方法