[发明专利]一种深度学习模型的云边协同训练和部署系统及方法在审
申请号: | 202210532404.X | 申请日: | 2022-05-10 |
公开(公告)号: | CN115033253A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 刘敏;张义伟;徐洋 | 申请(专利权)人: | 中国电子科技集团公司第四十一研究所 |
主分类号: | G06F8/61 | 分类号: | G06F8/61;G06N3/04;G06F9/50;G06F9/38 |
代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 种艳丽 |
地址: | 233010 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 模型 协同 训练 部署 系统 方法 | ||
1.一种深度学习模型的云边协同训练和部署系统,其特征在于:包括检测器、边缘服务器和中心云服务器;
检测器,被配置为用于调用深度学习模型对产品质量进行实时检测,并将历史数据传送到边缘服务器;其包括工控机、单片机、图像采集通讯组件、光源控制电路和编码器信号采集电路;
边缘服务器,被配置为用于在收到中心云服务模型训练命令后,解析命令,获取任务参数信息,采集指定检测器存储数据,进行模型训练,同时定时更新包括训练进度、训练精度和训练损失值在内的过程信息给中心云服务器;在收到中心云服务模型部署命令后,解析命令,向检测器下发训练好的模型文件,进行模型部署,同时定时更新包括模型下发进度和检测器加载模型进度在内的过程信息给中心云服务器;
中心云服务器,被配置为用于接收用户的远程控制,向边缘服务器发送模型训练和模型部署命令,以及接收边缘服务器的返回信息,向用户显示任务执行情况。
2.一种深度学习模型的云边协同训练和部署方法,其特征在于:采用如权利要求1所述的深度学习模型的云边协同训练和部署系统;具体包括如下步骤:
步骤1:通过检测器调用深度学习模型对产品质量进行实时检测,并将历史数据传送到边缘服务器;
步骤2:边缘服务器,被配置为用于在收到中心云服务模型训练命令后,解析命令,获取任务参数信息,采集指定检测器存储数据,进行模型训练,同时定时更新包括训练进度、训练精度和训练损失值在内的过程信息给中心云服务器;在收到中心云服务模型部署命令后,解析命令,向检测器下发训练好的模型文件,进行模型部署,同时定时更新包括模型下发进度和检测器加载模型进度在内的过程信息给中心云服务器;
步骤3:中心云服务器,被配置为用于接收用户的远程控制,向边缘服务器发送模型训练和模型部署命令,以及接收边缘服务器的返回信息,向用户显示任务执行情况;
步骤4:实现检测模型的自动化训练和部署。
3.根据权利要求2所述的深度学习模型的云边协同训练和部署方法,其特征在于:中心云服务器执行分布式任务处理,在收到用户的控制命令后,发布包括训练模型或部署模型在内的异步任务,发布定时任务更新任务执行进度,任务信息立即放入消息队列中,任务执行单元从消息队列中依次取出任务执行,并存储执行结果。
4.根据权利要求2所述的深度学习模型的云边协同训练和部署方法,其特征在于:模型训练的任务流程如下:
步骤S1:用户在中心云服务器进行模型训练配置数据;
模型训练配置数据,包括训练集和验证集的生成器配置;模型尺寸、迭代次数和分类种类的配置,以及数据预处理、预训练权重、回调函数和模型微调项目的配置;
步骤S2:中心云服务器将任务消息放入Redis队列;
步骤S3:Redis队列有新任务信息;
步骤S4:中心云服务器的任务执行单元从Redis队列取出并解析任务信息,向边缘服务器下发训练任务,同时开启定时任务,获取任务执行进度;
步骤S5:边缘服务器接收到训练任务之后,采集相应检测器存储的原始数据,采集完成后按照任务要求,开展模型训练;
步骤S6:判读模型训练是否完成;
若:判断结果是模型训练已经完成,则执行步骤S7;
或判断结果是模型训练没有完成,则执行步骤S8;
步骤S7:生成模型,执行步骤S3;
步骤S8:向中心云服务器定时返回模型的训练进度和训练效果,继续训练;
步骤S9:判断中途是否停止;
若:判断结果是中途停止,则执行步骤S10;
或判断结果是中途没有停止,则执行步骤S6;
步骤S10:回调函数中结束训练;
步骤S11:模型训练完成,自动上传至中心云服务器进行进一步的评估测试。
5.根据权利要求2所述的深度学习模型的云边协同训练和部署方法,其特征在于:模型部署的任务流程如下:
步骤S21:用户在中心云服务器进行模型部署配置数据;
模型的部署配置数据,包括模型尺寸、图像兴趣区域、模型归属和部署完成其他操作配置;
步骤S22:中心云服务器将任务消息放入Redis队列;
步骤S23:Redis队列有新任务信息;
步骤S24:中心云服务器的任务执行单元从Redis队列取出并解析任务信息,向边缘服务器下发部署任务,同时开启定时任务,获取任务执行进度;
步骤S25:边缘服务器接收到任务之后,向指定检测器发送训练好的模型文件;
步骤S26:判断模型文件下发是否完成;
若:判断结果是模型文件下发完成,则执行步骤S27;
或判断结果是模型文件下发没有完成,则执行步骤S28;
步骤S27:检测器接收完成模型文件,放入指定的品牌参数文件夹下,检测器执行加载模型;然后执行步骤S23;
步骤S28:向中心云服务器定时返回模型返回下发进度,继续传输;
步骤S29:判断中途是否停止;
若:判断结果是中途停止,则执行步骤S29;
或判断结果是中途没有停止,则执行步骤S26;
步骤S29:返回状态;
步骤S30:边缘服务器向中心云服务器返回模型部署成功消息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第四十一研究所,未经中国电子科技集团公司第四十一研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210532404.X/1.html,转载请声明来源钻瓜专利网。