[发明专利]一种基于分层细粒度融合联邦学习的分布式废钢检测方法及系统在审
申请号: | 202310094938.3 | 申请日: | 2023-02-10 |
公开(公告)号: | CN116524309A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 张卫东;吴宣够;郑啸;赵伟 | 申请(专利权)人: | 安徽工业大学;合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V20/10;G06V10/74;G06N20/00 |
代理公司: | 南京九致知识产权代理事务所(普通合伙) 32307 | 代理人: | 王晓青 |
地址: | 243032 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 细粒度 融合 联邦 学习 分布式 废钢 检测 方法 系统 | ||
1.一种基于分层细粒度融合联邦学习的分布式废钢检测方法,其特征在于,应用于联邦学习的服务器端,包括:
接收各客户端上传的本地模型根据本地训练数据集训练的本地模型参数;其中,各客户端由各卸料点构成;
根据客户端上传的本地模型参数的差异,采用分层细粒度融合的权重设置方式对客户端的本地模型参数进行融合,获得全局融合模型参数;其中,服务器端建立有与各客户端的本地模型结构相同的全局模型,并且所述全局模型的初始化全局模型参数随机生成;
广播全局融合模型参数至所有客户端,以便各客户端根据全局融合模型参数进行新一轮的迭代训练直至各客户端的本地模型达到设定的预期模型精度,进而以各客户端对应训练完成的本地模型作为其本地废钢检测模型进行废钢检测。
2.根据权利要求1所述的基于分层细粒度融合联邦学习的分布式废钢检测方法,其特征在于,所述获得全局融合模型参数的具体过程为:
分层划分全局模型的全局模型参数和获取的各客户端上传的本地模型参数为行向量集合;
依次计算各客户端的本地模型参数与服务器端的全局模型参数在每一层行向量上的相似度,并以任一客户端的相似度占所有客户端在该层的相似度总和的比例作为该客户端的本地模型参数融合时的权重;
对各客户端的本地模型参数在每一层进行加权平均,计算得到每一层的融合模型参数;
统计并汇总各层的融合模型参数,获得全局融合模型参数。
3.根据权利要求2所述的基于分层细粒度融合联邦学习的分布式废钢检测方法,其特征在于,所述采用分层细粒度融合的权重设置方式对客户端的本地模型参数进行融合的计算过程为:
定义服务器端的全局模型和客户端的本地模型均为一具有L层神经网络的深度学习模型,分别记为模型ws和模型参数为wk;并且,按层划分模型ws的全局模型参数为行向量集合{ws1,...wsl,...,wsL},按层划分模型wk的模型参数为行向量集合{wk1,...wkl,...,wkL};其中,l∈L,k∈K,K为联邦学习系统中客户端总数;
根据cosine相似度计算客户端k的模型参数与服务器端的全局模型参数在对应层行向量上的相似度
计算各客户端的相似度占所有客户端在该层的相似度总和的比例并以该比例作为客户端的本地模型参数在第l层的融合权重:
根据权重对各客户端每一层的模型参数加权平均,获得服务器端在对应层的融合模型参数并作为服务器端在该层新一轮的迭代训练的全局模型参数。
4.根据权利要求1所述的基于分层细粒度融合联邦学习的分布式废钢检测方法,其特征在于,客户端的本地模型根据本地训练数据集训练更新模型参数的过程为:
获取各卸料点本地拍摄的废钢高清图片;
对各卸料点的废钢高清图片进行预处理,以生成各卸料点的本地训练数据集;其中,预处理过程包括去除废钢高清图片中的背景信息、将图片数据转换为数字组成的向量数据、对废钢数据按照其实际的废钢类别附加标签;所述废钢类别包括统料废钢、合格废钢、精料废钢、重型废钢、轻薄料、杂铁;
将废钢高清图片预处理后的向量数据作为本地模型的输入,经模型参数的计算获得模型输出值;
比较计算模型输出值与废钢数据附加的标签的误差,并通过链式法则对本地模型的每个参数求导,获得梯度数据;
根据梯度数据对本地模型的模型参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学;合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室),未经安徽工业大学;合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310094938.3/1.html,转载请声明来源钻瓜专利网。