[发明专利]识别异常客户端的方法、装置、计算机设备和存储介质在审
| 申请号: | 202310453944.3 | 申请日: | 2023-04-25 |
| 公开(公告)号: | CN116595389A | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | 张诚;程佩哲;韩玮祎 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06F18/22 | 分类号: | G06F18/22;G06F18/23;G06N20/00 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 异常 客户端 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种识别异常客户端的方法、装置、计算机设备和存储介质。本申请涉及信息安全及人工智能技术领域。方法包括:获取多个客户端的模型训练数据;将满足预设相似度条件的模型训练数据对应的客户端作为第一标记客户端,得到第一客户端集合;将满足异常值条件的客户端作为第二标记客户端,得到第二客户端集合;基于各客户端的模型训练数据的相似度,通过动态聚类算法,对各客户端进行聚类处理,得到多个客户端组,并将不满足预设聚类条件的客户端组中的所有客户端作为第三标记客户端,得到第三客户端集合;将第一客户端集合、第二客户端集合和第三客户端集合共同包含的客户端作为异常客户端。采用本方法能够提升异常客户端的识别精度。
技术领域
本申请涉及信息安全技术领域,特别是涉及一种识别异常客户端的方法、装置、计算机设备和存储介质。
背景技术
由于模型训练过程中参与联合训练的客户端数量上千,且客户端异构性较大,所以对模型训练过程中异常客户端检测来说较难区分出受攻击和未受攻击的模型,且很难准确找出异常客户端。因此如何准确找出异常客户端是当前研究的重点。
传统识别异常客户端的方法是通过人工检测参与训练的每个客户端发送的训练数据是否存在异常,并将存在异常的训练数据对应的客户端,作为异常客户端。但是攻击者控制的客户端不一定每次都被选中参与训练,且客户端数量过多,人力成本较大,且通过人工判断易存在检测失误的情况。从而导致异常客户端的识别精准度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种识别异常客户端的方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种识别异常客户端的方法。所述方法包括:
获取多个客户端的模型训练数据;所述模型训练数据为模型在历史时段的所有模型训练参数;
根据各所述客户端的模型训练数据进行相似性识别,得到各所述模型训练数据的相似度,并将满足预设相似度条件的模型训练数据对应的客户端作为第一标记客户端,得到第一客户端集合;
对各所述客户端进行评价处理,得到各所述客户端的异常值,并将满足异常值条件的客户端作为第二标记客户端,得到第二客户端集合;
基于各所述客户端的模型训练数据的相似度,通过动态聚类算法,对各所述客户端进行聚类处理,得到多个客户端组,并将不满足预设聚类条件的客户端组中的所有客户端作为第三标记客户端,得到第三客户端集合;
将所述第一客户端集合、所述第二客户端集合和所述第三客户端集合共同包含的客户端作为异常客户端。
可选的,所述获取多个客户端的模型训练数据,包括:
将模型发送至各所述客户端,并通过各所述客户端对所述模型进行训练;
在满足预设时间段的情况下,采集每个客户端对所述模型进行训练的模型训练参数;
针对每个客户端,将所述客户端在历史时段采集的所述模型的所有模型训练参数,作为所述客户端的模型训练数据。
可选的,所述相似度条件包括第一相似度条件、以及第二相似度条件,所述根据各所述客户端的模型训练数据进行相似性识别,得到各所述模型训练数据的相似度,并将满足预设相似度条件的模型训练数据对应的客户端作为第一标记客户端,得到第一客户端集合,包括:
针对每个客户端,根据所述客户端的每个模型训练参数,获取所述客户端的每个模型训练参数的模型训练特征信息,并基于所述客户端的每个模型训练参数的模型训练特征信息,计算所述客户端的各模型训练参数的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310453944.3/2.html,转载请声明来源钻瓜专利网。





