[发明专利]分布外数据检测方法、装置、服务器及存储介质在审
| 申请号: | 202110241746.1 | 申请日: | 2021-03-04 |
| 公开(公告)号: | CN112966819A | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 潘超;宋丽妍;姚新;武晓宇;胡崝 | 申请(专利权)人: | 南方科技大学;华为技术有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 潘登 |
| 地址: | 518055 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分布 数据 检测 方法 装置 服务器 存储 介质 | ||
本发明实施例公开了一种分布外数据检测方法、装置、服务器及存储介质,所述方法包括:获取待检测数据;对待检测数据进行编码处理,得到低维特征数据;基于预设第一内存数据对低维特征数据进行处理,得到第一低维数据;基于预设第二内存数据对低维特征数据进行处理,得到第二低维数据;基于第一低维数据和第二低维数据生成待解码数据;对待解码数据进行解码处理,得到重构数据;确定待检测数据和重构数据的重构误差,若重构误差大于预设阈值,则确定待检测数据为分布外数据。本发明实施例限制了自编码器对OOD数据的重构能力,提高了ID数据和OOD数据的重构误差的差异,从而提升OOD数据识别的准确性。
技术领域
本发明实施例涉及机器学习技术领域,尤其涉及一种分布外数据检测方法、装置、服务器及存储介质。
背景技术
在机器学习领域,用于训练模型的数据通常被称为分布内(In-distribution,ID)数据,而分布外(Out-of-distribution,OOD)数据是指和训练的ID数据分布不一致的数据。在神经网络模型的实际应用中,输入数据中有时存在OOD数据,这会导致模型预测不准确,进而限制神经网络模块的应用。因此,对机器学习模型的输入数据进行OOD数据检测是提高模型预测准确率的一种重要手段。
目前,OOD数据的检测主要采用基于自编码器的OOD检测算法。自编码器使用ID数据进行训练,故而其对ID数据具有较好的重构效果,但不能够很好的重构OOD数据。因此,当自编码器的输入数据和重构后的输出数据之间误差较大时,即可认为输入数据为OOD数据。然而,由于自编码器的泛化能力过强,即使是训练数据分布外的OOD数据也可能重构得很好,这就导致自编码器无法很好的检测出OOD数据。
发明内容
有鉴于此,本发明实施例提供一种分布外数据检测方法、装置、服务器及存储介质,以降低自编码器对分布外数据的重构能力,提高分布外数据检测的准确性。
第一方面,本发明实施例提供一种分布外数据检测方法,包括:
获取待检测数据;
对所述待检测数据进行编码处理,得到低维特征数据;
基于预设第一内存数据对所述低维特征数据进行处理,得到第一低维数据;
基于预设第二内存数据对所述低维特征数据进行处理,得到第二低维数据;
基于所述第一低维数据和所述第二低维数据生成待解码数据;
对所述待解码数据进行解码处理,得到重构数据;
确定所述待检测数据和所述重构数据的重构误差,若所述重构误差大于预设阈值,则确定所述待检测数据为分布外数据。
进一步的,所述基于预设第一内存数据对所述低维特征数据进行处理,得到第一低维数据包括:
计算所述低维特征数据与预设第一内存数据的第一余弦相似度;
基于所述第一余弦相似度对所述预设第一内存数据进行加权处理,得到第一低维数据。
进一步的,所述基于预设第二内存数据对所述低维特征数据进行处理,得到第二低维数据包括:
根据所述低维特征数据的标签和预设第二内存数据确定目标第二内存数据;
基于所述目标第二内存数据对所述低维特征数据进行处理,得到第二低维数据。
进一步的,所述根据所述低维特征数据的标签和预设第二内存数据确定目标第二内存数据包括:
确定所述低维特征数据的标签;
将所述预设第二内存数据中标签与所述低维特征数据的标签相同的数据作为目标第二内存数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学;华为技术有限公司,未经南方科技大学;华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110241746.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





