[发明专利]基于深度学习和极值理论的数据异常判断方法及系统在审
申请号: | 202011060903.0 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112163624A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 金耀辉;何浩;黄宗源;李龙元 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 张宁展 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 极值 理论 数据 异常 判断 方法 系统 | ||
1.一种基于深度学习和极值理论的数据异常判断方法,其特征在于,包括:
根据当前数据集中的数据样本,构建异常评分模型,并对异常评分模型进行迭代优化,使得异常评分模型趋近优化目标;
通过异常评分模型获取数据样本的异常分数值;
根据获取的数据样本的异常分数值中的极端值,估计极值分布公式参数,使用阈值计算公式计算异常分数阈值;
利用异常评分模型获取当前数据集中的待判断数据的异常分数,将待判断数据的异常分数与异常分数阈值进行比较,对于异常分数超过异常分数阈值的数据,标定为异常数据,完成对数据的异常判断。
2.根据权利要求1所述的基于深度学习和极值理论的数据异常判断方法,其特征在于,所述根据数据样本,构建异常评分模型,并对异常评分模型进行迭代优化,使得异常评分模型趋近优化目标,包括:
根据数据样本,使用神经网络技术训练构建异常评分模型的表征学习器;使用表征学习器进行数据到表征的映射,从而得到数据在表征空间中的表示,即数据表征;
根据得到的数据表征,使用神经网络技术训练构建异常评分模型的异常评分器;使用异常评分器对数据表征进行评分,得到与数据样本对应的异常分数;
设定数据先验分布,通过先验生成器生成满足先验分布的数据,通过参考运算器计算满足先验分布的数据的先验分布观测参数;
使用偏差运算器计算异常分数与先验分布观测参数的偏差,进一步计算损失函数;
使用优化迭代器通过多次迭代更新异常评分模型参数,降低损失函数,最终得到优化后的异常评分模型。
3.根据权利要求2所述的基于深度学习和极值理论的数据异常判断方法,其特征在于,所述使用异常评分器对数据表征进行评分的方法,包括:
所述异常评分器为:score=ψ(η;θs),对数据表征进行评分,得到数据的异常分数值score;
其中,为表征学习器,实现xi→ηi的映射,ηi为xi对应的数据表征,θr和θs分别为表征学习器和异常评分器的网络结构参数。
4.根据权利要求2所述的基于深度学习和极值理论的数据异常判断方法,其特征在于,所述参考运算器计算满足先验分布的数据的先验分布观测参数的方法,包括:
选用符合当前应用需要的数据分布作为先验分布,根据先验分布生成一定量的数据,通过这些数据计算分布的特征参数观测结果。
5.根据权利要求2所述的基于深度学习和极值理论的数据异常判断方法,其特征在于,所述计算损失函数的方法,包括:
所述损失函数表示为Loss=L(ψ(x;θ),θf),引导优化异常评分模型;
其中,ψ(x;θ)为异常评分模型获得的异常评分,如权利要求3中所述,θ=(θr,θs);θf为先验分布参数,如权利要求4所述,比如高斯分布中θf=(μ,σ);函数L衡量异常评分与先验分布间的差异,根据不同先验分布与任务类型进行不同形式的定义。
6.根据权利要求1所述的基于深度学习和极值理论的数据异常判断方法,其特征在于,所述根据获取的数据样本的异常分数值中的极端值,估计极值分布公式参数,使用阈值计算公式计算异常分数阈值,包括:
利用参数估计器,根据数据样本的异常分数,将异常分数分布的尾端部分划分为极端部分,极端部分的异常分数即为极端值;使用极端值估计极值分布公式参数;
利用阈值生成器,将极值分布公式参数代入阈值生成器的阈值计算公式中,计算得到适用于当前数据集的异常分数阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011060903.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电梯无线外呼控制器
- 下一篇:一种多维时间序列异常检测方法及检测系统