[发明专利]用于比较异常检测模型的异常分数的分离最大化技术在审
申请号: | 202111259145.X | 申请日: | 2021-10-28 |
公开(公告)号: | CN114429170A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | H·F·莫汉达姆;A·雅科夫列夫;S·阿格拉瓦尔;V·瓦拉达拉珍;R·霍博金斯;M·卡塞里尼;M·瓦西奇;S·金图卡尔;N·阿加瓦尔 | 申请(专利权)人: | 甲骨文国际公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 刘玉洁 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 比较 异常 检测 模型 分数 分离 最大化 技术 | ||
1.一种方法,包括:
训练机器学习ML模型以检测离群值;
基于ML模型,为验证数据集中的每个项计算未组织的多个异常分数中的相应异常分数;
将所述未组织的多个异常分数组织为有组织的多个异常分数;
基于所述有组织的多个异常分数,测量分离;
其中所述方法由一个或多个计算机执行。
2.如权利要求1所述的方法,其中:
所述验证数据集包括污染因子;
所述测量所述分离还基于污染因子。
3.如权利要求2所述的方法,其中:
污染因子指示所述验证数据集中预期是离群值的所述项的特定百分比;
所述测量所述分离包括:
将所述有组织的多个异常分数中的所述特定百分比的最高异常分数分类为离群分数,以及
计算基于所述离群分数的分子与基于不是所述离群分数的所述有组织的多个异常分数的分母的比率。
4.如权利要求3所述的方法,其中:
所述分子包括所述离群分数的平均值;
所述分母包括不是所述离群分数的所述有组织的多个异常分数的中位数。
5.如权利要求3所述的方法,其中:
所述分子超过一;
所述计算所述比率包括对所述分子应用大于一的指数。
6.如权利要求3所述的方法,其中:
所述分子包括所述离群分数的最小值;
所述分母包括不是所述离群分数的所述有组织的多个异常分数的最大值。
7.如权利要求3所述的方法,其中:
所述分子包括所述离群分数的第一特定百分位数;
所述分母包括不是所述离群分数的所述有组织的多个异常分数的第二特定百分位数。
8.如权利要求7所述的方法,其中所述第一特定百分位数加上所述第二特定百分位数之和为一百。
9.如权利要求7所述的方法,其中所述第一特定百分位数和所述第二特定百分位数基于所述污染因子。
10.如权利要求2所述的方法,还包括:
基于以下各项,对于多个ML模型中的每个特定ML模型,测量多个分离中的相应分离:
用于所述特定ML模型的相应的多个异常分数,以及
相同的所述污染因子;
基于所述多个分离,选择所述多个ML模型中的最佳ML模型。
11.如权利要求1所述的方法,其中所述组织所述未组织的多个异常分数包括从由以下各项组成的组中选择的活动:
对所述未组织的多个异常分数进行排序,以及
对所述未组织的多个异常分数进行一维聚类。
12.如权利要求11所述的方法,其中:
所述有组织的多个异常分数包括异常分数的第一集群和异常分数的第二集群;
所述测量所述分离包括计算:
异常分数的第一集群的第一中心,以及
异常分数的第二集群的第二中心。
13.如权利要求12所述的方法,其中所述测量所述分离还包括计算选自由以下各项组成的组的度量:
异常分数的第一集群的所述第一中心与异常分数的第二集群的所述第二中心之间的距离,
异常分数的第一集群的所述第一中心与异常分数的第二集群的所述第二中心的比率,以及
所述有组织的多个异常分数的平均裕度。
14.如权利要求13所述的方法,其中所述测量所述分离还包括将所述度量除以紧凑度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111259145.X/1.html,转载请声明来源钻瓜专利网。