[发明专利]用于比较异常检测模型的异常分数的分离最大化技术在审

专利信息
申请号: 202111259145.X 申请日: 2021-10-28
公开(公告)号: CN114429170A 公开(公告)日: 2022-05-03
发明(设计)人: H·F·莫汉达姆;A·雅科夫列夫;S·阿格拉瓦尔;V·瓦拉达拉珍;R·霍博金斯;M·卡塞里尼;M·瓦西奇;S·金图卡尔;N·阿加瓦尔 申请(专利权)人: 甲骨文国际公司
主分类号: G06K9/62 分类号: G06K9/62;G06N20/00
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 刘玉洁
地址: 美国加*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 比较 异常 检测 模型 分数 分离 最大化 技术
【说明书】:

本公开涉及用于比较异常检测模型的异常分数的分离最大化技术。在基于(一个或多个)计算机的实施例中,训练ML模型以检测离群值。ML模型计算异常分数,其包括用于验证数据集中的每个项的相应异常分数。异常分数通过排序和/或聚类被自动组织。基于有组织的异常分数,测量指示ML模型的拟合度的分离。在实施例中,计算机执行将异常分数二聚类成包括异常分数的第一正常集群和异常分数的第一异常集群的第一组织。计算机执行将相同的异常分数三聚类成包括异常分数的第二正常集群、异常分数的第二异常集群和异常分数的中间集群的第二组织。测量第一组织与第二组织之间的分布差异。基于分布差异来处理ML模型。

技术领域

发明涉及概率异常检测。本文是用于验证机器学习(ML)模型的无监督训练的拟合优度的统计测量。

背景技术

数据集中不正常实例的识别通常被称为异常检测。异常检测是在诸如欺诈检测和入侵检测之类的安全性方面具有各种用例的一种重要的工具。各种各样的机器学习(ML)算法以各种复杂的方式检测异常。一些示例是最近邻、聚类和子空间。这些算法各不相同,但它们的共同点是它们在内部都使用产生被称为异常分数的分数的决策函数,这些分数由算法针对数据集中的每个项分别生成。异常分数越高,项异常的可能性就越高。

机器学习有各种训练,包括有监督训练和无监督训练。有监督训练使用已经已知为异常或正常的项。即,有监督训练项各自都已经被标记为异常或正常。但是,作为有监督训练的先决条件,进行这种标记通常非常昂贵。无监督训练不使用标记并且避免了这种费用。

拟合优度,在本文中称为拟合度(fitness),是指示统计模型、回归模型或尤其是在本文中的ML模型的准确程度以及ML模型用于生产环境中的准备就绪程度的度量。例如,经训练的ML模型应当比未经训练的ML模型具有更高的拟合度。可以通过各种已知方式来测量ML模型的拟合度。

如果标记的训练项可用,那么可以使用已知的评分度量(诸如接收者操作曲线下面积(ROC_AUC)、召回率和精度)来比较不同异常检测模型的相对拟合度。但是,例如在无监督设置中,当标记的数据不存在时,出现问题。在没有标记的数据的情况下,在各种数据集和机器学习算法中运行良好的评分度量或多或少是未知的。手动标记数据是一种解决方案,因为它消除了对无监督学习的需要。但是,这非常耗时,并且通常要求领域专家来分析各个样本。

附图说明

在附图中:

图1是描绘示例计算机的框图,该示例计算机基于概率或其它统计量在无监督训练期间或之后验证机器学习(ML)模型对于诸如离群值检测之类的二元分类的拟合度;

图2是描绘示例计算机处理的流程图,该示例计算机处理基于概率或其它统计量在无监督训练期间或之后验证ML模型对于诸如离群值检测之类的二元分类的拟合度;

图3是描绘示例计算机活动的流程图,该示例计算机活动用于基于概率或其它统计量在无监督训练期间或之后测量ML模型对于诸如离群值检测之类的二元分类的拟合度;

图4是描绘示例计算机的框图,该示例计算机基于统计聚类在无监督训练期间或之后分析ML模型对于诸如离群值检测之类的二元分类的验证结果;

图5是描绘示例计算机活动的流程图,该示例计算机活动用于基于聚类测量ML模型对于诸如离群值检测之类的二元分类的拟合度;

图6是描绘示例计算机活动的流程图,该示例计算机活动用于基于三聚类在无监督训练期间或之后计算ML模型对于诸如离群值检测之类的二元分类的拟合度度量;

图7是图示可以在其上实现本发明的实施例的计算机系统的框图;

图8是图示可以用于控制计算系统的操作的基本软件系统的框图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111259145.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top