[发明专利]一种基于数据聚类的新能源结算数据异常检测与预警方法有效

专利信息
申请号: 202310341305.8 申请日: 2023-04-03
公开(公告)号: CN116089846B 公开(公告)日: 2023-07-25
发明(设计)人: 张艳玲;罗卫 申请(专利权)人: 北京智蚁杨帆科技有限公司
主分类号: G06F18/23 分类号: G06F18/23
代理公司: 暂无信息 代理人: 暂无信息
地址: 100000 北京市大兴区经济技术开*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 新能源 结算 异常 检测 预警 方法
【权利要求书】:

1.一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于,该方法包括以下步骤:

采集每个企业当前时期的新能源结算数据以及历史时期的新能源结算数据;对任意一个企业,获取企业的新能源处理能力向量,包括:

将企业任意一个历史时期的新能源结算数据的时间点作为横坐标,新能源处理量作为纵坐标构建一个数据序列曲线;对每个数据序列曲线进行分割得到趋势序列,根据趋势序列获取区间分段点,将每个历史时期的新能源结算数据划分为多个区间;

获取企业所有历史时期的新能源结算数据中每个数据属性的影响程度值;根据所有历史时期以及当前时期每个区间每个数据属性获取每个区间的每个数据属性的波动特征;根据每个数据属性的影响程度值以及每个区间的每个属性的波动特征获取每个区间的综合波动特征;

根据每个区间的综合波动特征获取每个区间的初始K距离邻域;根据每个区间的初始距离邻域对每个区间内的数据进行异常因子检测,获取每个区间内每个数据的局部异常因子值以及异常数据点;将每个区间内排除异常数据点后的所有数据的局部异常因子值的均值作为每个区间的初始离散程度值;根据每个区间的初始离散程度值对每个区间的K距离邻域进行调整,获取每个区间的新能源处理能力;

根据企业所有区间的新能源处理能力获取企业的新能源处理能力向量;

根据所有企业的新能源处理向量对所有企业进行层次聚类,得到多个层次类别;根据每个层次类别中包含的企业获取每个层次类别的每个数据属性的波动范围;

根据每个数据属性的波动范围对企业当前时期的新能源结算数据进行异常检测;

所述影响程度值的表达式为:

式中为第个数据属性的影响程度值;表示一个企业历史时期的新能源结算数据的数据属性的个数;表示所有历史时期的新能源结算数据中数据的个数;表示第个数据属性中第个数据值;表示第个数据属性的数据值均值;表示第个数据属性中第个数据值;表示第个数据属性的数据值均值;

所述根据每个区间的初始离散程度值对每个区间的K距离邻域进行调整,获取每个区间的新能源处理能力,包括的具体步骤如下:

根据企业每个区间的初始离散程度值获取每个区间的调整程度值;所述调整程度值的表达式为:

式中为第个区间内的调整程度值,表示第个区间的初始离散程度值;表示所有区间中初始离散程度值的最大值;

根据调整程度值对每个区间的初始K距离邻域进行调整,具体为:

其中为第个区间调整后的K距离邻域;为第个区间内的调整程度值;为第个区间的初始距离邻域;

根据所有区间调整后的K距离邻域进行局部异常因子检测,获取每个区间调整后的离散程度值作为每个区间的新能源处理能力。

2.根据权利要求1所述的一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于,所述根据趋势序列获取区间分段点,将每个历史时期的新能源结算数据划分为多个区间,包括的具体步骤如下:

通过对趋势序列中所有前后相邻数据点的斜率差进行线性归一化,若前后相邻数据点的斜率差归一化后的数值大于斜率差阈值,将前一个数据点在数据序列曲线中对应的数据点作为数据序列曲线的区间分段点,将数据序列曲线中第一个数据点和最后一个数据点都作为区间分段点;

将所有数据序列曲线的所有区间分段点进行排列,计算相邻区间分段点在趋势序列中对应两个数据点的斜率差的绝对值作为相邻区间分段点的差距,将差距小于区间分段点阈值的相邻区间分段点中第二个区间分段点作为最终的区间分段点;根据所有最终的区间分段点将每个历史时期的新能源结算数据划分为多个区间。

3.根据权利要求1所述的一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于,所述根据所有历史时期以及当前时期每个区间每个数据属性获取每个区间的每个数据属性的波动特征,包括的具体步骤如下:

将时间作为横坐标,将数据属性的值作为纵坐标,根据企业历史时期每个区间的每个数据属性对应的所有历史数据构造属性数据分布曲线,将企业当前时期数据对应区间的对应数据属性与历史数据对应区间的对应数据属性结合构成属性数据分布曲线,计算和的DTW距离,作为企业对应区间对应数据属性的DTW距离;

根据企业每个区间所有数据属性的DWT距离,对每个区间每个数据属性的DWT距离进行线性归一化,将归一化后的值作为对应区间对应数据属性的波动特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智蚁杨帆科技有限公司,未经北京智蚁杨帆科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310341305.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top