[发明专利]一种基于数据聚类的新能源结算数据异常检测与预警方法有效
申请号: | 202310341305.8 | 申请日: | 2023-04-03 |
公开(公告)号: | CN116089846B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 张艳玲;罗卫 | 申请(专利权)人: | 北京智蚁杨帆科技有限公司 |
主分类号: | G06F18/23 | 分类号: | G06F18/23 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100000 北京市大兴区经济技术开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 新能源 结算 异常 检测 预警 方法 | ||
1.一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于,该方法包括以下步骤:
采集每个企业当前时期的新能源结算数据以及历史时期的新能源结算数据;对任意一个企业,获取企业的新能源处理能力向量,包括:
将企业任意一个历史时期的新能源结算数据的时间点作为横坐标,新能源处理量作为纵坐标构建一个数据序列曲线;对每个数据序列曲线进行分割得到趋势序列,根据趋势序列获取区间分段点,将每个历史时期的新能源结算数据划分为多个区间;
获取企业所有历史时期的新能源结算数据中每个数据属性的影响程度值;根据所有历史时期以及当前时期每个区间每个数据属性获取每个区间的每个数据属性的波动特征;根据每个数据属性的影响程度值以及每个区间的每个属性的波动特征获取每个区间的综合波动特征;
根据每个区间的综合波动特征获取每个区间的初始K距离邻域;根据每个区间的初始距离邻域对每个区间内的数据进行异常因子检测,获取每个区间内每个数据的局部异常因子值以及异常数据点;将每个区间内排除异常数据点后的所有数据的局部异常因子值的均值作为每个区间的初始离散程度值;根据每个区间的初始离散程度值对每个区间的K距离邻域进行调整,获取每个区间的新能源处理能力;
根据企业所有区间的新能源处理能力获取企业的新能源处理能力向量;
根据所有企业的新能源处理向量对所有企业进行层次聚类,得到多个层次类别;根据每个层次类别中包含的企业获取每个层次类别的每个数据属性的波动范围;
根据每个数据属性的波动范围对企业当前时期的新能源结算数据进行异常检测;
所述影响程度值的表达式为:
式中为第个数据属性的影响程度值;表示一个企业历史时期的新能源结算数据的数据属性的个数;表示所有历史时期的新能源结算数据中数据的个数;表示第个数据属性中第个数据值;表示第个数据属性的数据值均值;表示第个数据属性中第个数据值;表示第个数据属性的数据值均值;
所述根据每个区间的初始离散程度值对每个区间的K距离邻域进行调整,获取每个区间的新能源处理能力,包括的具体步骤如下:
根据企业每个区间的初始离散程度值获取每个区间的调整程度值;所述调整程度值的表达式为:
式中为第个区间内的调整程度值,表示第个区间的初始离散程度值;表示所有区间中初始离散程度值的最大值;
根据调整程度值对每个区间的初始K距离邻域进行调整,具体为:
其中为第个区间调整后的K距离邻域;为第个区间内的调整程度值;为第个区间的初始距离邻域;
根据所有区间调整后的K距离邻域进行局部异常因子检测,获取每个区间调整后的离散程度值作为每个区间的新能源处理能力。
2.根据权利要求1所述的一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于,所述根据趋势序列获取区间分段点,将每个历史时期的新能源结算数据划分为多个区间,包括的具体步骤如下:
通过对趋势序列中所有前后相邻数据点的斜率差进行线性归一化,若前后相邻数据点的斜率差归一化后的数值大于斜率差阈值,将前一个数据点在数据序列曲线中对应的数据点作为数据序列曲线的区间分段点,将数据序列曲线中第一个数据点和最后一个数据点都作为区间分段点;
将所有数据序列曲线的所有区间分段点进行排列,计算相邻区间分段点在趋势序列中对应两个数据点的斜率差的绝对值作为相邻区间分段点的差距,将差距小于区间分段点阈值的相邻区间分段点中第二个区间分段点作为最终的区间分段点;根据所有最终的区间分段点将每个历史时期的新能源结算数据划分为多个区间。
3.根据权利要求1所述的一种基于数据聚类的新能源结算数据异常检测与预警方法,其特征在于,所述根据所有历史时期以及当前时期每个区间每个数据属性获取每个区间的每个数据属性的波动特征,包括的具体步骤如下:
将时间作为横坐标,将数据属性的值作为纵坐标,根据企业历史时期每个区间的每个数据属性对应的所有历史数据构造属性数据分布曲线,将企业当前时期数据对应区间的对应数据属性与历史数据对应区间的对应数据属性结合构成属性数据分布曲线,计算和的DTW距离,作为企业对应区间对应数据属性的DTW距离;
根据企业每个区间所有数据属性的DWT距离,对每个区间每个数据属性的DWT距离进行线性归一化,将归一化后的值作为对应区间对应数据属性的波动特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智蚁杨帆科技有限公司,未经北京智蚁杨帆科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310341305.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置