[发明专利]一种监测指标异常值的自动分析方法在审
| 申请号: | 202111555152.4 | 申请日: | 2021-12-17 |
| 公开(公告)号: | CN114416499A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 吴叙锐;孙旭;胡旭嘉;汤佳彬;刘勇欣;邱啸 | 申请(专利权)人: | 华能汕尾风力发电有限公司 |
| 主分类号: | G06F11/34 | 分类号: | G06F11/34;G06K9/62;G06N20/00 |
| 代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 沈鑫 |
| 地址: | 516600 广东省汕尾市陆*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 监测 指标 异常 自动 分析 方法 | ||
1.一种监测指标异常值的自动分析方法,其特征在于,包括:
采集监测主体的历史指标数据信息以及实时指标数据信息,并对所采集的数据信息进行预处理;
构建异常值识别分析模型,利用预处理后的历史指标数据信息对所述异常值识别分析模型进行训练及测试,得到训练好的异常值识别分析模型;
将所述实时指标数据信息输入所述训练好的异常值识别分析模型,根据输出值判断所述实时指标数据信息是否存在异常值,实现指标异常值的自动分析。
2.如权利要求1所述的监测指标异常值的自动分析方法,其特征在于:所述监测主体的数据信息包括根据设置的测点进行周期性读取得到的数据信息。
3.如权利要求2所述的监测指标异常值的自动分析方法,其特征在于:对所述采集的数据信息进行预处理包括,
去除唯一属性;
处理缺失值:删除含有缺失值的特征或缺失值补全;
特征编码:特征二元化及独热编码;
数据标准化、正则化;
特征选择:从给定的特征集合中选出相关特征子集。
4.如权利要求1~3任一所述的监测指标异常值的自动分析方法,其特征在于:所述数据标准化、正则化的计算公式包括,
数据标准化:
数据正则化:
定义样本数据集
对所述样本数据集计算Lp范数:
其正则化后的结果为每个属性值除以其Lp范数:
5.如权利要求1所述的监测指标异常值的自动分析方法,其特征在于:所述异常值识别分析模型的构建包括,
定义集合中p和o两点之间的距离为d(p,o),k距离为k-distancek;
对于点p的k距离,定义如下:
dk(p)=d(p,o)
且满足在集合中至少有不包括p在内的k个点o′∈C{x≠p},满足d(p,o′)≤d(p,o);
在集合中最多不包括p在内的k-1个点o′∈C{x≠p},满足d(p,o′)<d(p,o)。
6.如权利要求1或5所述的监测指标异常值的自动分析方法,其特征在于:还包括,
定义可达距离点o到点p的第k可达距离定义为r:
reach-distancek(p,o)=max{k-distance(o),d(p,o)}
rech-distk(p,o1)=d(p,o1)
rech-distk(p,o2)=d5(o2)
即表示点o到点p的第k可达距离,至少是o的第k距离,或者为o、po、p间的真实距离。
7.如权利要求6所述的监测指标异常值的自动分析方法,其特征在于:还包括,
异常点判断公式为:
该公式表示点p的邻域点k(p)的局部可达密度与点p的局部可达密度之比的平均数。
8.如权利要求4所述的监测指标异常值的自动分析方法,其特征在于:将所述预处理后的历史指标数据信息按照7:3的比例分为训练集和测试集。
9.如权利要求7所述的监测指标异常值的自动分析方法,其特征在于:所述异常值的判断标准包括,
若LOFk(p)越接近1,表示p的密度等于其邻域点密度,p和邻域同属一簇;
若LOFk(p)越小于1,表示p的密度高于其邻域点密度,p为密集点;
若LOFk(p)越大于1,表示p的密度小于其邻域点密度,p是异常点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华能汕尾风力发电有限公司,未经华能汕尾风力发电有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111555152.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种维持星座构型的方法、装置及介质
- 下一篇:尾撑管及无人机





