[发明专利]一种观测数据中异常值的处理方法有效
| 申请号: | 202110400328.2 | 申请日: | 2021-04-14 |
| 公开(公告)号: | CN112988732B | 公开(公告)日: | 2023-10-20 |
| 发明(设计)人: | 张必明 | 申请(专利权)人: | 湖南工程学院 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F17/18;G06F11/34 |
| 代理公司: | 湘潭市汇智专利事务所(普通合伙) 43108 | 代理人: | 乌景瑞 |
| 地址: | 411101 *** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 观测 数据 异常 处理 方法 | ||
1.一种观测数据中异常值的处理方法,包括如下步骤:
1)对观测样本根据大小排序后进行二分方差贡献迭代试验,依次对观测数据样本中方差贡献最大的端点数据逐个删除,并计算删除后观测样本的偏度系数及归一化状态系数,试验完成后得到样本删除试验数据;
2)针对步骤1)中得到的样本删除试验数据中的归一化状态系数进行趋势变化分析,结合删除试验数据的偏度系数,确定异常值剔除的最优控制参数;
3)采用步骤2)得到的最优控制参数,对步骤1)排序后的原观测数据样本进行异常值剔除操作,完成观测数据的处理。
2.根据权利要求1所述的观测数据中异常值的处理方法,步骤1)具体操作如下:
1.1)对原始观测数据样本D0由小到大进行排序,得到D'0;
1.2)计算D'0的偏度系数θ′0和归一化状态系数ω'0,作为初始状态数据保存;
1.3)对D′0进行二分方差贡献迭代试验,首先对将样本D'0分成前后两个样本,两个样本分别为D'front0和D'back0,前后两个样本重叠至少一个数据点,分别计算D'front0和D'back0的样本方差σ'front0和σ'back0;若σ'front0σ'back0,则删除D'0的前端端点数据,否则删除后端端点数据,同时保存数据点删除位置标志;得到删除方差贡献最大的端点后的样本删除试验数据D′1;
1.4)计算D′1的偏度系数θ′1和归一化状态系数ω′1并保存;
1.5)判断D′1的样本中数据的个数小于3时,结束;否则将D′1作为D′0,返回步骤1.3);
所述的偏度系数,采用如下公式进行计算:
其中:SD(X)为样本X的标准差,为样本均值,E为数学期望;
所述的归一化状态系数是将归一化之后的样本方差和样本偏度系数两个参数加权构造为一个状态系数,归一化状态系数按如下公式计算:
其中,为采用最小边界值归一化的方差值,为采用0中心值归一化的偏度系数,k1、k2为归一化方差与归一化偏度系数的权重因子;
上述的归一化状态系数计算中的归一化参数,采用如下算式计算:
其中,Xσ和Xθ分别为试验数据中的方差和偏度系数样本,max[X]和min[X]分别为样本X的最大和最小数据值。
3.根据权利要求1或2所述的观测数据中异常值的处理方法,步骤2)具体步骤如下:
2.1)对步骤1)得到的删除试验数据,以删除的样本点数量为x轴,归一化状态系数值为y轴,在笛卡尔坐标系中得到一条与样本点删除相关的归一化状态系数曲线,对曲线上的每个点判断其归一化状态系数的趋势变化类型,计算每个点趋势变化系数TVC,并将每个点的趋势变化系数TVC保存到每个点的属性中;
2.2)由步骤2.1)得到的每个点的趋势变化系数TVC数据,得到一条反映归一化状态系数曲线趋势变化的TVC曲线;在TVC曲线中寻找和选择极小值位置pm,pm就是从观测样本中剔除异常值的最优控制参数;
2.3)由2.2)得到的最优控制参数pm,统计在此位置之前,观测样本前后两端分别剔除的样本点数量rf、rr。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工程学院,未经湖南工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110400328.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能眼肌训练装置
- 下一篇:信息处理方法、装置、电子设备及存储介质
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





