[发明专利]基于回归模型的数据清洗方法有效
| 申请号: | 202110144629.3 | 申请日: | 2021-02-02 |
| 公开(公告)号: | CN112817955B | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 李洪烈;夏栋;王倩 | 申请(专利权)人: | 中国人民解放军海军航空大学青岛校区 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458 |
| 代理公司: | 山东重诺律师事务所 37228 | 代理人: | 任启明 |
| 地址: | 266000 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 回归 模型 数据 清洗 方法 | ||
1.基于回归模型的数据清洗方法,其特征在于,所述数据清洗方法包括以下步骤:
S1.首先,根据所采集参数性质确定宽规则的阈值范围,对采集的数据中明显错误、异常的野值进行粗识别清洗;
S2.然后,根据任一时刻采样值的动态阀值,对步骤S1处理后的数据进行基于回归模型的精细识别清洗;所述精细识别具体步骤如下:
先确定野值长度Lerr和参考宽度Lc,所述参考宽度Lc为野值长度Lerr的整倍数,所述野值长度Lerr指参数数据采集中可能连续出现野值的个数,所述参考宽度Lc指对参数野值做出判断时使用的附近参考采集数据的个数;
其次确定回归模型的参考值和偏离范围,所述参考值设置有前后2个,分别为和所述参考值是当前采集数值附近回归平滑计算后的参考采集数值,所述偏离范围指采集参数当前采集时刻的值可能偏离附近值的大小范围;
再次根据上一步骤获得的参考值和偏离范围Rx(k),确定动态阈值范围和
根据上一步骤获得的阈值范围和对野值精细识别,当前参数采集数值为x(k)时,按照如下准则对野值进行识别:如果或者则判定该x(k)为野值;
S3.最后,利用回归平滑模型对步骤S1、S2识别出的野值对应采集时刻的真实值进行估算并替换。
2.根据权利要求1所述的基于回归模型的数据清洗方法,其特征在于,步骤S1中,宽规则的阈值范围为所采集参数的极限最小值至极限最大值。
3.根据权利要求1所述的基于回归模型的数据清洗方法,其特征在于,步骤S2中,所述野值长度计算公式为:
Lerr=fs·terr,
其中,fs表示参数采集频率,terr表示野值持续时间;
所述参考值的计算公式如下:
其中,ρ为当前识别位置与计算参考值的参考数据位置的最小偏移量,为向下取整运算符;
所述偏离范围Rx(k)的计算公式如下:
Rx(k)=1/fs·(Lc+Lerr)/2·Vmax
其中,fs为参数采集频率,Lerr为野值长度,Lc为参考宽度,Vmax为参数最大变化速度;
所述动态阈值范围和的计算公式如下:
当时,
当时,。
4.根据权利要求1所述的基于回归模型的数据清洗方法,其特征在于,步骤S2中,所述参考宽度Lc为野值长度Lerr的5-10倍。
5.根据权利要求1所述的基于回归模型的数据清洗方法,其特征在于,步骤S3中,基于回归平滑模型的野值真实值估算,具体包括以下步骤:
B1.根据前后2个参考区域计算出两个参考值和计算公式如下:
其中,ρ为当前识别位置与计算参考值的参考数据位置的最小偏移量,为向下取整运算符;
B2.确定发生在k采集时刻的野值估计值,计算公式如下:
6.根据权利要求5所述的基于回归模型的数据清洗方法,其特征在于,步骤B1中,求和项x(k-ρ-i)或者x(k+ρ+i)本身是野值时,舍弃该野值并通过外推对应的项数来得到或
7.根据权利要求6所述的基于回归模型的数据清洗方法,其特征在于,外推对应的项数来得到的其计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军海军航空大学青岛校区,未经中国人民解放军海军航空大学青岛校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110144629.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:制芯工序及制芯单元
- 下一篇:一种开瓶器的开瓶驱动结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





