[发明专利]基于局部加权回归的室内空气数据预处理方法在审

专利信息
申请号: 201710020701.5 申请日: 2017-01-12
公开(公告)号: CN106874651A 公开(公告)日: 2017-06-20
发明(设计)人: 孙贺江;徐崇;刘俊杰 申请(专利权)人: 天津大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 天津市北洋有限责任专利代理事务所12201 代理人: 刘国威
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 局部 加权 回归 室内空气 数据 预处理 方法
【权利要求书】:

1.一种基于局部加权回归的室内空气数据预处理方法,其特征是,首先进行短时长数据空缺的填补,要确保整个数据不存在空缺的0值,然后再进行数据异常跳变值的去除,在保证不再存在针状的数据跳变点时,再进行零点偏移的矫正,即将处理好的数据代入到标定曲线中。

2.如权利要求1所述的基于局部加权回归的室内空气数据预处理方法,其特征是,进行数据异常跳变值的去除具体步骤是,使用拟合曲线将有意义的信息拟合出来,并且同时不拟合针状数据跳变和所有的高频噪声,具体选用局部加权回归(Local Weight Regression)进行有用信息的拟合,再用原数据曲线减去拟合曲线得到噪声曲线,解决有用信息对跳变值去除的干扰。

3.如权利要求2所述的基于局部加权回归的室内空气数据预处理方法,其特征是,局部加权回归原理具体步骤是,先用一定数目的横轴上的参考点将整个数据等分开来,并以这些点为中心分别求算线局部性回归,在使用最小二乘法求解回归参数时,离中心点越远的数据点所占的权数越小,最后得到这些点的回归数值,然后用插值将这些回归数值点相连,这里使用线性插值即可;

进一步地,对每一个训练数据点,都要使得:

iw(i)(y(i)Tx(i))2 (1)

最小;

其中i是训练数据的个数角标;x指时间轴的时间值;y是目标值;θ是回归方程的系数向量,使用二次回归,故θ是个三维向量;w是高斯权数,表示成:

<mrow><msup><mi>w</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>=</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mfrac><msup><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>-</mo><mi>x</mi><mo>)</mo></mrow><mn>2</mn></msup><mrow><mn>2</mn><msup><mi>&tau;</mi><mn>2</mn></msup></mrow></mfrac><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>

其中没有上角标的x指的是选定的横轴上的参考点,τ是带宽(bandwidth),τ越大,局部回归的强度越大;

局部加权回归在每个残差平方项之前多一个高斯权,对每个参考点都要求得二次的回归曲线,且曲线参数一定是不同的,对任一个参考点x,都有:

θ=(XTWX)-1XTWy (3)

其中,X是由1,x(i),(x(i))2组成的m维矩阵,称之为设计矩阵(design matrix)m即训练数据数量,X写作:

<mrow><mi>X</mi><mo>=</mo><mfenced open = "(" close = ")"><mtable><mtr><mtd><mn>1</mn></mtd><mtd><msup><mi>x</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msup></mtd><mtd><msup><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></msup><mo>)</mo></mrow><mn>2</mn></msup></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup></mtd><mtd><msup><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>i</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mn>2</mn></msup></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mn>1</mn></mtd><mtd><msup><mi>x</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow></msup></mtd><mtd><msup><mrow><mo>(</mo><msup><mi>x</mi><mrow><mo>(</mo><mi>m</mi><mo>)</mo></mrow></msup><mo>)</mo></mrow><mn>2</mn></msup></mtd></mtr></mtable></mfenced><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>

W是m阶对角矩阵,写作diag(w(1)…w(i)…w(n));y是目标值排成的m阶列向量,记作(y(1)…y(i)…y(n))T;最终得到的θ是一个3×3的矩阵,取θ中第一列中的从上到下三个元素分别作为二次回归曲线中的常数项前系数,一次项前系数和二次项前系数,对于每一个参考点xck(j),代回回归曲线都有其对应的回归值yck(j),其中j是参考点数据的个数角标,这样便形成一个回归点(xck(j),yck(j));

将相邻的回归点进行线性插值就可以比较准确的得到对整个数据曲线进行回归的回归曲线。

4.如权利要求2所述的基于局部加权回归的室内空气数据预处理方法,其特征是,使用局部加权回归识别并剔除跳变值的流程:

a.将原数据曲线进行局部加权回归,生成拟合曲线;

b.将原数据减去拟合曲线得到残差曲线;

c.求残差曲线的平均值和标准差;

d.遍历所有的残差数据,利用拉依达准则,挑选出所有超出限制的数据:

e.获取d中选中的数据的标号,并将对应标号中的原数据替换成跳变数据两端的正常数据之间的插值,达到平滑的目的。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710020701.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top