[发明专利]一种环境空气质量监测智能校准方法在审
申请号: | 201910747028.4 | 申请日: | 2019-08-14 |
公开(公告)号: | CN112394137A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 祁柏林;王宁;张欣;魏景峰;刘闽;杜毅明;周晓磊;白雪;张镝;陈月;王兴刚;范秋枫;孟繁星;金继鑫 | 申请(专利权)人: | 中国科学院沈阳计算技术研究所有限公司 |
主分类号: | G01N33/00 | 分类号: | G01N33/00;G06N3/04;G06N3/08 |
代理公司: | 沈阳科苑专利商标代理有限公司 21002 | 代理人: | 王倩 |
地址: | 110168 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 空气质量 监测 智能 校准 方法 | ||
1.一种环境空气质量监测智能校准方法,其特征在于,包括以下步骤:
数据处理:将微型监测仪器传入数据库的数据和国家标准数据进行整合得到标记数据和未标记数据;将国家标准数据作为标签,将标记数据集和未标记数据集都复制成两份,用于协同训练;
模型训练:将两个标记数据集分别在LSTM模型上进行训练,得到两个参数不同的模型;
协同训练:将该训练好的模型应用到未标记数据集,选取未标记数据集中置信度高的数据添加到另一个训练器的标记数据集中,如此循环迭代训练直至模型各参数稳定。
2.根据权利要求1所述的一种环境空气质量监测智能校准方法,其特征在于,所述数据处理,采用的是空气质量六项污染物之一的SO2的小时数据,将国家标准数据作为训练的目标,微型监测仪器采集的数据作为输入的数据。
3.根据权利要求1所述的一种环境空气质量监测智能校准方法,其特征在于,所述数据处理包括以下步骤:
将微型监测仪器传入数据库的数据和已获得的国家标准数据按照相同时间进行数据整合,微型监测仪器传入数据库的数据中,在同一时刻有与之对应的国家标准数据,则该时刻的微型监测仪器传入数据库的数据为标记数据;其余的为未标记数据;
将标记数据集合复制成两份,分别作为标记数据集1和标记数据集2;将未标记数据集合也复制成两份,分别作为未标记数据集1和未标记数据集2。
4.根据权利要求1所述的一种环境空气质量监测智能校准方法,其特征在于,所述标记数据为微型监测仪器传入数据库的数据在同一时刻有与之对应的国家标准数据,即符合国家标准规定的数据;所述非标记数据为微型监测仪器的数据中没有与之对应的国家标准数据。
5.根据权利要求1所述的一种环境空气质量监测智能校准方法,其特征在于,所述模型训练采用长短期记忆网络模型,神经网络为三层。
6.根据权利要求1所述的一种环境空气质量监测智能校准方法,其特征在于,所述协同训练,包括以下步骤:
1)将通过标记数据集1训练好的模型1应用到未标记数据集1,通过模型预测,根据未标记数据集1的数据(xμ1,yμ1)与标记数据集1的数据进行置信度检测:
在标记数据集1中找到未标记数据集1中(xμ1,yμ1)的K-邻近值,将找出的这些K-邻近值形成一个集合Z1,同时按照标记数据集1中的邻近值x对应的y与未标记数据集1中xμ1对应的yμ1的距离差排序;
先将未标记数据集1的(xμ1,yμ1)加入标记数据集1中,排序后的集合Z1作为测试集,利用这些对模型2进行训练,看输出的损失函数结果相比较之前的未加入未标记数据集1的(xμ1,yμ1)的损失函数是否变小;变小则说明此条未标记数据(xμ1,yμ1)对模型2起到了优化作用,作为加入未标记数据集1的备选;在未标记数据集1的备选中选出能使损失函数下降最大的一条数据作为置信度最高的数据,最终将这条数据加入到模型2的标记数据集2中;其中xμ1是指未标记数据集1中的一条数据xμ1,yμ1是通过训练好的模型1对未标记数据集1中的一条数据xμ1的预测值;
将通过标记数据集2训练好的模型2应用到未标记数据集2,通过模型预测,根据未标记数据集2的(xμ2,yμ2)与标记数据集2中的数据进行置信度检测:
在标记数据集2中找到未标记数据集1中(xμ2,yμ2)的K-邻近值,将找出的这些K-邻近值形成一个集合Z2,同时按照标记数据集2中的邻近值x对应的y与未标记数据集2中xμ2对应的yμ2的距离差排序;
先将未标记数据集2的(xμ2,yμ2)加入标记数据集2中,排序后的集合Z2作为测试集,利用这些对模型1进行训练,看输出的损失函数结果相比较之前的未加入未标记数据集2的(xμ2,yμ2)的损失函数是否变小;变小则说明此条未标记数据(xμ2,yμ2)对模型1起到了优化作用,作为加入标记数据集合2的备选;在未标记数据集2的备选中选出能使损失函数下降最大的一条数据作为置信度最高的数据,最终将这条数据加入到模型1的标记数据集1中;其中xμ2是指未标记数据集2中的一条数据xμ2,yμ2是通过训练好的模型2对未标记数据集2中的一条数据xμ2的预测值;
2)上述过程连续交叉重复训练,直到最后两个训练出来的模型各参数最接近。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳计算技术研究所有限公司,未经中国科学院沈阳计算技术研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910747028.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种掩膜板缺陷的修复方法
- 下一篇:无焰燃烧机及其控制方法