[发明专利]基于多源城市大数据的PM2.5 有效
申请号: | 202110643654.6 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113297527B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 詹宇;唐蝶;付建博;王春迎;李涛;李春圆;刘莘义;朱瑢昕;马红楠;马景金 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F17/10 | 分类号: | G06F17/10;G06N5/04 |
代理公司: | 北京百年育人知识产权代理有限公司 11968 | 代理人: | 周博 |
地址: | 610065 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 城市 数据 pm base sub 2.5 | ||
1.基于多源城市大数据的PM2.5全面域时空计算推断方法,其特征在于,包括以下步骤:
S1、信息集成:构建城市尺度“天地一体”空气质量监测及多源基础信息数据库,包括卫星遥感、固定站和传感器的空气质量监测数据,以及气象、排放清单、土地利用、海拔、植被覆盖指数、行星边界层高度、人口密度、道路分布的基础信息;
S2、迭代补缺:建立迭代补缺-机器学习模型,重构PM2.5地面浓度,将卫星数据、传感器数据、固定站数据依次作为因变量,另两个变量及S1中的其它环境协变量作为自变量,训练相应的机器学习模型,以此模型的预测值插补该因变量的缺失值;迭代计算,直至这三个变量补缺后的数据集相似性收敛,得到填补完整的数据集;
S3、时空重构:根据S2中获得填补完整的数据集作为训练数据集,建立机器学习模型,重构全面域、全时空的PM2.5地面浓度;
S4、模型验证:采用基于样本、基于站点、基于月份、基于区域的多维度验证方法来评价模型性能;
所述S2有效解决了多源数据融合中数据异质性和时空匹配的问题,在填补缺失数据时维持多变量联合分布的一致性,具体计算步骤如下:
迭代填补计算:
输入:Yj:时间、空间上待填补的变量,j=1,…,m
STlist:待填补变量在时间、空间上的并集
D:协变量,在STlist中没有数据缺失
maxiter:最大迭代数
iter:迭代数,初始迭代数iter=1
missYj:待填补变量Yj在STlist中数据缺失的部分
obsYj:待填补变量Yj在STlist中具有观测数据的部分
A:训练数据集,A=(Yj,D)
convThreshold:收敛阈值
输出:迭代中填补结果最优的数据集
方法:
返回迭代中的最优填补结果,即diter最小时,填补获得的训练集Aiter;
所述S2、S3中围绕训练数据抽样偏差问题,引入数据时空密度反向加权的策略对训练样本加权,提升模型对研究区域的整体重构性能;根据训练数据的时空分布密度,对各训练数据样本进行反向加权,给数据密度稀疏的样本更高的权重;地面监测PM2.5数据主要存在空间上抽样偏差问题,而卫星遥感数据在空间和时间上都存在抽样偏差问题;
所述反向加权步骤如下:
将整个研究区域分隔为n×n个小区域,按照小区域分割及月份分层,分别统计变量j在小区域r月份m中的数据量Nj,r,m;在以变量j作为因变量的机器学习模型中,将每条训练样本的权重赋为相应小区域及月份数据量的倒数,即wi,j=1/Nj,r,m;样本加权通过修正模型训练时的损失函数影响模型结构,实现模型对不同特征子空间模拟的平衡性,降低其对训练数据稀少区域或时期的估算偏差;以变量j为因变量的模型损失函数定义如下:
其中,和yi,j分别是变量j在样本i的预测值和观测值。
2.根据权利要求1所述的基于多源城市大数据的PM2.5全面域时空计算推断方法,其特征在于:所述S1的卫星遥感数据来自于丰富的卫星遥感监测,包括中分辨率成像光谱仪、葵花8号以及我国的环境卫星,提供大范围高时空分辨率的气溶胶光学厚度的信息;传感器PM2.5数据来自于部署的大量且密集的低成本传感器的在线监测浓度数据;固定站PM2.5数据来自于研究区域标准空气质量自动监测站在线监测的常规大气污染物的逐时浓度;气象站提供在线监测的温度、湿度、风场基本气象信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110643654.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆反向扶正方法
- 下一篇:一种低泡沫兼容磁珠法提取的核酸保存液
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置