[发明专利]一种大气污染源数据分析方法、装置、设备及存储介质在审
| 申请号: | 202210089361.2 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114626546A | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 董兰天 | 申请(专利权)人: | 中国农业银行股份有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/00;G06Q50/26 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 倪焱 |
| 地址: | 100005 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 大气 污染源 数据 分析 方法 装置 设备 存储 介质 | ||
1.一种大气污染源数据分析方法,其特征在于,所述方法包括:
基于大气污染源数据确定训练数据集和测试数据集;
基于所述训练数据集对随机森林模型进行训练得到已训练模型;
通过分布式计算框架,基于所述测试数据集和所述已训练模型确定目标模型;
将待分析的大气污染源数据进行特征选取后得到的特征输入所述目标模型,得到分析结果,所述分析结果包括大气污染元素排放量。
2.根据权利要求1所述的方法,其特征在于,所述基于大气污染源数据确定训练数据集和测试数据集,包括:
对大气污染源数据进行特征选取得到多组特征子集;
将所述特征子集按照预设比例分为训练数据集和测试数据集。
3.根据权利要求2所述的方法,其特征在于,所述对大气污染源数据进行特征选取得到多组特征子集,包括:
将大气污染源数据转换为弹性分布式数据;
通过预设机器学习库对所述弹性分布式数据分别进行相关性分析以及特征筛选,得到多组特征子集。
4.根据权利要求3所述的方法,其特征在于,所述通过预设机器学习库对所述弹性分布式数据分别进行相关性分析以及特征筛选,得到多组特征子集,包括:
通过预设机器学习库中的地图函数对所述弹性分布式数据进行解析得到多组特征,并返回多个向量类型的数据,一个向量类型的数据包括一组特征和一个标签,所述标签表征所述特征对应的大气污染元素排放量的目标值;
计算所有特征与所有标签的相关性;
根据所述相关性确定特征筛选的筛选范围;
通过卡方选择器从所述筛选范围内筛选出多个向量类型的目标数据;
将所述向量类型的目标数据构成多组特征子集。
5.根据权利要求1所述的方法,其特征在于,所述随机森林模型为已进行参数设置的机器学习模型,所述基于所述训练数据集对随机森林模型进行训练得到已训练模型,包括:
根据所述训练数据集中的特征以及标签,通过预设的分类器训练方法对随机森林模型中的分类器进行训练,得到已训练模型。
6.根据权利要求5所述的方法,其特征在于,所述随机森模型的决策过程包括:
基于决策树算法,根据所述训练测试数据集中的特征构建预设数量个决策树;
通过所述预设数量个决策树得到多个决策树分类结果;
通过所述预设数量个决策树对所述多个决策树分类结果进行投票;
将票数最多的决策树结果作为预测结果。
7.根据权利要求1所述的方法,其特征在于,所述基于所述测试数据集和所述已训练模型确定目标模型,包括:
将所述测试数据集中的特征输入所述已训练模型得到多个预测值;
将所述预测值与实际值一一组合成多个键值对,所述键值对为弹性分布式数据形式;
基于所述多个键值对确定所述已训练模型的预测准确率;
若所述预测准确率高于或等于预设准确率,则将所述已训练模型作为目标模型,若所述预测准确率低于所述预设准确率,则继续对所述已训练模型进行训练,直到所述已训练模型的预测准确率高于或等于所述预设准确率。
8.一种大气污染源数据分析装置,其特征在于,所述装置包括:
第一确定模块,用于基于大气污染源数据确定训练数据集和测试数据集;
训练模型,用于基于所述训练数据集对随机森林模型进行训练得到已训练模型;
第二确定模块,用于通过分布式计算框架,基于所述测试数据集和所述已训练模型确定目标模型;
分析模型,用于将待分析的大气污染源数据进行特征选取后得到的特征输入所述目标模型,得到分析结果,所述分析结果包括大气污染元素排放量。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器用于执行权利要求1-7任一项所述的大气污染源数据分析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的大气污染源数据分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210089361.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





