[发明专利]土壤大数据分析中的数据清洗方法及装置在审

专利信息
申请号: 202210067946.4 申请日: 2022-01-20
公开(公告)号: CN114443635A 公开(公告)日: 2022-05-06
发明(设计)人: 石媛媛;邓明军;唐健;赵隽宇;覃祚玉;宋贤冲;王会利;潘波;覃其云 申请(专利权)人: 广西壮族自治区林业科学研究院
主分类号: G06F16/215 分类号: G06F16/215;G01N33/24
代理公司: 济南知来知识产权代理事务所(普通合伙) 37276 代理人: 崔静
地址: 530002 广*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 土壤 数据 分析 中的 清洗 方法 装置
【权利要求书】:

1.土壤大数据分析中的数据清洗方法,其特征在于,所述方法执行以下步骤:

步骤1:采集土壤数据,在采集土壤数据时,获取环境数据;所述采集到的土壤数据至少包括:土壤有效水含量、沙含量、淤泥含量、粘土含量、土壤容重和有机碳含量;所述环境数据包括:环境温度、环境湿度和环境光照强度;

步骤2:对采集到的土壤数据按照类别进行数据分散,得到若干个分散数据集合;所述数据分散的过程包括:首先按照数据类别将采集到的土壤数据按照数据种类进行分类,得到多个分类数据,然后将每个分类数据按照设定的比例进行放大,得到分散数据;

步骤3:基于每个分散数据的数据结构和数据量大小,构建分散数据球体;

步骤4:对每个分散数据进行数据分析,以获得所有分散数据的数据特征,以每个分散数据的数据特征为中心,以分散数据的数据半径为边长,分别构建所有分散数据的数据清洗立方体;

步骤5:将分散数据球体置于数据清洗立方体内部,让分散数据球体在数据清洗立方体内部进行翻转,在翻转过程中,分散数据球体表面的分散数据将与数据清洗立方体接触,每个被接触的分散数据都将被记录;

步骤6:将被记录的分散数据进行保留,将没有被记录的分散数据进行数据降噪,然后将降噪后的分散数据与被记录的分散数据合并,得到合并后的分散数据,再使用预设的修正模型对合并后的分散数据进行修正,得到最终清洗后的土壤数据。

2.如权利要求1所述的方法,其特征在于,所述步骤2中设定的比例的范围为:3~8;取值范围视分类数据的种类而定;当分类数据为土壤有效水含量时,设定的比例取值为3;当分类数据为沙含量,设定的比例的取值为4;当分类数据为淤泥含量,设定的比例的取值为5;当分类数据为粘土含量,设定的比例的取值为6;当分类数据为土壤容重,设定的比例的取值为7;有机碳含量有机碳含量,设定的比例的取值为8。

3.如权利要求2所述的方法,其特征在于,所述步骤3构建分散数据球体的方法具体包括:计算分散数据的数据量大小,将计算得到的分散数据的数据量大小作为分散数据球体的半径,使用预设的数据球体构建模型,构建一个分散数据球体,以使得分散数据均匀分布于分散数据球体的外表面上。

4.如权利要求3所述的方法,其特征在于,所述数据球体构建模型使用如下公式进行表示:其中,C为分散数据,min(C)为分散数据的最小值;max(C)为分散数据的最大值;Ox为计算得到的球心的x轴坐标;Oy为计算得到的球心的y轴坐标;球心的z轴坐标统一取值为0;通过球体构建模型计算出的球心,将计算得到的分散数据的数据量大小作为分散数据球体的半径,构建分散数据球体。

5.如权利要求4所述的方法,其特征在于,所述步骤4中对每个分散数据进行数据分析,以获得所有分散数据的数据特征的方法包括:对分散数据进行归一化及取均值处理生成第一特征分散数据,其中进行归一化处理的归一化层为n组,进行取均值处理的取均值层为n-1层;对所述第一特征分散数据进行第一组扩张归一化处理生成第二特征分散数据,以及将所述第一特征分散数据进行取均值处理生成第三特征分散数据;将所述第三特征分散数据与所述第二特征分散数据进行拼接生成第四特征分散数据;将第四特征分散数据作为分散数据的数据特征。

6.如权利要求5所述的方法,其特征在于,所述第三特征分散数据与所述第二特征分散数据的长度相同。

7.如权利要求6所述的方法,其特征在于,对所述第一特征分散数据进行第一组扩张归一化处理生成第二特征分散数据的步骤中,所述第一组扩张归一化处理的扩张归一化处理次数为三次。

8.如权利要求7所述的方法,其特征在于,所述步骤6中使用预设的修正模型对合并后的分散数据进行修正,得到最终清洗后的土壤数据的方法包括:基于得到的环境温度、环境湿度和环境光照强度,使用预设的修正值模型,计算得到修正值,使用修正值与合并后的分散数据中的每个数据相乘,得到最终清洗后的土壤数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西壮族自治区林业科学研究院,未经广西壮族自治区林业科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210067946.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top