[发明专利]一种实有人口数据多尺度空间化方法有效
申请号: | 202110333710.6 | 申请日: | 2021-03-29 |
公开(公告)号: | CN112925784B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 钟家晖;黄玲;何正国;毛海亚;黄铎;程国荣 | 申请(专利权)人: | 广州市规划和自然资源自动化中心(广州市基础地理信息中心) |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06F16/29;G06Q50/26 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510180 广东省广州市越秀区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实有 人口 数据 尺度 空间 方法 | ||
1.一种实有人口数据多尺度空间化方法,其特征在于,包括以下步骤:
1)获取原始数据,包括“四实”数据和地址门牌数据;其中“四实”数据包括实有人口数据、实有房屋栋数据、实有房屋套数据和人房关系数据;
2)对原始数据进行质量评估,通过质量评估中存在的问题构建“四实”数据的清洗规则,对原始数据进行清洗;
3)构建人房关系的空间关系链;
4)使用构建的空间关系链对人口数据以个体为数据尺度进行空间化,得到个体人口空间化数据;
5)通过聚合算法对个体人口空间化数据进行多尺度空间化,生成多尺度人口空间化数据。
2.根据权利要求1所述的一种实有人口数据多尺度空间化方法,其特征在于:在步骤2)中,依据“四实”数据采集与处理过程中存在着标准不统一,数据录入缺乏审核导致数据质量存在问题;通过对原始数据的访问与分析,相关的质量问题包括数据重复、数据异常和数据含义不明;主要从数据完整性、一致性、准确性这三个方面构建“四实”数据质量和清洗标准,提高数据的可用性,为后续的人口数据空间化与聚合提供数据支撑,其具体情况如下:
a、数据质量评估主要从数据完整性、数据一致性、数据准确性这三个方面来对数据质量进行评估,具体如下:
a1、数据完整性
数据完整性是指数据信息是否存在缺失的状况,数据缺失有两种,一是整个数据记录缺失,二是数据中某个字段信息记录缺失;质量目标为最大限度保留数据的完整性,确保后续分析具有完整的数据信息及样本量;
a2、数据一致性
一致性检查是根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据;质量目标为基于数据逻辑与规则进行数据更新,确保数据的准确度、可信度;
a3、数据准确性
数据准确性是指数据记录的信息是否存在异常或错误;常见的数据准确性错误为乱码,其次异常的大或者小的数据也是不符合条件的数据;质量目标为识别错误值与异常,保证数据准确度;
b、依据“四实”数据质量评估所存在的问题,主要从数据去重,数据准确性检查,数据一致性检查,无效值、缺失值处理和隐私数据的统计处理方面构建“四实”数据的清洗原则,具体如下:
b1、数据去重
为了获取当前最新数据,对当前人口数据、房屋栋数据、房屋套数据和人房关系数据的原始数据进行去重处理,具体操作为:对人口数据按照人口ID分组,选出其中时间最新的一条,对房屋栋、房屋套数据分别按照房屋栋ID、房屋套ID来进行分组,选出时间最新的一条数据,在人房关系表中通过人口ID和房屋套ID来对数据进行分组,选出时间最新的一条数据,完成数据的去重工作;
b2、数据准确性检查
根据数据关联关系、常识性规则和属性约束方式检测数据值,进行纠正;
b3、数据一致性检查
数据一致性检查根据每个变量的合法取值范围和相互关系,检查数据是否合乎要求,处理超出正常范围、逻辑上不合理或者相互矛盾的数据;
b4、数据无效性、缺失值处理
由于调查、编码和录入误差造成无效值和缺失值存在,通过成对删除处理,保证样本量及变量的完整性;
b5、隐私数据的统计处理
由于原始的人口数据中的字段存在有个人敏感信息,为了防止个人隐私信息泄露,对原始人口数据中的敏感信息进行隐藏,将原始字段保存为字段的统计信息,包括各性别人数、各人口类型人数、各年龄阶段人数、劳动人口和育龄妇女人口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市规划和自然资源自动化中心(广州市基础地理信息中心),未经广州市规划和自然资源自动化中心(广州市基础地理信息中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110333710.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置