[发明专利]一种实有人口数据多尺度空间化方法有效

专利信息
申请号: 202110333710.6 申请日: 2021-03-29
公开(公告)号: CN112925784B 公开(公告)日: 2023-10-10
发明(设计)人: 钟家晖;黄玲;何正国;毛海亚;黄铎;程国荣 申请(专利权)人: 广州市规划和自然资源自动化中心(广州市基础地理信息中心)
主分类号: G06F16/215 分类号: G06F16/215;G06F16/2458;G06F16/29;G06Q50/26
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 冯炳辉
地址: 510180 广东省广州市越秀区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 实有 人口 数据 尺度 空间 方法
【权利要求书】:

1.一种实有人口数据多尺度空间化方法,其特征在于,包括以下步骤:

1)获取原始数据,包括“四实”数据和地址门牌数据;其中“四实”数据包括实有人口数据、实有房屋栋数据、实有房屋套数据和人房关系数据;

2)对原始数据进行质量评估,通过质量评估中存在的问题构建“四实”数据的清洗规则,对原始数据进行清洗;

3)构建人房关系的空间关系链;

4)使用构建的空间关系链对人口数据以个体为数据尺度进行空间化,得到个体人口空间化数据;

5)通过聚合算法对个体人口空间化数据进行多尺度空间化,生成多尺度人口空间化数据。

2.根据权利要求1所述的一种实有人口数据多尺度空间化方法,其特征在于:在步骤2)中,依据“四实”数据采集与处理过程中存在着标准不统一,数据录入缺乏审核导致数据质量存在问题;通过对原始数据的访问与分析,相关的质量问题包括数据重复、数据异常和数据含义不明;主要从数据完整性、一致性、准确性这三个方面构建“四实”数据质量和清洗标准,提高数据的可用性,为后续的人口数据空间化与聚合提供数据支撑,其具体情况如下:

a、数据质量评估主要从数据完整性、数据一致性、数据准确性这三个方面来对数据质量进行评估,具体如下:

a1、数据完整性

数据完整性是指数据信息是否存在缺失的状况,数据缺失有两种,一是整个数据记录缺失,二是数据中某个字段信息记录缺失;质量目标为最大限度保留数据的完整性,确保后续分析具有完整的数据信息及样本量;

a2、数据一致性

一致性检查是根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据;质量目标为基于数据逻辑与规则进行数据更新,确保数据的准确度、可信度;

a3、数据准确性

数据准确性是指数据记录的信息是否存在异常或错误;常见的数据准确性错误为乱码,其次异常的大或者小的数据也是不符合条件的数据;质量目标为识别错误值与异常,保证数据准确度;

b、依据“四实”数据质量评估所存在的问题,主要从数据去重,数据准确性检查,数据一致性检查,无效值、缺失值处理和隐私数据的统计处理方面构建“四实”数据的清洗原则,具体如下:

b1、数据去重

为了获取当前最新数据,对当前人口数据、房屋栋数据、房屋套数据和人房关系数据的原始数据进行去重处理,具体操作为:对人口数据按照人口ID分组,选出其中时间最新的一条,对房屋栋、房屋套数据分别按照房屋栋ID、房屋套ID来进行分组,选出时间最新的一条数据,在人房关系表中通过人口ID和房屋套ID来对数据进行分组,选出时间最新的一条数据,完成数据的去重工作;

b2、数据准确性检查

根据数据关联关系、常识性规则和属性约束方式检测数据值,进行纠正;

b3、数据一致性检查

数据一致性检查根据每个变量的合法取值范围和相互关系,检查数据是否合乎要求,处理超出正常范围、逻辑上不合理或者相互矛盾的数据;

b4、数据无效性、缺失值处理

由于调查、编码和录入误差造成无效值和缺失值存在,通过成对删除处理,保证样本量及变量的完整性;

b5、隐私数据的统计处理

由于原始的人口数据中的字段存在有个人敏感信息,为了防止个人隐私信息泄露,对原始人口数据中的敏感信息进行隐藏,将原始字段保存为字段的统计信息,包括各性别人数、各人口类型人数、各年龄阶段人数、劳动人口和育龄妇女人口。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市规划和自然资源自动化中心(广州市基础地理信息中心),未经广州市规划和自然资源自动化中心(广州市基础地理信息中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110333710.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top