[发明专利]一种基于空间网格划分的政务大数据挖掘方法有效
申请号: | 201510694430.2 | 申请日: | 2015-10-21 |
公开(公告)号: | CN105279260B | 公开(公告)日: | 2018-08-10 |
发明(设计)人: | 乐鹏;张晨晓 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 薛玲 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于空间网格划分的政务大数据挖掘方法,根据政务数据集中数据的空间粒度确定空间网格的大小,对空间网格进行划分并将各数据集中的数据赋值给网格作为属性值,以单元网格为单位进行网格数据存储和多维数据挖掘。本发明将不同种类数据集组织在统一的时空维度下,有效地实现了多种类型的政务信息挖掘,大幅度增加了信息挖掘的深度。 | ||
搜索关键词: | 一种 基于 空间 网格 划分 政务 数据 挖掘 方法 | ||
【主权项】:
1.一种基于空间网格划分的政务大数据挖掘方法,其特征在于,包括以下步骤:步骤1:以数据的空间分布特征为基础对数据集进行空间网格划分;首先将数据集的数据按照空间粒度大小排序,取数据集所在空间区域的外接矩形框,对矩形框以四叉树方法进行网格划分,若具有最大空间粒度的数据在每个单元网格中均不为零,则继续采用四叉树方法进行递归划分;若存在某个或者多个单元网格中其数据为零,则停止继续划分,记录下其四叉树划分的层数;步骤2:对数据集中下一级空间粒度的数据继续进行递归四叉树划分,直到存在某单元网格中该数据属性值为零,记录下其四叉树层数;步骤3:重复步骤2直到全部数据均划分完毕;步骤4:将数据集中的数据作为空间网格的属性赋值到对应的空间网格单元上,网格上的属性值等于该层网格上对应粒度的数据值与其覆盖的网格数目的比值;步骤5:以网格作为基本单元,进行网格数据存储,将网格单元属性值保存在具有模式自由特点的数据库,得到基于空间网格划分的数据库;本步骤中使用具有模式自由特点的数据库存储具有多层结构的网格数据,数据库表格中每条记录对应于一个网格,每个网格存储其对应空间粒度下的数据值和四叉树层数,此外,每个网格还存储低于其空间粒度的下一层网格数据,即每条记录的属性值或是某一种数据类型,或是一张表格;步骤6:利用基于空间网格划分的数据库进行政务数据挖掘,发现潜在关联信息;首先选取两类需要进行信息挖掘的政务数据,如果两种类型数据的空间粒度相同,则直接从数据库中取两类数据的格网属性值进行相关性分析;如果两种类型数据的空间粒度不同,即数据所在的格网大小不同,则统一两类数据的空间粒度,将大粒度数据的网格进行细分至与小粒度数据的网格大小相同,利用两种粒度数据之间的四叉树层数差计算出大粒度数据映射至小粒度网格上的属性值,此时两不同粒度的数据便都拥有了相同的空间粒度,然后使用映射后的数据值进行相关性分析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510694430.2/,转载请声明来源钻瓜专利网。