[发明专利]一种基于两阶段聚类的用水模式构建方法在审
申请号: | 202210472180.8 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114997274A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 闫健卓;刘坤昊;于涌川 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/951 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 王兆波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 模式 构建 方法 | ||
1.一种基于两阶段聚类的用水模式构建方法,其特征在于,包括以下步骤:
步骤1:数据预处理;对从网上爬取到的用水、社会经济数据进行预处理,删除异常值、填补缺失值,然后进行归一化处理;
步骤2:单因素空间模式分析;针对用水量、人口单一因素,利用改进的密度聚类算法SA-DBSCAN将单一因素与空间位置相结合,进行空间模式分析;
步骤3:更新相关因素指标;将步骤2得到的聚类结果转化为数值属性,并与相关的单因素分配不同的权重比例进行结合,将结合后的数据作为新的因素指标;
步骤4:确定用水量主要影响因素;对步骤3更新后的相关因素,以及其他因素指标,采用主成分分析法,选取贡献率大于等于85%,确定出用水量的主要影响因素;
步骤5:构建用水模式;利用子空间聚类算法CLIQUE,对步骤4所确定的用水量主要影响因素进行聚类,确定最终的用水模式;
步骤6:性能评价;使用聚类评价指标评价聚类性能。
2.根据权利要求1所述的一种基于两阶段聚类的用水模式构建方法,其特征在于:步骤1所述的数据预处理方法中的缺失值采用平均值进行填充,使用Z-score进行归一化。
3.根据权利要求1所述的一种基于两阶段聚类的用水模式构建方法,其特征在于:步骤2所述的单因素空间模式分析,采用SA-DBSCAN密度聚类算法;该算法需要设定的聚类参数为3个:属性距离Da,空间距离Ds和对象阈值MinPts,前2个参数用于确定邻近域,后一个用来确定邻近域内的对象数量;空间距离采用Haversine公式计算:
其中,R为地球半径,xixj、yiyj为两POI兴趣点Pi(xi,yi),Pj(xj,yj)的经纬度值,Ds即2个POI兴趣点的空间距离,Da表示任意2个POI兴趣点的属性距离,ai、αj为i、j两点的属性值;
算法基本步骤如下:
步骤一、建立一个三维数据库,库中对象的经度为x,纬度为y,属性因素为a,一条对象数据为一个对象点Pi={idPi,xi,yi,ai},i为对象序号,所有对象点的集合为DP;
步骤二、从DP中依次选取一个对象点Pi,判断其是否已属于现有簇中,是则重新选取下一个对象点,否则进行步骤一;
步骤三、判断对象点Pi是否为核心对象,是则进行步骤四,否则回到步骤二中重新选取下一个对象点;
步骤四、搜寻核心对象点Pi的所有相邻点Qi,若Qi不属于任何已有的簇,则将Qi放入新建的簇A中,若Qi属于已有的簇,则不进行操作;
步骤五、判断簇A中新加入的对象是否为核心对象,若非核心对象,则将其标为边缘对象不进行进一步操作,是则对该核心对象重复步骤四的操作;
步骤六、重复步骤二到步骤五的工作,直到DP中所有对象都属于某个簇,或为孤立点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210472180.8/1.html,转载请声明来源钻瓜专利网。