[发明专利]一种基于两阶段聚类的用水模式构建方法在审

申请号：	202210472180.8	申请日：	2022-04-29
公开（公告）号：	CN114997274A	公开（公告）日：	2022-09-02
发明（设计）人：	闫健卓;刘坤昊;于涌川	申请（专利权）人：	北京工业大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/951
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	王兆波
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于阶段模式构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于两阶段聚类的用水模式构建方法，其特征在于，包括以下步骤：

步骤1：数据预处理；对从网上爬取到的用水、社会经济数据进行预处理，删除异常值、填补缺失值，然后进行归一化处理；

步骤2：单因素空间模式分析；针对用水量、人口单一因素，利用改进的密度聚类算法SA-DBSCAN将单一因素与空间位置相结合，进行空间模式分析；

步骤3：更新相关因素指标；将步骤2得到的聚类结果转化为数值属性，并与相关的单因素分配不同的权重比例进行结合，将结合后的数据作为新的因素指标；

步骤4：确定用水量主要影响因素；对步骤3更新后的相关因素，以及其他因素指标，采用主成分分析法，选取贡献率大于等于85％，确定出用水量的主要影响因素；

步骤5：构建用水模式；利用子空间聚类算法CLIQUE，对步骤4所确定的用水量主要影响因素进行聚类，确定最终的用水模式；

步骤6：性能评价；使用聚类评价指标评价聚类性能。

2.根据权利要求1所述的一种基于两阶段聚类的用水模式构建方法，其特征在于：步骤1所述的数据预处理方法中的缺失值采用平均值进行填充，使用Z-score进行归一化。

3.根据权利要求1所述的一种基于两阶段聚类的用水模式构建方法，其特征在于：步骤2所述的单因素空间模式分析，采用SA-DBSCAN密度聚类算法；该算法需要设定的聚类参数为3个：属性距离D_a，空间距离D_s和对象阈值MinPts，前2个参数用于确定邻近域，后一个用来确定邻近域内的对象数量；空间距离采用Haversine公式计算：

其中，R为地球半径，x_ix_j、y_iy_j为两POI兴趣点P_i(x_i,y_i),P_j(x_j,y_j)的经纬度值，D_s即2个POI兴趣点的空间距离，D_a表示任意2个POI兴趣点的属性距离，a_i、α_j为i、j两点的属性值；