[发明专利]一种基于两阶段聚类的用水模式构建方法在审
申请号: | 202210472180.8 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114997274A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 闫健卓;刘坤昊;于涌川 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/951 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 王兆波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 模式 构建 方法 | ||
本发明公开一种基于两阶段聚类的用水模式构建方法,该方法首先通过改进的密度聚类算法进行单因素空间模式分析,更新相关因素指标。然后通过主成分分析法,确定用水量的主要影响因素。最后通过子空间聚类算法,对用水量主要影响因素进行聚类,确定最终的用水模式。
技术领域
本发明属于模式识别领域。是一种基于改进的密度聚类和子空间聚类的两阶段聚类算法构建用水模式的方法。
技术背景
水资源需求建模与预测是现代水资源管理的关键问题。对耗水量的全面了解有助于正确规划供水,为用水指标体系的核定提供基础,从而建设节水型社会,提高区域供水安全保障能力,推动社会经济的持续发展。用水模式聚类分析方法大致可以划分为:基于划分的聚类、基于层次的聚类、基于模型的聚类等。对于用户用水模式分析,传统的单一聚类分析算法存在聚类结果不稳定和泛化性能差等问题,且空间分布对用水模式影响显著。
发明内容
本发明要解决的技术问题是,提供一种基于改进的密度聚类和子空间聚类的两阶段聚类算法构建用水模式的方法。该方法首先通过改进的密度聚类算法进行单因素空间模式分析,更新相关因素指标。然后通过主成分分析法,确定用水量的主要影响因素。最后通过子空间聚类算法,对用水量主要影响因素进行聚类,确定最终的用水模式。
为解决上述问题,本发明采用如下的技术方案:
一种基于两阶段聚类的用水模式构建方法,该包括以下步骤:
步骤1、数据预处理。
对从网上爬取到的用水、社会经济等数据进行预处理,删除异常值、填补缺失值,然后进行归一化处理。
步骤2、单因素空间模式分析。
针对单一因素,如用水量、人口等,利用改进的密度聚类算法SA-DBSCAN将单一因素与空间位置相结合,进行空间模式分析。
步骤3、更新相关因素指标。
将步骤2得到的聚类结果转化为数值属性,并与相关的单因素分配不同的权重比例进行结合,将结合后的数据作为新的因素指标。
步骤4、确定用水量主要影响因素。
对步骤3更新后的相关因素,以及其他因素指标,采用主成分分析法,选取贡献率大于等于85%,确定出用水量的主要影响因素。
步骤5、构建用水模式。
利用子空间聚类算法CLIQUE,对步骤4所确定的用水量主要影响因素进行聚类,确定最终的用水模式。
步骤6、性能评价。
使用聚类评价指标评价聚类性能。
附图说明
图1为改进的SA-DBSCAN密度聚类算法流程图。
图2为基于两阶段聚类的用水模式构建方法的流程图。
具体实施方式
下面结合附图对本发明做进一步说明:
如图2所示,本发明方法的流程主要包括以下步骤:
步骤1、数据预处理
对从网上爬取到的用水、社会经济等数据进行预处理,删除异常值、填补缺失值,然后进行归一化处理。
缺失值采用平均值进行填充。使用Z-score进行归一化,Z-score归一化是基于均值和标准差将原始数据规范到[-1,1]之间。对于属性的最大值或最小值未知的数据,采用Z-score归一化比较适宜。其公式如下:
其中,x'和x分别表示归一化后的值与归一化前的值,μ和σ分别表示平均值与标准差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210472180.8/2.html,转载请声明来源钻瓜专利网。