[发明专利]一种基于两阶段聚类的用水模式构建方法在审

专利信息
申请号: 202210472180.8 申请日: 2022-04-29
公开(公告)号: CN114997274A 公开(公告)日: 2022-09-02
发明(设计)人: 闫健卓;刘坤昊;于涌川 申请(专利权)人: 北京工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06F16/951
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 王兆波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 阶段 模式 构建 方法
【权利要求书】:

1.一种基于两阶段聚类的用水模式构建方法,其特征在于,包括以下步骤:

步骤1:数据预处理;对从网上爬取到的用水、社会经济数据进行预处理,删除异常值、填补缺失值,然后进行归一化处理;

步骤2:单因素空间模式分析;针对用水量、人口单一因素,利用改进的密度聚类算法SA-DBSCAN将单一因素与空间位置相结合,进行空间模式分析;

步骤3:更新相关因素指标;将步骤2得到的聚类结果转化为数值属性,并与相关的单因素分配不同的权重比例进行结合,将结合后的数据作为新的因素指标;

步骤4:确定用水量主要影响因素;对步骤3更新后的相关因素,以及其他因素指标,采用主成分分析法,选取贡献率大于等于85%,确定出用水量的主要影响因素;

步骤5:构建用水模式;利用子空间聚类算法CLIQUE,对步骤4所确定的用水量主要影响因素进行聚类,确定最终的用水模式;

步骤6:性能评价;使用聚类评价指标评价聚类性能。

2.根据权利要求1所述的一种基于两阶段聚类的用水模式构建方法,其特征在于:步骤1所述的数据预处理方法中的缺失值采用平均值进行填充,使用Z-score进行归一化。

3.根据权利要求1所述的一种基于两阶段聚类的用水模式构建方法,其特征在于:步骤2所述的单因素空间模式分析,采用SA-DBSCAN密度聚类算法;该算法需要设定的聚类参数为3个:属性距离Da,空间距离Ds和对象阈值MinPts,前2个参数用于确定邻近域,后一个用来确定邻近域内的对象数量;空间距离采用Haversine公式计算:

其中,R为地球半径,xixj、yiyj为两POI兴趣点Pi(xi,yi),Pj(xj,yj)的经纬度值,Ds即2个POI兴趣点的空间距离,Da表示任意2个POI兴趣点的属性距离,ai、αj为i、j两点的属性值;

算法基本步骤如下:

步骤一、建立一个三维数据库,库中对象的经度为x,纬度为y,属性因素为a,一条对象数据为一个对象点Pi={idPi,xi,yi,ai},i为对象序号,所有对象点的集合为DP

步骤二、从DP中依次选取一个对象点Pi,判断其是否已属于现有簇中,是则重新选取下一个对象点,否则进行步骤一;

步骤三、判断对象点Pi是否为核心对象,是则进行步骤四,否则回到步骤二中重新选取下一个对象点;

步骤四、搜寻核心对象点Pi的所有相邻点Qi,若Qi不属于任何已有的簇,则将Qi放入新建的簇A中,若Qi属于已有的簇,则不进行操作;

步骤五、判断簇A中新加入的对象是否为核心对象,若非核心对象,则将其标为边缘对象不进行进一步操作,是则对该核心对象重复步骤四的操作;

步骤六、重复步骤二到步骤五的工作,直到DP中所有对象都属于某个簇,或为孤立点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210472180.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top