[发明专利]一种基于时序用水数据的工商户聚类方法有效
申请号: | 202110569868.3 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113205368B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 朱波;穆利;吴铭;王亚琦;陶鹏 | 申请(专利权)人: | 合肥供水集团有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/06;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230002*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时序 数据 工商户 方法 | ||
本发明公开了一种基于时序用水数据的工商户聚类方法,其步骤包括:1.构建工商户的日用水量数据并进行数据预处理工作;2.基于LSTM模型对时序用水数据进行学习与表征;3.基于用水趋势对工商户进行聚类;4.在依据用水趋势聚类的基础上再基于用水范围对工商户进行聚类;5.对聚类结果进行可视化展示。本发明能通过LSTM模型学习到工商户时序用水数据中隐藏的丰富的用水模式和趋势信息,以此作为工商户的用水特征表示,再结合kmeans算法能准确且快速地完成工商户基于用水趋势和用水量范围两方面因素的聚类。
技术领域
本发明涉及用户聚类技术领域,特别是涉及一种基于时序数据的工商户聚类方法。
背景技术
现有的对用户聚类的方法的研究中,kmeans算法在静态数据的聚类中发挥了出色的效果,但其采用欧氏距离计算工商户之间的相似度,无法考虑时间点的先后顺序,只能捕捉用水量大小的相似性,无法刻画用水特征随着时间变化的趋势。
而工商户用水数据是时间序列数据,是按固定时间间隔,例如日、周、月等记录的工商户日、周、月用水量,隐藏了许多工商户潜在的时序用水特征,例如用水周期、用水模式等潜在特征。时序数据内样本某时刻的状态变化会与之前后时刻状态相关,所以如何结合前后时刻状态去分析时序数据内的变化规律是一个难点。
发明内容
本发明为克服现有技术存在的不足之处,提供一种基于时序数据的工商户聚类方法,以期能通过LSTM模型实现对工商户时序用水数据中隐含的用水模式的学习以及表征,并结合kmeans算法对工商户进行用水趋势和用水范围两方面特征的聚类,并提高聚类的准确性,有利于挖掘出时序用水数据中隐含的丰富的变化规律和趋势,从而准确完整地刻画出工商户的用水模式。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于时序用水数据的工商户聚类方法的特点是按如下步骤进行:
步骤1、构建工商户的日用水量数据;
步骤1.1、获取工商户的远程水表数据,提取所述远程水表数据中的工商户id、水表更新时间、用水累计流量、工商户远程水表地址、工商户名称;
步骤1.2、对所述工商户远程水表地址进行经纬度转换,获得工商户的经纬度信息;
步骤1.3、根据工商户id将所述所述远程水表数据进行分割,得到以工商户id命名的m份水表数据文件,并将水表数据文件中的所有数据按照水表更新时间的先后顺序进行排列;其中,m表示工商户的总数量;
步骤1.4、对每个工商户在每天的第一次水表更新时间的用水累计流量值和最后一次水表更新时间的用水累计流量值进行求差处理,从而构建m个工商户的t日的日用水量向量其中,表示第i个工商户第t日的日用水量数值,t表示用水天数,并将m个工商户t日的用水向量所形成的样本特征集,记为X={xi|i=1,2,...,m};
步骤1.5、对所述样本特征集A进行异常值的检测与处理,得到异常处理后的样本特征集X′;
步骤1.6、对处理后的样本特征集A′进行缺失值的处理,得到缺失处理后的样本特征集X″;
步骤2、基于LSTM模型的时序用水数据的特征表示;
步骤2.1、对缺失处理后的样本特征集X″进行归一化处理,得到归一化后的样本特征集,记为其中,表示归一化后的第i个工商户t日的日用水量数值,且表示归一化后的第i个工商户第t日的日用水量数值;
步骤2.2、预训练LSTM模型;
将归一化后的样本特征集划分为训练集及验证集,并确定LSTM模型训练的epoch值、batch-size值以及预测步长值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥供水集团有限公司,未经合肥供水集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110569868.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置