[发明专利]基于用水规律的用户画像方法与系统有效
申请号: | 202010590604.1 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111723257B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 李成栋;申存骁;邓晓平;李银萍;李文峰;张桂青 | 申请(专利权)人: | 山东建筑大学 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214;G06N7/02;G06N20/00;G06N3/044 |
代理公司: | 济南克雷姆专利代理事务所(普通合伙) 37279 | 代理人: | 张祥明 |
地址: | 250101 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 规律 用户 画像 方法 系统 | ||
1.一种基于用水规律的用户画像方法,其特征在于,包括以下步骤:
(1)收集用户的用水数据及用户类别标签;收集用户m的有关信息构成用户m的类别标签向量;用户画像类别标签分类包括以下标签一种或多种:年龄、是否退休、是否有小孩、房屋面积和人口数;类别标签ym=(y1,y2,y3,y4,y5),每个标签取值-1,0,1;每个用户的用水数据和对应的类别标签向量,构建出训练样本数据库P;
(2)将采集到的用水数据中提取出若干个时间段的平均用水量作为特征向量,结合用户的类别标签构建出训练样本集,基于自动机器学习技术构建出深度分层模糊系统,利用训练样本集训练此系统,从而构建出分类模型;
具体步骤如下:
步骤1:提取特征向量:
将每天的时间划分成12个时间段,分别为t1-t12;
将训练样本数据库中的数据按照24时制划分成对应1~7天的七段数据,然后将7天的数据分别按照12个时间段进行划分,求出用户在每天各时间段用水量式中,d为第d天;将每个时间段的结尾时间节点的用水量值减去起始时间节点的用水量值即可得到每个时间段的用水量;
分别求出12个时间段在7天内的用水量的平均值:利用用户m的12个时间段的用水量的平均值构建出特征向量
步骤2:搭建深度分层模糊系统
对深度分层模糊系统的总体参数进行设置,手动确定层数L(设为6)、移动步长s(设为2)和卷积窗的长度w(设为3);
将训练样本数据库P中的特征向量作为系统的输入向量,类别标签ym作为每一个模糊子系统的正确输出向量;进而可以得到训练集P1在第一层第i个模糊子系统的输入-输出数据对;根据该数据对,结合已有模糊集合计算公式,输入向量可进一步划分为R个模糊集合A1,A2,...,AR,进而构建出此模糊子系统的完备模糊规则库;
(3)将采集到的用户用水数据输入到已构建出的分类模型中,从而完成用户画像;
具体步骤为:将采集到的某用户的用水数据直接输入至所述的分类模型中,分类模型对数据进行特征向量提取的操作,然后将特征向量输入到深度分层模糊系统中进行分析,得到最终的分类结果,确定出每个类别标签,完成用户画像,最后利用显示器设备输出结果。
2.根据权利要求1所述的基于用水规律的用户画像方法,其特征在于,所述步骤2中基于强化学习的搜索方式构建该模糊子系统,步骤如下:
步骤1:确定搜索空间S;
步骤2:设计子系统。
3.根据权利要求1所述的基于用水规律的用户画像方法,其特征在于,所述步骤(2)中将训练样本数据库P中的数据分为两部分:训练集P1和测试集P2,将测试集P2中的数据输入到分类模型中,通过将分类结果与类别标签进行比较,测试出分类模型的精确度是否能够满足需求;如果精确度不能够满足要求,则需要利用更多的样本数据重新对分类模型进行训练,直至分类模型的精确度达到要求。
4.一种基于用水规律的用户画像系统,其特征在于,用于在执行时实现权利要求1-3任一项所述的基于用水规律的用户画像方法的步骤,包括:
数据采集模块,该模块用于执行步骤(1)的方法;
构建分类模型模块,该模块用于执行步骤(2)的方法;
用户画像模块,该模块用于执行步骤(3)的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东建筑大学,未经山东建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010590604.1/1.html,转载请声明来源钻瓜专利网。