[发明专利]一种用于用户行为分析的基于证据推理的集成聚类方法有效
申请号: | 201810814178.8 | 申请日: | 2018-07-23 |
公开(公告)号: | CN109002858B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 褚燕;王刚;张峰;陈刚 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06K9/62;G06N5/04 |
代理公司: | 合肥金安专利事务所(普通合伙企业) 34114 | 代理人: | 彭超 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 用户 行为 分析 基于 证据 推理 集成 方法 | ||
本发明提供一种用于用户行为分析的基于证据推理的集成聚类方法,能够充分考虑用户数据的时间特性以及基聚类器的可信程度,通过采用证据推理的方法综合解决单个聚类器鲁棒性和稳定性不强和现有集成聚类方法适应性较差的问题,从而提高用户行为数据的聚类效果。本发明的有益效果在于:能够克服用户行为数据因高维所带来的传统聚类算法失效的问题;能够综合解决单个聚类器鲁棒性和稳定性不强和现有集成聚类方法适应性较差的问题,从而提高用户行为数据的聚类效果;本发明可用于用户行为数据的聚类,特别是带有高维特征的用户行为数据聚类问题,还可以用于流数据的聚类等,应用范围广泛。
技术领域
本发明涉及聚类方法技术领域,尤其涉及一种用于用户行为分析的基于证据推理的集成聚类方法。
背景技术
目前常用的聚类方法有五类,包括基于划分的聚类方法、基于层次的聚类方法、基于层次的聚类方法、基于密度的聚类方法和基于网格的聚类方法。基于划分的基于划分的聚类方法,代表方法如-均值(k-means)聚类方法,它的思想是将距离簇中心最近的对象可以划分为一个簇;基于层次的聚类方法思想是通过为给定数据对象集创建层次分解来进行聚类的方法;基于密度的聚类方法,代表方法如DBSCAN算法,该算法假设聚类结构能通过样本分布的紧密程度确定;基于模型的聚类方法如EM算法,可用于含有隐变量(latentvariable)的概率参数模型的最大似然估计或极大后验概率估计;基于网格的聚类方法的思想是将对象空间量化为有限数目的单元,形成一个网状结构,所有聚类都在这个网状结构上进行。
通常,这些单个的聚类方法能够通过对用户行为数据的挖掘和行为特性的分析,有效识别用户行为模式、评估需求响应潜力、从而为营销方案的制定提供决策依据。然而,随着用户行为数据的不断更新,数据量的增长迅速,数据采集用户具有极强的分散性等一系列挑战的出现,现有方法由于采用单个聚类模型其稳定性和准确性很容易受到数据变化的影响,其泛化能力和适应性不强,无法对不同类型用户的用电行为进行深入、快速、准确的分析。根本原因在于数据集中自然分组概念的内在不明确性。另一个困难之处是聚类簇的多样性,聚类簇可以有不同的形状,不同的密度,不同的大小,而且它们经常相互重叠。由于单个聚类算法往往存在各种问题,近年来出现了许多集成聚类算法的研究。集成聚类的思想就是要生成一个聚类集体,也就是有多个聚类结果可用,然后结合这些聚类的结果以求得到一个更优的聚类。结合聚类集体中成员聚类的问题也称为一致性函数问题,或称为集成问题。现有的集成聚类方法包括基于Co-Occurrence的方法和基于MedianPartition的方法。基于Co-Occurrence的集成聚类方法有重打标签和投票方法、共协矩阵方法和图方法等;基于MedianPartition的集成聚类方法有遗传算法、非负矩阵分解和核方法等。近年来,关于集成聚类的研究已经得到了许多研究者的重视,而且证据推理作为一种有效的信息融合方法已经应用于许多领域,然而目前尚未有将证据推理规则融入到集成聚类过程中的现有技术。
发明内容
为了解决现有技术中存在的上述技术缺陷,本发明提供一种用于用户行为分析的基于证据推理的集成聚类方法,能够充分考虑用户数据的时间特性以及基聚类器的可信程度,通过采用证据推理的方法综合解决单个聚类器鲁棒性和稳定性不强和现有集成聚类方法适应性较差的问题,从而提高用户行为数据的聚类效果。
本发明是通过以下技术方案实现的:
一种用于用户行为分析的基于证据推理的集成聚类方法,适用于带有时间特性的流数据集;该集成聚类方法包括如下步骤:
步骤1,对于不同时段的用户行为数据集{D1,D2,...,Dk,...,DK},利用不同参数的模糊C均值算法分别生成K个隶属度矩阵{U1,U2,...,Uk,...,UK};其中,Dk表示第k个时段的数据,Uk表示第k个隶属度矩阵;所述用户行为数据集是将带有时间特性的原始流数据按时间窗口切分获得的数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810814178.8/2.html,转载请声明来源钻瓜专利网。