[发明专利]融入簇存在强度的数据流聚类方法有效
申请号: | 201410314647.1 | 申请日: | 2014-07-03 |
公开(公告)号: | CN104090950B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 琚春华;鲍福光;肖亮;魏建良 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州裕阳专利事务所(普通合伙)33221 | 代理人: | 应圣义 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及web技术领域,公开了一种融入簇存在强度的数据流聚类方法,包括以下的具体步骤预处理步骤,对特定用户的信息进行预处理并保存至用户属性数据库中;用户聚类步骤,对用户属性技能型聚类,关联规则步骤,形成基于用户属性数据的关联规则,漂移检测步骤,实时地对关联规则进行检测,以保证关联规则的有效性。本发明的优点在于,解决了簇的存在强度对于聚类的影响,确实可以将荣誉距离、簇存在概率以及簇存在强度三重因素的不确定数据流聚类方法。 | ||
搜索关键词: | 融入 存在 强度 数据流 方法 | ||
【主权项】:
一种融入簇存在强度的数据流聚类方法,其特征在于,包括以下的具体步骤:预处理步骤100:对特定用户的用户特征信息进行处理以形成用户属性数据库,所述用户特征信息是指包括用户背景信息以及用户行为信息的可以用人机交互界面或者人机交互装置进行数据采集并可以转化为可以用特定长度和格式的数据串进行表征的用户属性数据,所述用户属性数据库用于存放所述用户属性数据;用户聚类步骤200:将至少两个用户的用户属性数据集合形成用户群属性库,其中,用于形成用户群属性库的用户属性数据包括用户不确定性数据流,所述用户不确定性数据流由至少两个元组组成,所述元组包括用户属性数据以及表征所述用户属性数据的出现的不确定性的存在概率,所述存在概率通过赋予所述用户属性数据以一个随机变量得到,所述随机变量是指在一定的给定区域上符合概率分布的随机量,所述给定区域是指在一定的时间范围内用户属性数据的变化区域;关联规则步骤300:依据用户群属性数据库所包含的用户属性数据形成关联规则,并将所述关联规则存放于用户行为规则库,所述关联规则是指用户属性数据的可以用初等函数进行表示的变化趋势;漂移检测步骤400:对不同时间段内所产生的关联规则进行检测,生成最终的用户行为规则,并将所生成的用户行为规则作为数据流聚类方法。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410314647.1/,转载请声明来源钻瓜专利网。