[发明专利]用户数据处理方法及系统在审
申请号: | 201711428531.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108171538A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 彭佳 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;汪源 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用户数据处理方法及系统。该用户数据处理方法包括:采集与产品相关的用户数据,所述用户数据包括用户访问数据和用户行为数据;根据用户访问数据、用户行为数据和产品属性获取用户的行为关键词集合,用户的行为关键词集合包括用户的行为关键词,所述用户的行为关键词与产品属性相关联;根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体。本发明能够实现实时预测出用户对该类别产品的需求,并预测出产品的受众度。 1 | ||
搜索关键词: | 用户数据处理 用户访问数据 用户行为数据 关键词集合 产品属性 用户数据 多类用户 聚类分析 实时预测 受众 采集 关联 预测 群体 | ||
采集与产品相关的用户数据,所述用户数据包括用户访问数据和用户行为数据;
根据用户访问数据、用户行为数据和产品属性获取用户的行为关键词集合,用户的行为关键词集合包括用户的行为关键词,所述用户的行为关键词与产品属性相关联;
根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体。
2.根据权利要求1所述的用户数据处理方法,其特征在于,还包括:根据用户的行为关键词和预先确定的行为关键词的权值确定用户对产品属性的态度值。
3.根据权利要求1所述的用户数据处理方法,其特征在于,用户的行为关键词集合还包括用户的行为关键词出现的次数,所述根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体包括:根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值对与产品相关的用户进行聚类分析处理,获得多类用户群体。
4.根据权利要求3所述的用户数据处理方法,其特征在于,所述根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值对与产品相关的用户进行聚类分析处理,获得多类用户群体包括:根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值计算各用户的行为关键词的比重;
根据聚类算法对各用户的行为关键词的比重进行聚类分析处理,以对与产品相关的用户进行聚类分析处理,获得多类用户群体。
5.根据权利要求4用户数据处理方法,其特征在于,产品属性包括第一属性和第二属性,与第一属性相关联的用户的行为关键词的比重和与第二属性相关联的用户的行为关键词的比重构成多个数据点;所述根据聚类算法对各用户的行为关键词的比重进行聚类分析处理,以对与产品相关的用户进行聚类分析处理,获得多类用户群体包括:从多个数据点中选取设定数量个数据点作为初始聚类中心,每个初始聚类中心对应一个聚类;
计算其余各数据点与初始聚类中心之间的距离;
根据其余各数据点与初始聚类中心之间的距离确定其余各数据点所属的聚类;
根据当前每个聚类中的数据点计算出当前每个聚类的聚类中心;
计算各数据点与当前聚类的聚类中心之间的距离;
根据各数据点与当前聚类的聚类中心之间的距离确定各数据点当前所属的聚类,每个聚类对应一类用户群体。
6.根据权利要求5所述的用户数据处理系统,其特征在于,从多个数据点中选取设定数量个数据点作为初始聚类中心,每个初始聚类中心对应一个聚类之前还包括:
设置迭代初始参数k=0;
所述根据当前每个聚类中的数据点计算出当前每个聚类的聚类中心之前还包括:
将当前迭代次数k进行加1处理;
所述根据各数据点与当前聚类的聚类中心之间的距离确定各数据点所属的聚类之后还包括:
判断当前第k次迭代时计算出的聚类的聚类中心与第k‑1次迭代时计算出的聚类的聚类中心之间的差值和当前第k次迭代时计算出的聚类的聚类中心的比值是否小于设定阈值,若是,输出当前聚类,若否,执行所述将当前迭代次数k进行加1处理的步骤。
7.一种用户数据处理系统,其特征在于,包括:数据采集模块,用于采集与产品相关的用户数据,所述用户数据包括用户访问数据和用户行为数据;
关键词获取模块,用于根据用户访问数据、用户行为数据和产品属性获取用户的行为关键词集合,用户的行为关键词集合包括用户的行为关键词,所述用户的行为关键词与产品属性相关联;
关键词处理模块,用于根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体。
8.根据权利要求7所述的用户数据处理系统,其特征在于,还包括:确定模块,用于根据用户的行为关键词和预先确定的行为关键词的权值确定用户对产品属性的态度值。
9.根据权利要求7所述的用户数据处理系统,其特征在于,用户的行为关键词集合还包括用户的行为关键词出现的次数;所述关键词处理模块具体用于根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值对与产品相关的用户进行聚类分析处理,获得多类用户群体。
10.根据权利要求9所述的用户数据处理系统,其特征在于,所述关键词处理模块具体用于根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值计算各用户的行为关键词的比重;根据聚类算法对各用户的行为关键词的比重进行聚类分析处理,以对与产品相关的用户进行聚类分析处理,获得多类用户群体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711428531.0/,转载请声明来源钻瓜专利网。