[发明专利]用户数据处理方法及系统在审
申请号: | 201711428531.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108171538A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 彭佳 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;汪源 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户数据处理 用户访问数据 用户行为数据 关键词集合 产品属性 用户数据 多类用户 聚类分析 实时预测 受众 采集 关联 预测 群体 | ||
本发明公开了一种用户数据处理方法及系统。该用户数据处理方法包括:采集与产品相关的用户数据,所述用户数据包括用户访问数据和用户行为数据;根据用户访问数据、用户行为数据和产品属性获取用户的行为关键词集合,用户的行为关键词集合包括用户的行为关键词,所述用户的行为关键词与产品属性相关联;根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体。本发明能够实现实时预测出用户对该类别产品的需求,并预测出产品的受众度。
技术领域
本发明涉及数据分析处理领域,特别涉及一种用户数据处理方法及系统。
背景技术
随着互联网的高速发展,基于互联网的产品竞争加剧,运营商针对互联网也推出了大量的产品,但在多如牛毛的产品中,如何评价产品效益,特别是产品类别的受欢迎程度,以便决定运营商的产品设计方向,是目前运营商产品策略中的难题。传统的方案是通过人工或系统调研,通过事先制定调研方案,然后寻找客户或者诱导客户填写调研问卷来决策产品设计和产品策略,但传统的方案存在如下问题:
1、由于调研策略等制定需要大量时间,无法及时反馈用户需求,无法连续反馈产品受众度的持续变化情况。
2、由于受访的用户在广大网民中是绝对的少数,由于提取用户反馈的数据量不够,常出现以偏概全的问题,不能正确或完整地反馈用户需求。
3、调研反馈缓慢,且调研问卷的方式都是用户有目的地填写,难以保证反馈的质量,使得难以真正反馈用户的需求。
发明内容
本发明提供一种用户数据处理方法及系统,用于实时预测和反馈用户对产品类别的需求和产品类别的受众度。
为实现上述目的,本发明提供一种用户数据处理方法,该用户数据处理方法包括:
采集与产品相关的用户数据,所述用户数据包括用户访问数据和用户行为数据;
根据用户访问数据、用户行为数据和产品属性获取用户的行为关键词集合,用户的行为关键词集合包括用户的行为关键词,所述用户的行为关键词与产品属性相关联;
根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体。
可选地,该用户数据处理方法还包括:
根据用户的行为关键词和预先确定的行为关键词的权值确定用户对产品属性的态度值。
可选地,用户的行为关键词集合还包括用户的行为关键词出现的次数,所述根据用户的行为关键词对与产品相关的用户进行聚类分析处理,获得多类用户群体包括:
根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值对与产品相关的用户进行聚类分析处理,获得多类用户群体。
可选地,所述根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值对与产品相关的用户进行聚类分析处理,获得多类用户群体包括:
根据用户的行为关键词、用户的行为关键词出现的次数和预先确定的行为关键词的权重值计算各用户的行为关键词的比重;
根据聚类算法对各用户的行为关键词的比重进行聚类分析处理,以对与产品相关的用户进行聚类分析处理,获得多类用户群体。
可选地,产品属性包括第一属性和第二属性,与第一属性相关联的用户的行为关键词的比重和与第二属性相关联的用户的行为关键词的比重构成多个数据点;所述根据聚类算法对各用户的行为关键词的比重进行聚类分析处理,以对与产品相关的用户进行聚类分析处理,获得多类用户群体包括:
从多个数据点中选取设定数量个数据点作为初始聚类中心,每个初始聚类中心对应一个聚类;
计算其余各数据点与初始聚类中心之间的距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711428531.0/2.html,转载请声明来源钻瓜专利网。