[发明专利]数据处理方法及装置在审
申请号: | 201711436093.2 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108171543A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 彭晓茂 | 申请(专利权)人: | 北京小度信息科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个体特征 特征数据 数据处理 数据挖掘 特征维度 用户特征 画像 刻画 | ||
本发明实施例提供一种数据处理方法及装置,涉及用户画像和数据挖掘领域。其中,所述方法包括:获取用户在不同商圈中的个体特征数据;确定所述不同商圈中各商圈的总体特征数据,其中,所述个体特征数据与所述总体特征数据按照特征维度相互对应;基于所述个体特征数据和所述总体特征数据,确定所述用户的综合特征值。本发明实施例提供的技术方案能够有效且准确地刻画用户特征。
技术领域
本发明实施例涉及用户画像以及数据挖掘领域,尤其涉及一种数据处理方法及装置。
背景技术
为了提高信息的准确性、针对性等,需要为用户建立用户画像,所述用户画像包含用户的多项特征。现有技术通常基于用户直接相关的数据源进行数据挖掘进而刻画用户画像中的具体特征。而发明人通过研究发现,现有技术在数据覆盖范围、数据的深度等方面均有所不足,这导致刻画的用户特征的准确性欠佳。
发明内容
本发明实施例提供一种数据处理方法及装置,用以解决现有技术中在用户画像中难以准确刻画用户特征的技术问题。
第一方面,本发明实施例中提供了一种数据处理方法,包括:
获取用户在不同商圈中的个体特征数据;
确定所述不同商圈中各商圈的总体特征数据,其中,所述个体特征数据与所述总体特征数据按照特征维度相互对应;
基于所述个体特征数据和所述总体特征数据,确定所述用户的综合特征值。
结合第一方面,本发明在第一方面的第一种实现方式中,所述个体特征数据按所述特征维度包括以下任意一项或一项以上:
优惠单占比、优惠单的优惠率、商户集中度、优惠率标准差。
结合第一方面,本发明在第一方面的第二种实现方式中,所述确定所述不同商圈中各商圈的总体特征数据,包括:
基于所述各商圈中设定数量的用户的个体特征数据,按照特征维度进行聚合处理;
按照所述特征维度,计算所述各商圈的聚合结果与所述各商圈的整体量化参数的比值,得到所述各商圈的总体特征数据。
结合第一方面、第一方面的第一实现方式或第二实现方式,本发明在第一方面的第三种实现方式中,所述基于所述个体特征数据和所述总体特征数据,确定所述用户的综合特征值,包括:
根据所述个体特征数据和所述总体特征数据,计算在所述各商圈中所述用户在所述特征维度下的指标值;
基于在所述各商圈中所述用户在所述特征维度下的指标值的评价值,进行第一加权计算,得到所述用户在所述特征维度下的维度特征值;
基于所述用户在所述特征维度下的特征值,进行第二加权计算,得到所述用户的综合特征值。
结合第一方面的第三种实现方式,本发明在第一方面的第四种实现方式中,通过对所述指标值进行归一化处理并查表得到所述指标值的评价值。
结合第一方面的第三种实现方式,本发明在第一方面的第五种实现方式中,所述指标值按照所述特征维度包括以下任意一项或一项以上:
优惠单占比比值、优惠单的优惠率占比比值、商户集中度比值、优惠率标准差比值。
结合第一方面的第三种实现方式,本发明在第一方面的第六种实现方式中,在所述第一加权计算中,将所述用户在所述各商圈中的订单量在所述用户的总订单量的数量占比,作为在所述各商圈中所述用户在所述特征维度下的指标值的评价值的权重。
结合第一方面的第三种实现方式,本发明在第一方面的第七种实现方式中,在所述第二加权计算中,所述特征值的权重因所属特征维度的不同而设置为特定值。
第二方面,本发明实施例提供了一种数据处理装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小度信息科技有限公司,未经北京小度信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711436093.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种互联网内容推送控制系统
- 下一篇:一种销量统计的方法及装置