[发明专利]一种基于K-Means的电子发票用户聚类方法在审

专利信息
申请号: 201810057864.5 申请日: 2018-01-19
公开(公告)号: CN108268898A 公开(公告)日: 2018-07-10
发明(设计)人: 尤培海;李泽然;张泽;白光佩;潘黛;李蓓;包印 申请(专利权)人: 大象慧云信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06Q30/02
代理公司: 北京润川律师事务所 11643 代理人: 汪永生
地址: 100086 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电子发票 用户消费行为 特征向量 聚类模型 样本数据 指标向量 数据聚类 数据匹配 消费行为 用户聚类 分类 技术计算 数据分类 算法计算 大数据 中心点
【权利要求书】:

1.一种基于K-Means的电子发票用户聚类方法,其特征在于,包括:

基于电子发票用户消费行为建立电子发票用户消费行为数据聚类模型;

应用所述电子发票用户消费行为数据聚类模型实现所述电子发票用户消费行为数据匹配,对所述电子发票用户消费行为进行聚类。

2.根据权利要求1所述的方法,其特征在于,建立所述电子发票用户消费行为数据聚类模型,包括:

选取M个所述电子发票用户的消费行为数据为样本数据,其中M>1;

建立所述电子发票用户消费行为数据聚类模型的指标序列,所述指标序列中的指标个数为N,N≥1;

根据所述指标序列中的指标,利用大数据技术计算所述样本数据的指标向量,每个所述电子发票用户的消费行为数据得到一个指标向量;

利用K-Means算法计算所述指标向量的中心点,得到所述样本数据的特征向量,每一个所述的特征向量对应一种所述电子发票用户的消费行为数据分类;

所述样本数据的特征向量构成所述电子发票用户消费行为数据聚类模型。

3.根据权利要求1所述的方法,其特征在于,实现所述电子发票用户消费行为数据匹配方法,包括:

选取任意一个所述电子发票用户的消费行为数据作为待分类算例;

根据所述电子发票用户消费行为数据聚类模型的指标序列,计算所述待分类算例的指标向量;

所述待分类算例的指标向量与所述聚类模型中的特征向量进行对比,得到与所述待分类算例最接近的所述特征向量V,则所述待分类算例属于V对应的所述电子发票用户的消费行为数据分类。

4.根据权利要求2所述的方法,其特征在于,所述样本数据的选取方法包括:

使用所有的所述电子发票用户消费行为数据作为所述样本数据,随机或者按照一定的规则选取部分所述电子发票用户消费行为数据作为样本数据。

5.根据权利要求2所述的方法,其特征在于,所述指标序列中的指标包括基础属性、消费属性和活跃度属性;所述基础属性包括性别、年龄和城市级别;所述消费属性包括购买力、类目偏好和品牌偏好;所述活跃度属性包括月活跃度、年活跃度和活跃时段。

6.根据权利要求2所述的方法,其特征在于,所述利用大数据技术计算所述样本数据的指标向量的方法包括:对所述样本数据进行清洗和规约形成预处理数据向量,对所述预处理数据向量进行z-score标准化得到所述样本数据的指标向量。

7.根据权利要求2所述的方法,其特征在于,所述利用K-Means算法计算所述指标向量的中心点的方法包括:

S1:从M个所述指标向量中随机选取K个所述指标向量作为初始中心点,其中M>K,且K>1;

S2:对剩余的(M-K)个所述指标向量,计算每一个所述指标向量到K个所述初始中心点的距离,所述指标向量到哪一个所述初始中心点的距离最小,则将所述指标向量划分至所述初始中心点对应的分类;

S3:所述指标向量被分成K个分类,计算每个所述分类的中心点;

S4:迭代进行S2和S3中的计算,直至所述K个分类的中心点与上一次计算的所述K个分类的中心点的相等或者距离小于规定的阈值,则结束迭代运算;

最终运算得到的所述K个分类的中心点,也即所述指标向量的中心点,所述中心点为K个分类的所述特征向量。

8.根据权利要求7所述的方法,其特征在于,K个分类的所述特征向量均为N维向量,K个所述N维向量构成所述电子发票用户消费行为数据聚类模型。

9.根据权利要求3所述的方法,其特征在于,所述待分类算例的指标向量与所述聚类模型中的特征向量进行对比的方法包括:计算所述待分类算例的指标向量与所述聚类模型中的所有特征向量的距离,其中距离最小者为与所述待分类算例最接近的所述特征向量V。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大象慧云信息技术有限公司,未经大象慧云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810057864.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top