[发明专利]一种基于K-means的医疗消费客户自动分类方法在审
申请号: | 201810477477.7 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108664653A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 古万荣;施玉健;毛宜军;李海良;朱韬 | 申请(专利权)人: | 拓普暨达(广州)基因精准医疗科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q30/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510623 广东省广州市天河区珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客户 客户分类 自动分类 使用机器 特征向量 消费客户 算法 客户数据库 分类标准 聚类结果 人力物力 提取数据 分类 构建 聚类 医疗 学习 统计 | ||
1.一种基于K-means的医疗消费客户自动分类方法,其特征在于,包括以下步骤:
S1、从客户数据库中统计提取数据;
S2、按照CRM方法,根据客户的年消费频率和客户的年消费总金额构建客户分类模型;
S3、使用步骤S2的客户分类模型,获取每个客户的特征向量;
S4、使用机器学习K-means算法对步骤S3中求得的特征向量进行聚类;
S5、使用步骤S4所得的聚类结果作为客户分类的结果,从而实现对客户的分类。
2.根据权利要求1所述的一种基于K-means的医疗消费客户自动分类方法,其特征在于:在步骤S1中,从客户相关的数据库中,通过查询获取客户的基本信息和通过聚合函数统计出每个客户的年消费频率和年消费金额,以此作为自动分类方法的输入数据。
3.根据权利要求1所述的一种基于K-means的医疗消费客户自动分类方法,其特征在于:在步骤S2中,使用客户的年消费频率为横坐标,以年消费总金额作为纵坐标,构建出客户客户分类模型。
4.根据权利要求1所述的一种基于K-means的医疗消费客户自动分类方法,其特征在于:在步骤S2中,所述的CRM方法是一种用于改善企业和客户之间关系的新型管理方法,其中客户关系管理中的一个重要环节就是客户细分,所述客户细分实质是一种将一个大的客户群或者消费者群体划分成多个分类群体的方法,这些群体中同属于一个分类群体的客户或者消费者的彼此特性相似。
5.根据权利要求1所述的一种基于K-means的医疗消费客户自动分类方法,其特征在于:在步骤S3中,利用步骤S2中建立的客户分类模型,获取每个客户的特征向量,此处的输入数据恰好包含客户分类模型的两个维度,因此直接以步骤S1中的每一个客户的数据输入作为该客户的特征向量。
6.根据权利要求1所述的一种基于K-means的医疗消费客户自动分类方法,其特征在于:在步骤S4中,使用步骤S3的客户特征向量作为K-means算法的输入,执行K-means算法对客户进行分类,其中K-means算法的聚类过程分为以下三个步骤:
S41、初始化聚类中心
通过在数据集中随机寻找k个样本,以这k个样本作为本次聚类过程的三个初始聚类中心;
S42、分配过程
设t表示迭代次数,为第t次迭代的第i个簇,表示第t次迭代的第i个聚类中心,表示第t次迭代的第j个聚类中心,xp表示被分配的数据点,k为所需要的聚类数目,有如下公式:
该公式反映了K-means算法在聚类的过程中的依据,即分配数据点,使得被分配点xp到所属簇的聚类中心的距离最小;
S43、更新过程
设为第t+1次迭代的第i个聚类中心,为第t次迭代的第i个簇,xj表示中的第j数据点;对分配过程中得到的簇,重新计算聚类中心,有如下公式:
该公式反映了K-means算法在更新聚类中心时的做法,即计算簇中所有数据点的均值,依次作为该簇新的聚类中心;
其中,所述的簇为聚类算法运算后得到的某一个分组,所述的聚类中心为聚类算法所得到的分组的中心点。
7.根据权利要求1所述的一种基于K-means的医疗消费客户自动分类方法,其特征在于:在步骤S5中,应用步骤S4得到聚类结果作为客户的分类结果,具体分类类别为勤俭型客户、经济型客户和小资型客户三种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拓普暨达(广州)基因精准医疗科技有限公司,未经拓普暨达(广州)基因精准医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810477477.7/1.html,转载请声明来源钻瓜专利网。