[发明专利]一种基于顾客游逛行为的客群分类方法有效
申请号: | 201711473628.3 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108230023B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 周建成;陆艺;李宗昌;徐晓冬 | 申请(专利权)人: | 南京光普信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62;H04W4/021;H04W4/029;H04W4/33 |
代理公司: | 盐城市大丰区丰晟知识产权代理事务所(特殊普通合伙) 32454 | 代理人: | 葛潇敏 |
地址: | 210000 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 顾客 游逛 行为 分类 方法 | ||
1.一种基于顾客游逛行为的客群分类方法,其特征在于包括如下步骤:
步骤1,对商场进行区域划分;
步骤2,利用wifi定位信息得到顾客每次到访商场在各区域的停留时间数据;
步骤3,对步骤2得到的数据进行有效性判断,得到顾客在各区域的有效游逛占比;
步骤4,对有效游逛占比进行主成分处理,得到顾客的特征向量;
所述步骤4中,对有效游逛占比进行主成分处理,得到顾客的特征向量的具体内容是:设主成分线性方程是:
在R语言平台调用包“pscych”,对每位顾客在各区域的有效游逛占比的矩阵X,调用函数fa.parallel(X),得到主成分的个数N;调用该包中的princomp函数,得到主成分与原样本各区域之间线性关系的系数矩阵;
调用函数fa.parallel(X,fa=pc,n.iter=100),得到最优的主成分的选取个数m,选取前m个主成分,得到线性方程的系数矩阵α:
用顾客在各区域的有效游逛占比矩阵乘以系数矩阵X乘以系数矩阵α,得到每位顾客的主成分所构成的主成分矩阵Z:
每一行即为一位顾客在各主成分的数值;
步骤5,对特征向量进行聚类,对聚类结果进行决策树模型的训练与测试,得到分类模型:
步骤6,不同的类别数对应测试结果不一样,处理测试结果,确定最优类别数,对应的分类模型即可对到访商场顾客进行分类。
2.如权利要求1所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述步骤1中,对于长条形商场,将每一层划分为左中右三个区域。
3.如权利要求1所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述步骤3中,对步骤2得到的数据进行有效性判断的具体内容是:去掉各区域内总停留时长小于时间阈值的数据,然后计算出各区域有效停留的门槛时间,将各顾客在每个区域的停留时长与该区域的有效停留门槛时间进行比较,若停留时长大于门槛时间,则判定顾客在该区域的停留为有效游逛。
4.如权利要求3所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述计算各区域有效停留的门槛时间的方法是:对每个区域r,所有停留时长的序列为t=(t1,t2,…,tn),计算这个序列的中位值,将该中位值作为该区域有效停留的门槛时间。
5.如权利要求1所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述步骤5中,对特征向量进行聚类的具体内容是:对顾客的特征向量Z调用函数kmeans(Z,centers=k),k为自定义的类别数;把聚类结果匹配到每位顾客在各区域的有效游逛占比矩阵X=x′ij中,形成新的数据结构;计算各类别在每个区域的平均占比,对于平均值小于设定阈值的结果,修正为0。
6.如权利要求5所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述步骤6的具体内容是:遍历k,重复步骤5,分别计算每个类别对应的分类模型的准确率,从而确定泛化效果最优的类别数,确认最优分类模型。
7.如权利要求6所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述计算每个类别对应的分类模型的准确率的方法是:用分类模型classify_model对测试集的数据test_data进行分类,在R语言平台调用predict函数,predict(classify_model,train_data),返回结果为测试集的顾客类别的分类结果classify_result;对比classify_result与test_result,统计加和结果一致的数量A,除以测试集train_data所有顾客数B,得到模型的准确率F=A/B。
8.如权利要求1所述的一种基于顾客游逛行为的客群分类方法,其特征在于:所述步骤5中,对聚类结果进行决策树模型的训练与测试,得到分类模型的具体内容是:对每位顾客在各区域的有效游逛占比矩阵X=x′ij和与之匹配的聚类结果result进行分类训练,对矩阵X随机抽取50%的数据做训练集train_data,与之对应的result为train_result,剩下的50%的数据做测试集test_data,与之对应的result为test_result,测试时去掉result列;在R语言平台调用包“C50”,调用该包中的C5.0函数,classify_model=C5.0(train_data,train_result,trials=10),即得到分类模型classify_model。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京光普信息技术有限公司,未经南京光普信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711473628.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:广告显示管理方法及系统
- 下一篇:基于线索收集的广告投放引擎系统