[发明专利]客户群体的确定方法和相关设备在审
申请号: | 202210099322.0 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114418652A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 董尚懿 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q40/02;G06K9/62;G06V10/762 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 罗茜;臧建明 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客户 群体 确定 方法 相关 设备 | ||
本发明提供一种客户群体的确定方法和相关设备,该方法包括:根据各个客户的活跃数据生成伪特征向量;根据各个伪特征向量确定第一系数矩阵;根据第一系数矩阵以及特征矩阵确定第一函数式,并获取正则化参数;根据正则化参数对第一函数式中的第一系数矩阵进行正则化处理得到目标函数式,并求解目标函数式的最小解得到第二系数矩阵;根据第二系数矩阵对各个活跃数据进行谱聚类得到多簇数据,并根据每簇数据的特征确定每簇数据对应的客户所属的客户群体。本发明中,第二系数矩阵具有分组效应以及稀疏性,采用第二系数矩阵进行的谱聚类能够抑制不同聚类的对象之间的相关性且增加相同聚类的对象之间的相关性,提高了客户所属客户群体的聚类准确性。
技术领域
本发明涉及客户分类技术领域,尤其涉及一种客户群体的确定方法和相关设备。
背景技术
银行为了吸引新客户办理信用卡或储蓄卡,会推出各种各样的活动吸引客户。但是银行的服务和举办的活动不仅是为了吸引新客户,更是为了防止客户因为对银行的服务不满意而选择主动销户。
目前,可以通过客户的活跃数据确定客户所属的客户群体,若是客户是属于主动销户的客户群体,可针对性地给予优惠挽留客户,而且可以找到与主动销户高度相关的变量,在以后的工作中可以重点关注这些变量。
在确定客户所属的客户群体时,需要用到聚类算法进行聚类预测,例如,增强的谱聚类算法。但是聚类方法除了表达相同聚类的对象之间的相关性之外,也要抑制不同聚类的对象之间的相关性。然而,增强的谱聚类算法的重点是通过推导可放大集群内相关性的系数矩阵来增强相同聚类的对象之间的相关性,而不会抑制不同聚类的对象之间的相关性,导致客户所属客户群体的聚类准确性较低。
发明内容
本发明提供一种客户群体的确定方法和相关设备,用以解决客户所属客户群体的聚类准确性较低的问题。
一方面,本发明提供一种客户群体的确定方法,包括:
获取各个客户对应的活跃数据,并根据各个所述活跃数据生成各个伪特征向量;
根据各个所述伪特征向量生成特征矩阵,并根据所述特征矩阵确定第一系数矩阵;
根据所述第一系数矩阵以及所述特征矩阵确定第一函数式,并获取正则化参数,所述第一函数式是谱聚类方法所对应的函数式;
根据所述正则化参数对所述第一函数式中的所述第一系数矩阵进行正则化处理得到目标函数式,并求解所述目标函数式的最小解得到第二系数矩阵;
根据所述第二系数矩阵对各个所述活跃数据进行谱聚类得到多簇数据,并根据每簇数据的特征确定每簇数据对应的客户所属的客户群体,其中,每簇数据中的多个所述活跃数据所属客户属于相同的客户群体。
在一实施例中,所述正则化参数包括L1范数,所述根据正则化参数对所述第一函数式中的所述第一系数矩阵进行正则化处理得到目标函数式的步骤包括:
根据所述L1范数对所述第一函数式中的第一系数矩阵进行正则化处理得到第二函数式;
获取所述L1范数对应的约束条件以及朗格朗日乘数;
根据所述约束条件以及所述拉格朗日乘数对所述第二函数式进行变换得到所述目标函数式。
在一实施例中,所述正则化参数包括迹线拉索量,所述根据正则化参数对所述第一函数式中的所述第一系数矩阵进行正则化处理得到目标函数式的步骤包括:
基于所述特征向量中各个伪特征向量之间的相关关系以及不相关关系,确定迹线拉索量;
根据所述迹线拉索量对所述第一函数式中的所述第一系数矩阵进行正则化处理,得到所述目标函数式。
在一实施例中,所述根据所述第二系数矩阵对各个所述活跃数据进行谱聚类得到多簇数据的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210099322.0/2.html,转载请声明来源钻瓜专利网。