[发明专利]一种用户客群分类方法和装置在审
申请号: | 202010832847.1 | 申请日: | 2020-08-18 |
公开(公告)号: | CN111967910A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 张亚泽 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/906;G06K9/62;G06N20/00;G06Q40/02 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 谷敬丽;周晓飞 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 分类 方法 装置 | ||
本发明提供了一种用户客群分类方法和装置,该方法包括:在联邦学习分布式网络的参与节点中,获取用户特征数据;其中,所述联邦学习分布式网络,包括:参与节点,模型聚合节点;根据用户特征数据,在参与节点中对逻辑回归模型进行训练,确定参与节点梯度密文信息;将参与节点梯度密文信息上传至联邦学习分布式网络的模型聚合节点进行聚合,确定聚合梯度密文信息;根据聚合梯度密文信息,在模型聚合节点中进行横向联邦学习,确定联合梯度信息;将联合梯度信息分发至每一参与节点,输入至联邦学习逻辑回归客群分类模型进行训练;根据训练后的联邦学习逻辑回归客群分类模型,对用户客群进行分类。本发明可以提高用户客群分类的准确性。
技术领域
本发明涉及计算机信息处理技术领域,尤其涉及一种用户客群分类方法和装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着人工智能理论与技术的发展,利用大量的用户信息可以为用户提供定制化、个性化的符合用户偏好的服务。机器学习模型的准确率需要大量的训练数据以及丰富的用户特征作为支撑。
然而,鉴于数据的安全以及用户数据的隐私保护,一方面,目前各个银行间的数据是不可能共享用于训练模型,使得数据分布在独立的“数据孤岛”中;另一方面,目前银行中用于训练客群分类模型的数据中,负样本一般只占很小的一部分比例,正负样本极为不均衡,现有方案针对这种情况往往会采取减少正例样本的方式,但是这样也减少了训练样本量,导致模型的准确率下降,使得训练出的模型分类效果一般。
因此,如何提供一种新的方案,其能够解决上述技术问题是本领域亟待解决的技术难题。
发明内容
本发明实施例提供一种用户客群分类方法,使用户数据不离开参与节点,通过梯度密文信息进行横向联邦学习实现数据安全共享,提高用户客群分类的准确性,该方法包括:
在联邦学习分布式网络的参与节点中,获取用户特征数据;其中,所述联邦学习分布式网络,包括:参与节点,模型聚合节点;
根据用户特征数据,在参与节点中对逻辑回归模型进行训练,确定参与节点梯度密文信息;
将参与节点梯度密文信息上传至联邦学习分布式网络的模型聚合节点进行聚合,确定聚合梯度密文信息;
根据聚合梯度密文信息,在模型聚合节点中进行横向联邦学习,确定联合梯度信息;
将联合梯度信息分发至每一参与节点,输入至联邦学习逻辑回归客群分类模型进行训练;
根据训练后的联邦学习逻辑回归客群分类模型,对用户客群进行分类。
本发明实施例还提供一种用户客群分类装置,包括:
数据获取模块,用于在联邦学习分布式网络的参与节点中,获取用户特征数据;其中,所述联邦学习分布式网络,包括:参与节点,模型聚合节点;
参与节点梯度密文信息确定模块,用于根据用户特征数据,在参与节点中对逻辑回归模型进行训练,确定参与节点梯度密文信息;
聚合梯度密文信息确定模块,用于将参与节点梯度密文信息上传至联邦学习分布式网络的模型聚合节点进行聚合,确定聚合梯度密文信息;
联合梯度信息确定模块,用于根据聚合梯度密文信息,在模型聚合节点中进行横向联邦学习,确定联合梯度信息;
联邦学习逻辑回归客群分类模型训练模块,用于将联合梯度信息分发至每一参与节点,输入至联邦学习逻辑回归客群分类模型进行训练;
用户客群分类模块,用于根据训练后的联邦学习逻辑回归客群分类模型,对用户客群进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010832847.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据文件完整性验证方法及装置
- 下一篇:一种敏感信息识别方法和装置