[发明专利]基于机器学习的隐私数据处理方法、装置及电子设备在审
| 申请号: | 202010479759.8 | 申请日: | 2020-01-16 |
| 公开(公告)号: | CN111475851A | 公开(公告)日: | 2020-07-31 |
| 发明(设计)人: | 陈凌;杨耀;刘磊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q10/06;G06Q40/02 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 机器 学习 隐私 数据处理 方法 装置 电子设备 | ||
1.一种基于机器学习的隐私数据处理方法,包括:
基于金融机构的需求,从第三方支付平台积累的批量用户隐私数据中提取目标原始特征,其中,所述目标原始特征包括用户的社会属性、信用属性和风险偏好中的至少一种;
基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,其中,所述特征嵌入模型是基于包含预设原始特征的训练数据训练得到的,所述预设原始特征与所述目标原始特征的类型相同;
将所述特征嵌入向量提供给所述金融机构,以使所述金融机构基于所述特征向量构建风控模型,所述风控模型用于确定用户的风险评估参数,所述风险评估参数是所述金融机构判断是否向用户提供指定金融服务的依据。
2.根据权利要求1所述的方法,在所述基于特征嵌入模型确定所述目标原始特征的特征嵌入向量之前,还包括:
针对多种业务场景,基于与业务场景相关的标签和所述训练数据,训练得到多个特征嵌入模型,其中,一种业务场景对应训练出一个特征嵌入模型;
其中,所述基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,包括:
基于所述金融机构的需求,确定所述金融机构面对的目标业务场景,所述目标业务场景是所述多种业务场景中的一种;
基于所述目标业务场景对应的特征嵌入模型,确定所述目标原始特征的特征嵌入向量。
3.根据权利要求2所述的方法,其中,所述针对多种业务场景,基于与业务场景相关的标签和所述训练数据,训练得到多个特征嵌入模型,包括:
针对多种业务场景,基于与业务场景相关的标签和所述训练数据,进行深度学习得到多个特征嵌入模型。
4.根据权利要求1所述的方法,其中,在所述基于特征嵌入模型确定所述目标原始特征的特征嵌入向量之前,还包括:
基于所述训练数据进行无监督训练,得到所述特征嵌入模型。
5.根据权利要求4所述的方法,
所述特征嵌入模型包括word2vec、node2vec、item2vec、feature2vec中的任一种。
6.根据权利要求1-5任一项所述的方法,其中,所述将所述目标原始特征的特征嵌入向量提供给所述金融机构,包括:
基于预设规则,对所述目标原始特征的特征嵌入向量进行分类;
将所述目标原始特征的特征嵌入向量和该特征嵌入向量的类型,提供给所述金融机构。
7.根据权利要求1-5任一项所述的方法,其中,所述将所述目标原始特征的特征嵌入向量提供给所述金融机构,包括:
对所述目标原始特征的特征嵌入向量进行加密;
将加密后的所述目标原始特征的特征嵌入向量提供给所述金融机构。
8.根据权利要求1-5任一项所述的方法,
所述目标原始特征为单一特征,或者,所述目标原始特征为至少两个单一特征合并形成的耦合特征。
9.一种基于机器学习的隐私数据处理装置,包括:
第一特征提取模块,用于基于金融机构的需求,从第三方支付平台积累的批量用户隐私数据中提取目标原始特征,其中,所述目标原始特征包括用户的社会属性、信用属性和风险偏好中的至少一种;
第一向量确定模块,用于基于特征嵌入模型确定所述目标原始特征的特征嵌入向量,其中,所述特征嵌入模型是基于包含预设原始特征的训练数据训练得到的,所述预设原始特征与所述目标原始特征的类型相同;
第一数据提供模块,用于将所述特征嵌入向量提供给所述金融机构,以使所述金融机构基于所述特征向量构建风控模型,所述风控模型用于确定用户的风险评估参数,所述风险评估参数是所述金融机构判断是否向用户提供指定金融服务的依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010479759.8/1.html,转载请声明来源钻瓜专利网。





