[发明专利]使用待交换数据来执行机器学习的方法、设备和系统有效
| 申请号: | 201810148969.1 | 申请日: | 2018-02-13 |
| 公开(公告)号: | CN108306891B | 公开(公告)日: | 2020-11-10 |
| 发明(设计)人: | 陈雨强;戴文渊;杨强 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F21/60;H04L9/08;G06N20/00 |
| 代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 于翔;曾世骁 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 交换 数据 执行 机器 学习 方法 设备 系统 | ||
提供一种使用待交换数据来执行机器学习的方法、设备和系统。所述设备包括:初次加密数据接收单元,被配置为分别从第一数据提供方接收第一初次加密结果数据和从第二数据提供方接收第二初次加密结果数据;初次加密数据发送单元,被配置为分别将第一初次加密结果数据发送到第二数据提供方和将第二初次加密结果数据发送到第一数据提供方;再次加密数据接收单元,被配置为分别从第一数据提供方接收第二再次加密结果数据和从第二数据提供方接收第一再次加密结果数据;以及机器学习执行单元,被配置为获取机器学习样本,并基于机器学习样本来执行机器学习。通过所述设备,可安全可靠地使用外部数据来进行机器学习。
技术领域
本发明的示例性实施例总体说来涉及人工智能的机器学习领域,具体说来,涉及一种使用待交换数据来执行机器学习的方法、设备和系统。
背景技术
随着大数据、云计算和人工智能等技术的发展,机器学习被广泛地用来从海量数据中挖掘其中隐藏的有用信息。
为了应用机器学习,通常需要从给定的训练数据集中学习出一个由特征及其参数组成的模型函数,当新数据到来时,可以针对该新数据应用这个模型。为了更好地学习或应用模型,往往需要来自各个方面的数据参与到模型的例如训练、测试或预估等过程中,这些数据可从相应的数据提供方购买或以其它方式获得。例如,银行在进行诸如获客、反欺诈等业务时,常常需要结合各种额外数据来执行机器学习,作为示例,所述额外数据可包括:移动互联网行为数据(诸如手机号码、通讯录数据、手机型号、生产厂商、硬件信息、经常使用的APP、社交分享的内容等等)、移动设备通信数据(诸如手机号码、通讯录数据和通话记录)、移动运营商数据(诸如手机号码、上网浏览行为和APP使用行为)。
实践中,为了保证数据安全性和/或机器学习效果,会借助第三方通过利用各个数据提供方的数据来提供机器学习服务。相应地,各个数据提供方可将分别用相同密钥进行加密的数据提供给所述第三方,使得第三方能够在不获取数据明文的情况下完成数据的拼接,并基于拼接结果来进行机器学习。然而,应注意的是,在进行上述加密数据的交换时,很容易由于第三方与某一数据提供方之间的串通而泄露用户的隐私信息或其它不适于披露的信息,并且,交换的数据很容易在未经授权的情况下被再次使用或出售,难以从技术上保障数据的合法使用。例如,当互联网应用方面的数据提供方将自己的数据提供给第三方,以结合银行的数据来执行机器学习时,会担心自己用户的隐私被无端泄露,也会担心数据不经授权而被再次使用或出售。另一方面,银行同样会担心数据内容的泄露和/或数据的未授权使用。
发明内容
根据本发明的一个示例性实施例,提供了一种使用待交换数据来执行机器学习的设备,包括:初次加密数据接收单元,被配置为分别从第一数据提供方接收第一初次加密结果数据和从第二数据提供方接收第二初次加密结果数据,其中,第一初次加密结果数据由第一数据提供方通过使用第一加密函数对第一待交换数据进行加密而得,第二初次加密结果数据由第二数据提供方通过使用第二加密函数对第二待交换数据进行加密而得,其中,第一待交换数据与第二待交换数据至少部分对应;初次加密数据发送单元,被配置为分别将第一初次加密结果数据发送到第二数据提供方和将第二初次加密结果数据发送到第一数据提供方;再次加密数据接收单元,被配置为分别从第一数据提供方接收第二再次加密结果数据和从第二数据提供方接收第一再次加密结果数据,其中,第一再次加密结果数据由第二数据提供方通过使用第二加密函数对第一初次加密结果数据进行加密而得,第二再次加密结果数据由第一数据提供方通过使用第一加密函数对第二初次加密结果数据进行加密而得;以及机器学习执行单元,被配置为通过将第一再次加密结果数据与第二再次加密结果数据进行拼接来获取机器学习样本,并基于机器学习样本来执行机器学习。
可选地,在所述设备中,第一待交换数据之中的每条第一待交换数据记录至少包括标识信息和属性信息,第二待交换数据之中的每条第二待交换数据记录至少包括标识信息和关于机器学习目标的标记信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810148969.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





