[发明专利]流式数据匿名化在审

专利信息
申请号: 201711022489.2 申请日: 2017-10-27
公开(公告)号: CN108021818A 公开(公告)日: 2018-05-11
发明(设计)人: K·拉玛莫塞;S·R·莫拉普迪 申请(专利权)人: 通用汽车有限责任公司
主分类号: G06F21/62 分类号: G06F21/62
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 姜凝;安文森
地址: 美国密*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 匿名
【说明书】:

一种用于使流式数据集匿名化的系统和方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;识别用于发送充分匿名的数据集的时间段;以及基于时间段中剩余的时间量来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量。

技术领域

发明涉及处理数据,并且更具体地涉及数据集匿名化。

背景技术

数据集可以被创建为每个数据集均包括多个数据值。这些数据集可以描述大量现象。例如,数据集可以包括与人相关联的用于描述个人或者涉及个人的多个数据值。即是说,个人可与表明其住所(诸如,邮政编码)、其性别、或者年龄的数据相关联。数据集可替代地可以描述其它主题,诸如,车辆和与该车辆相关联的车辆功能。鉴于数据集可包括识别信息,所以其通常被匿名化,以便使得该信息的接收者不能具体地识别该数据集中包括的特定数据值(例如,人或者车辆)。

可以通过使用k-匿名技术来处理数据集并且使其匿名来实现匿名化。然而,k-匿名通常应用于静态数据集。相反,许多数据集现在都是作为流式数据来发送,并且使这些流式数据集匿名化可具有挑战性。当将现有的k-匿名技术应用至流式数据时,可具有挑战性的是识别应用数据集的最佳匿名量以便确保数据充分匿名并且在限定时间要求内处理该数据集。

发明内容

根据实施例,提供了一种用于使流式数据集匿名化的方法。该方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;识别用于发送充分匿名的数据集的时间段;以及基于该时间段中剩余的时间量来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量。

根据另一实施例,提供了一种用于使流式数据集匿名化的方法。该方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;计算接收引入数据集的速率;基于接收数据集的速率来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量;以及在时间段终止之前将充分匿名的数据集传输至第三方。

附图说明

下文将结合附图对本发明的一个或多个实施例进行描述,其中,相似的附图标记表示相似的元件,并且在附图中:

图1是描绘了能够使用本文所公开的方法的通信系统的实施例的框图;以及

图2是描绘了用于使流式数据集匿名化的方法的实施例的流程图。

具体实施方式

下文所描述的系统和方法使用k-匿名技术来使流式数据集匿名化并且确保存在相对于最佳匿名水平的充分匿名水平。最佳匿名水平可以通过使用广义矢量来建立。当流式数据集已经被匿名化并且由矢量来表示时,可以将这些矢量与广义矢量作比较以便确定其间存在的计算距离。如果该计算距离在可接受的值范围内,则数据集可被充分地匿名。该范围可以具有上限和下限,以便确保数据集不仅被充分地匿名而且系统没有移除太多数据而使得数据集提供的信息比其本能提供的要少。该范围可以由来自数据集的密匙(诸如,车辆标识符)在特定数据集中被重复的次数来确定。如果提供了全部密匙,则不存在匿名。相反,如果密匙被编校或者概括化,则密匙变得匿名。这样,可以控制广义矢量以建立最佳匿名水平,该最佳匿名水平维持秘密状态但也确保数据集在不包括该秘密状态的情况下包括尽可能多的信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用汽车有限责任公司,未经通用汽车有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711022489.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top