[发明专利]流式数据匿名化在审
申请号: | 201711022489.2 | 申请日: | 2017-10-27 |
公开(公告)号: | CN108021818A | 公开(公告)日: | 2018-05-11 |
发明(设计)人: | K·拉玛莫塞;S·R·莫拉普迪 | 申请(专利权)人: | 通用汽车有限责任公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜凝;安文森 |
地址: | 美国密*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 匿名 | ||
一种用于使流式数据集匿名化的系统和方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;识别用于发送充分匿名的数据集的时间段;以及基于时间段中剩余的时间量来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量。
技术领域
本发明涉及处理数据,并且更具体地涉及数据集匿名化。
背景技术
数据集可以被创建为每个数据集均包括多个数据值。这些数据集可以描述大量现象。例如,数据集可以包括与人相关联的用于描述个人或者涉及个人的多个数据值。即是说,个人可与表明其住所(诸如,邮政编码)、其性别、或者年龄的数据相关联。数据集可替代地可以描述其它主题,诸如,车辆和与该车辆相关联的车辆功能。鉴于数据集可包括识别信息,所以其通常被匿名化,以便使得该信息的接收者不能具体地识别该数据集中包括的特定数据值(例如,人或者车辆)。
可以通过使用k-匿名技术来处理数据集并且使其匿名来实现匿名化。然而,k-匿名通常应用于静态数据集。相反,许多数据集现在都是作为流式数据来发送,并且使这些流式数据集匿名化可具有挑战性。当将现有的k-匿名技术应用至流式数据时,可具有挑战性的是识别应用数据集的最佳匿名量以便确保数据充分匿名并且在限定时间要求内处理该数据集。
发明内容
根据实施例,提供了一种用于使流式数据集匿名化的方法。该方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;识别用于发送充分匿名的数据集的时间段;以及基于该时间段中剩余的时间量来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量。
根据另一实施例,提供了一种用于使流式数据集匿名化的方法。该方法包括:将一个或多个数据集处理为这些数据集的一个或多个匿名矢量代表;访问包括期望的数据匿名化水平的广义矢量;将数据集的匿名矢量代表与广义矢量作比较;基于该比较来确定数据集的匿名矢量代表是否充分匿名;计算接收引入数据集的速率;基于接收数据集的速率来增加或者减小用于确定数据集的矢量代表是否充分匿名的计算资源的数量;以及在时间段终止之前将充分匿名的数据集传输至第三方。
附图说明
下文将结合附图对本发明的一个或多个实施例进行描述,其中,相似的附图标记表示相似的元件,并且在附图中:
图1是描绘了能够使用本文所公开的方法的通信系统的实施例的框图;以及
图2是描绘了用于使流式数据集匿名化的方法的实施例的流程图。
具体实施方式
下文所描述的系统和方法使用k-匿名技术来使流式数据集匿名化并且确保存在相对于最佳匿名水平的充分匿名水平。最佳匿名水平可以通过使用广义矢量来建立。当流式数据集已经被匿名化并且由矢量来表示时,可以将这些矢量与广义矢量作比较以便确定其间存在的计算距离。如果该计算距离在可接受的值范围内,则数据集可被充分地匿名。该范围可以具有上限和下限,以便确保数据集不仅被充分地匿名而且系统没有移除太多数据而使得数据集提供的信息比其本能提供的要少。该范围可以由来自数据集的密匙(诸如,车辆标识符)在特定数据集中被重复的次数来确定。如果提供了全部密匙,则不存在匿名。相反,如果密匙被编校或者概括化,则密匙变得匿名。这样,可以控制广义矢量以建立最佳匿名水平,该最佳匿名水平维持秘密状态但也确保数据集在不包括该秘密状态的情况下包括尽可能多的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用汽车有限责任公司,未经通用汽车有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711022489.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:频率可变LC滤波器、高频前端电路
- 下一篇:具有孔的成型件及其制造方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置