[发明专利]内存数据库中的数据匿名化有效
| 申请号: | 201810801610.X | 申请日: | 2018-07-20 |
| 公开(公告)号: | CN109711186B | 公开(公告)日: | 2023-01-20 |
| 发明(设计)人: | X.黄 | 申请(专利权)人: | SAP欧洲公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
| 地址: | 德国瓦*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 内存 数据库 中的 数据 匿名 | ||
1.一种计算机实施的方法,包括:
识别与输入表的数据相对应的文本属性,其中所述数据包括跨多个记录存储的个人信息,以用于基于至少一个阈值的匿名化,所述阈值针对所述数据的一个或多个组中的每个组中所需的值的数量;
确定与多个记录中的每个记录的文本属性相对应的值,所述值包括一个或多个字符;
基于所确定的值生成多个组,其中每个组包括一个或多个值,并且每个组中的值共享一个或多个共同的字符;
提供被分类为多个组的数据的至少一部分,其中每个所提供的组的值的计数满足阈值;
确定文本属性和至少一个其他属性中的每一个属性的宽度,其中所述宽度指示与各个属性相对应的值的范围,表示通过匿名化的数据丢失;以及
基于文本属性的宽度大于至少一个其他属性的宽度来选择文本属性。
2.如权利要求1所述的方法,其中,所述提供包括:
确定针对多个组中的特定组的值的计数小于阈值;以及
抑制小于阈值的特定组,其中所述提供包括提供分类为除特定组之外的多个组中的数据。
3.如权利要求1所述的方法,其中,所述数据的个人信息包括:
显式标识符属性,所述数据的特定记录根据所述显式标识符属性与所述数据的一个或多个剩余记录区分开,并且其中基于所述显式标识符识别与所述记录相对应的个体;
第一准标识符属性,当一起考虑所述第一准标识符属性与多个第二准标识符标识符属性时,识别与所述记录相对应的个体;以及
敏感数据属性,其包括与个体相对应的个人信息。
4.如权利要求3所述的方法,其中,所述文本属性与第一准标识符属性相对应。
5.如权利要求1所述的方法,其中,所述识别包括除了识别所述文本属性之外还识别数字属性和分层属性。
6.如权利要求1所述的方法,其中,所述选择还包括:
确定与文本属性相对应的权重;
确定与至少一个其他属性相对应的权重;
确定文本属性和至少一个其他属性两者的加权宽度;和
基于文本属性的加权宽度大于至少一个其他属性的宽度来选择文本属性。
7.一种系统,包括:
存储器;和
至少一个处理器,被耦合到所述存储器并被配置为:
识别与输入表的数据相对应的文本属性,其中所述数据包括跨多个记录存储的个人信息,以用于基于至少一个阈值的匿名化,所述阈值针对所述数据的一个或多个组中的每个组中所需的值的数量;
确定与多个记录中的每个记录的文本属性相对应的值,所述值包括一个或多个字符;
基于所确定的值生成多个组,其中每个组包括一个或多个值,并且每个组中的值共享一个或多个共同的字符;
提供被分类为多个组的数据的至少一部分,其中每个所提供的组的值的计数满足阈值;
确定文本属性和至少一个其他属性中的每一个属性的宽度,其中宽度指示与各个属性相对应的值的范围,表示通过匿名化的数据丢失;并且
基于文本属性的宽度大于至少一个其他属性的宽度来选择文本属性。
8.如权利要求7所述的系统,其中,所述执行提供的处理器还被配置为:
确定所述多个组中特定组的值的计数小于阈值;以及
抑制小于阈值的特定组,其中所述提供包括提供被分类为除特定组之外的多个组的数据。
9.如权利要求7所述的系统,其中,所述数据的个人信息包括:
显式标识符属性,所述数据的特定记录根据所述显式标识符属性与所述数据的一个或多个剩余记录区分开,并且其中基于显式标识符识别与所述记录相对应的个体;
第一准标识符属性,当一起考虑第一准标识符属性与多个第二准标识符标识符属性时,识别与所述记录相对应的个体;以及
敏感数据属性,其包括与个体相对应的个人信息。
10.如权利要求9所述的系统,其中,所述文本属性与所述第一准标识符属性相对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810801610.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





