[发明专利]内存数据库中的数据匿名化有效
| 申请号: | 201810801610.X | 申请日: | 2018-07-20 |
| 公开(公告)号: | CN109711186B | 公开(公告)日: | 2023-01-20 |
| 发明(设计)人: | X.黄 | 申请(专利权)人: | SAP欧洲公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
| 地址: | 德国瓦*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 内存 数据库 中的 数据 匿名 | ||
本文公开了用于内存数据库中的数据匿名化的系统、方法和计算机程序产品实施例。实施例通过识别与输入表的数据相对应的文本属性来操作。对于多个记录中的每个记录确定与文本属性相对应的值。基于所确定的值生成多个组。提供被分类为多个组的至少一部分数据。
相关申请的交叉引用
本申请涉及在此提交的标题为“在内存数据库中自下而上的数据匿名化(BottomUp Data Anonymization In An In-Memory Database)”(Atty Dkt编号1933.4330000)的美国专利申请第15/794,779号,以及在此提交的标题为“内存数据库中的K-匿名和L-多样性数据匿名化(K-Anonymity and L-Diversity Data Anonymization In An In-MemoryDatabase)”(Atty Dkt编号1933.4320000)的美国专利申请第15/794,744号。所有这些文献都通过引用整体并入本文。
技术领域
本公开涉及内存数据库中的数据匿名化。
背景技术
数据匿名化是一种数据隐私技术,其中来自数据库的数据的个人信息通过删除或加密来保护,使得无法识别与该信息相关的个体。数据匿名化可以被用于保护其数据已经被收集的个体或公司的隐私,同时维护正在被共享的已发布数据的完整性。用于匿名化数据的当前技术通常适用于数字数据或分层数据,而不适用于其他类型的数据,诸如文本数据,因此限制了可用的匿名化选项。
发明内容
本公开的一方面涉及一种计算机实施的方法。该方法包括:识别与输入表的数据相对应的文本属性,其中数据包括跨多个记录存储的个人信息,以用于基于至少一个阈值的匿名化,阈值针对数据的一个或多个组中的每个组中所需的值的数量;确定与多个记录中的每个记录的文本属性相对应的值,值包括一个或多个字符;基于所确定的值生成多个组,其中每个组包括一个或多个值,并且每个组中的值共享一个或多个共同的字符;以及提供被分类为多个组的数据的至少一部分,其中每个所提供的组的值的计数满足阈值。
本公开的另一方面涉及一种系统。该系统包括:存储器;和至少一个处理器,其被耦合到存储器并被配置为:识别与输入表的数据相对应的文本属性,其中数据包括跨多个记录存储的个人信息,以用于基于至少一个阈值的匿名化,阈值针对数据的一个或多个组中的每个组中所需的值的数量;确定与多个记录中的每个记录的文本属性相对应的值,值包括一个或多个字符;基于所确定的值生成多个组,其中每个组包括一个或多个值,并且每个组中的值共享一个或多个共同的字符;并且提供被分类为多个组的数据的至少一部分,其中每个所提供的组的值的计数满足阈值。
本公开的另一方方面涉及一种非暂时性计算机可读设备,非暂时性计算机可读设备具有存储在其上的指令,当由至少一个计算设备执行指令时,使得至少一个计算设备执行包括以下的操作:识别与输入表的数据相对应的文本属性,其中数据包括跨多个记录存储的个人信息,以用于基于至少一个阈值的匿名化,阈值针对数据的一个或多个组中的每个组中所需的值的数量;确定与多个记录中的每个记录的文本属性相对应的值,值包括一个或多个字符;基于所确定的值生成多个组,其中每个组包括一个或多个值,并且每个组中的值共享一个或多个共同的字符;以及提供被分类为多个组的数据的至少一部分,其中每个所提供的组的值的计数满足阈值。
附图说明
附图结合于此并形成说明书的一部分。
图1是示出根据一些实施例的内存数据库中的示例性数据匿名化功能的框图。
图2是示出根据一些实施例的用于数据匿名化的过程的流程图。
图3是可用于实施各种实施例的示例性计算机系统。
图4是示出根据实施例的针对分层数据类型的示例性数据匿名化功能的框图。
图5是示出根据实施例的针对文本数据类型的示例性数据匿名化功能的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810801610.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





