[发明专利]一种敏感信息脱敏及识别系统在审
申请号: | 202310257477.7 | 申请日: | 2023-03-16 |
公开(公告)号: | CN116502258A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 张发宝;李欣梅 | 申请(专利权)人: | 上海梅斯医药科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G16H15/00 |
代理公司: | 上海京沪专利代理事务所(普通合伙) 31235 | 代理人: | 马强 |
地址: | 200000 上海市松江区上海漕河泾*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 信息 识别 系统 | ||
本发明公开了一种敏感信息脱敏及识别系统,具体涉及数据处理技术领域,包括患者敏感信息识别模块、患者敏感信息分级模块、隐私信息定义及标注模块、文字数据脱敏模块,图像数据脱敏模块以及数据验证模块,所述患者敏感信息识别模块建立一个发现规则,录入数据与数据库进行链接,通过发现规则在数据库中进行匹配,本发明通过对患者数据交互过程中患者敏感信息脱敏及格式限制的方法,通过对患者敏感信息进行识别与敏感级分级,实现对患者信息的脱敏处理,对脱敏后用户信息的输出格式进行限制,采用脱敏、简码标注以及图片隐写技术,实现脱敏后多重校正隐私信息。
技术领域
本发明涉及数据处理技术领域,更具体地说,本发明涉及一种敏感信息脱敏及识别系统。
背景技术
敏感数据对于个人数据所有者而言,具有一定的财产属性,数据所有者依法拥有对敏感数据的所有权、占有权、支配权、使用权以及处置权的相关权利,在信息共享的过程中,是数据所有者行使支配权以及使用权的过程,随着关系数据的分支和授权使用,使敏感数据的泄露问题日益严重。
传统的方法在数据交互的过程中用户敏感数据脱敏处理效果不理想,脱敏处理时间较长,临床研究中为了提高研究效率,现在普遍采用手机拍照病例和化验单,然后脱敏上传,然后采用OCR识别的方式进行,然而,关键信息一旦脱敏,就无法判断化验单的真实性。如果不脱敏,则有隐私信息泄露的风险,这是目前制约数字化技术开展临床研究的关键瓶颈。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种敏感信息脱敏及识别系统,通过文字数据脱敏模块模块,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:包括患者敏感信息识别模块、患者敏感信息分级模块、隐私信息定义及标注模块、文字数据脱敏模块,图像数据脱敏模块以及数据验证模块,所述患者敏感信息识别模块建立一个发现规则,录入数据与数据库进行链接,通过发现规则在数据库中进行匹配,所述患者敏感信息分级模块根据患者信息的敏感程度,将数据信息划分为两个不同的等级,所述隐私信息定义及标注模块,对患者的基础信息进行简码标注,所述文字数据脱敏模块构建一个替换词典,将能够替换的候选值加入到替换词典中,在进行数据脱敏时,随机选取一个替换值,根据固定的规则进行重新排序,所述图像数据脱敏模块通过算法对图像数据进行脱敏处理,所述数据验证模块,通过数据简码以及图像脱敏进行联合验证,验证不同化验单与患者信息的一致性。
在一个优选地实施方式中,所述患者敏感信息识别模块在患者数据录入阶段,通过与录入数据源的链接,实现对数据源连通性的检验,得到局部数据与元数据,对所得到的数据实施一次用户敏感信息的初步识别,对所获得的数据实施识别,依据这个数据的类别与内容实施患者的敏感信息识别,采用敏感信息识别引擎实现对患者敏感信息的识别,识别方式包括数据库、规则以及自然语言处理内的特征词提取,对患者的数据字段储存在敏感字段的识别库中,在敏感信息识别的任务过程中,重点识别长的数据字段,以此提升患者敏感信息识别与敏感信息脱敏的效率,以患者录入的数据为依据,解析数据库中的全部语句,由敏感信息数据库中将敏感信息识别出,根据发现规则中配置的数据特征,结合字段类型与样本数据,对数据库中的字段数据进行对比分析,得到与发现规则的匹配度,匹配度达到设定的阈值时,认定发现规则匹配,样本数据越多,敏感对象的识别率越高,通过对数据的采样分析,能够快速梳理出具有隐私特性的元数据,自动发现敏感数据,探测数据包括姓名、证件号、银行账户、住址以及电话号码,对这些敏感数据进行提醒,能够通过引导的方式直接进入脱敏规则的配置。
在一个优选地实施方式中,所述患者敏感信息分级模块是保护数据交互过程中患者敏感信息的重点,以患者敏感信息的可用性、完整性以及机密性为依据,划分所识别到的患者敏感信息等级,将数据信息划分为两个等级,划分时需要考虑患者的相关信息泄露带来潜在的威胁与导致经济损失的程度,基于对等级划分关键因素的考量,完成对数据交互过程中的用户敏感信息的敏感等级划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海梅斯医药科技有限公司,未经上海梅斯医药科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310257477.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种火电厂安全监控装置
- 下一篇:一种基于5G车载触摸屏的高精度触控面板
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置