[发明专利]一种基于NER的检查报告隐私处理方法在审

专利信息
申请号: 202211163813.3 申请日: 2022-09-23
公开(公告)号: CN115525925A 公开(公告)日: 2022-12-27
发明(设计)人: 刘杰;黄佳俊 申请(专利权)人: 上海触脉数字医疗科技有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F40/295;G06N3/04;G06N3/08;G06V10/82;G06V30/10
代理公司: 南京金宁专利代理事务所(普通合伙) 32479 代理人: 董武洲
地址: 201100 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 ner 检查 报告 隐私 处理 方法
【说明书】:

发明公开了一种基于NER的检查报告隐私处理方法,涉及报告单隐私处理技术领域,本发明包括以下步骤,首先用户上传报告单图片;然后识别模块主要用于对报告单图片上的名称实体进行识别,再然后在识别模块内建立NER模型,并训练NER模型;接着利用中文OCR技术,识别用户上传检查报告的报告单图片上的文字,并使用训练好的hanlp分词模型,对识别出来的文字进行分词,接着使用训练好的NER模型,对分词结果进行实体提取,返回实体所在图片上面的位置信息,以Box形状描绘出分词实体四顶点坐标,接着对隐私进行脱敏化;最后输出隐私脱敏后的报告单图片。本发明为一种基于NER的检查报告隐私处理方法,有效保护患者上传检查报告单图片时出现信息泄露。

技术领域

本发明涉及报告单隐私处理技术领域,特别涉及一种基于NER的检查报告隐私处理方法。

背景技术

随着互联网医疗的兴起,各种在线问诊和在线咨询应用需要患者提供各种检查报告,以便更好地提供服务,但是,各种检查报告图片内容中有着许多个人敏感的信息,如:姓名、联系电话、地址信息等,虽然各种应用在患者隐私保护上提供了声明,可以从技术手段上对一般明文信息进行脱敏保护,但是无法对患者各种上传图片上的隐私信息进行保护,只有患者本人通过主动打码来干预才能实现个人信息脱敏,为加强个人信息保护提供了法律保障,基于此,我们提出了这样一种从技术方法上对多媒体图片信息上的隐私进行去隐私化处理。

发明内容

本发明的主要目的在于提供一种基于NER的检查报告隐私处理方法,可以有效解决背景技术中的现有的互联网医疗中患者上传检查报告单时需要手动打码防止个人信息泄露,较为繁琐。

为实现上述目的,本发明采取的技术方案为:一种基于NER的检查报告隐私处理方法,包括以下步骤:

S1:用户通过用户端口上传检查报告的报告单图片;

S2:设立识别模块,识别模块主要用于对报告单图片上的名称实体进行识别,得到报告单上名称实体信息;

S201:所述识别模块内建立NER模型,并训练NER模型,在训练NER模型过程中使用《人民日报》语料库进行具体训练,重点标注姓名、联系电话、地址、证件号、亲属关系的实体;

S202:在训练NER模型过程中对于序列标注任务,例如CWS、POS、NER的处理方式是将名称实体中的身份认证令牌从离散one-hot独热码表示映射到低维空间中成为稠密的embedding中;

S203:将名称实体的embedding序列输入到RNN中,用神经网络自动提取特征;

S204:使用Softmax回归来预测每个身份认证令牌的标签,完成NER模型的构造以及训练;

S3:利用中文OCR技术,识别用户上传检查报告的报告单图片上的文字,并使用训练好的hanlp分词模型,对识别出来的文字进行分词,实现完成姓名、登记号、住院号以及病号的信息NER识别;

S4:使用训练好的NER模型,对分词结果进行实体提取,返回实体所在图片上面的位置信息,以Box形状描绘出分词实体四顶点坐标,例如使用训练好的NER模型,对分词结果进行实体提取,返回实体所在图片上面的位置信息,以Box形状描绘出四点坐标;

S5:根据报告单图片上的Box坐标位置,利用图像处理技术,对Box范围的内容进行模糊处理,从而对隐私实体内容进行屏蔽处理,实现隐私脱敏化,实现将报告单图片上的重要信息进行打码覆盖,在各种需要传送图片检查报告的互联网应用上,实现隐私数据的脱敏;对一般可OCR的内容中的隐私数据进行脱敏;

S6:输出隐私脱敏后的报告单图片。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海触脉数字医疗科技有限公司,未经上海触脉数字医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211163813.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top