[发明专利]文本脱敏方法、装置、电子设备和计算机可读存储介质在审
申请号: | 202010795184.0 | 申请日: | 2020-08-10 |
公开(公告)号: | CN112001174A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 代庆国;罗英群;吕令广 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F40/279;G06F40/216;G06F16/335;G06F21/62 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;王淑梅 |
地址: | 518109 广东省深圳市龙华*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种文本脱敏方法、装置、电子设备和计算机可读存储介质。其中,文本脱敏方法包括:获取待处理文本和隐马尔科夫模型;根据分词库对待处理文本进行分词处理,得到词汇信息;根据词汇信息和隐马尔科夫模型,确定词汇信息对应的语境信息;基于语境信息满足预设语境信息,则对词汇信息进行脱敏处理。本发明提出的方法,通过隐马尔科夫模型识别非结构化文本的语境,能够进一步筛选隐私词语,提高隐私词语的识别精度,满足不同用户的脱敏需求,有效提高隐私词语的识别处理效率,而且避免使用正则的方式进行查找隐私数据,无需强制用户编辑任何数据规则,降低用户工作量,同时,防止人工标注的人为的错误。 | ||
搜索关键词: | 文本 方法 装置 电子设备 计算机 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010795184.0/,转载请声明来源钻瓜专利网。