[发明专利]针对非结构化文本的个人隐私信息自动检测方法及系统有效
申请号: | 201910147987.2 | 申请日: | 2019-02-28 |
公开(公告)号: | CN109960727B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 柯永振;韩亚雄;杨帅;郭景 | 申请(专利权)人: | 天津工业大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 北京知舟专利事务所(普通合伙) 11550 | 代理人: | 郭韫 |
地址: | 300387 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种针对非结构化文本的个人隐私信息自动检测方法及系统,属于信息处理领域。该方法首先将非结构化文本划分为含有隐私信息的文本和不含有隐私信息的文本,然后从所述含有隐私信息的文本中识别出实体类信息,最后计算每个所述实体类信息在含有隐私信息的文本中的权重和在不含有隐私信息的文本中的权重,并根据得到的两个权重判断每个实体信息是否属于实体类隐私信息。本发明能够检测出文本中实体类的隐私信息,且具有非常大的实用价值,有效地替代了传统的人工检测方法,且大大提高了检测效率,降低了人员成本,为政府数据开放提供了强有力的技术支持。 | ||
搜索关键词: | 针对 结构 文本 个人隐私 信息 自动检测 方法 系统 | ||
【主权项】:
1.一种针对非结构化文本的个人隐私信息自动检测方法,其特征在于:所述方法首先将非结构化文本划分为含有隐私信息的文本和不含有隐私信息的文本,然后从所述含有隐私信息的文本中识别出实体类信息,最后计算每个所述实体类信息在含有隐私信息的文本中的权重和在不含有隐私信息的文本中的权重,并根据得到的两个权重判断每个实体信息是否属于实体类隐私信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津工业大学,未经天津工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910147987.2/,转载请声明来源钻瓜专利网。