[发明专利]一种基于自然语言预处理的公共数据分级方法在审
申请号: | 202010066138.7 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111274399A | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 陈磊;刘迎风;储昭武;管红;潘佳;唐若培;徐洁 | 申请(专利权)人: | 上海市大数据中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289;G06F40/211 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 吴轶淳 |
地址: | 200040 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及自然语言处理技术领域,具体涉及一种基于自然语言预处理的公共数据分级方法,包括:步骤S1,对公共数据进行自然语言处理方法的分析,得到关于所述公共数据的词集合和语义标注结果;步骤S2,对于所述词集合和所述语义标注结果按照多种规则组合,得到所述公共数据所包含的语义信息的向量化表征形式;步骤S3,利用分类系统对得到的所述公共数据所包含的语义信息的向量化表征形式分类计算概率估计值;步骤S4,根据所述概率估计值将所述概率估计值中最大项对应的数据敏感程度作为所述公共数据的分级标签。本发明可以大大提高公共数据分级效率、速度和准确率。 | ||
搜索关键词: | 一种 基于 自然语言 预处理 公共 数据 分级 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市大数据中心,未经上海市大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010066138.7/,转载请声明来源钻瓜专利网。
- 上一篇:标签提取方法、服务器及可读存储介质
- 下一篇:一种全地形车的尾气处理结构