[发明专利]一种网络文本舆情分类的方法及系统有效
申请号: | 201611260608.3 | 申请日: | 2016-12-30 |
公开(公告)号: | CN107045524B | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 胥桂仙 | 申请(专利权)人: | 中央民族大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 11309 北京亿腾知识产权代理事务所(普通合伙) | 代理人: | 陈霁 |
地址: | 100081 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种网络文本舆情分类的方法及系统,该方法包括以下步骤:构建敏感词词表;将敏感词词表分类成多个敏感类别,每个敏感类别包含多个关键词;通过第一相似度算法将多个关键词与网络文本进行匹配,根据匹配结果对网络文本进行舆情分类。该系统包括:处理模块和匹配模块。本发明通过对文本处理获取阶段时间内人们关注的热点信息;利用敏感词词库对网络文本实现了自动化分类工作,适用于网络舆情监测、敏感信息过滤、重大新闻事件追踪等应用,可以为决策层全面掌握舆情动态提供分析依据,提供服务并助于相关信息技术工作。 | ||
搜索关键词: | 一种 网络 文本 舆情 分类 方法 系统 | ||
【主权项】:
1.一种网络文本舆情分类的方法,其特征在于,包括以下步骤:/n构建敏感词词表;/n对所述网络文本进行分词和去停用词处理,获得第一网络文本;根据所述敏感词词表获得所述第一网络文本中的敏感词;根据词权重计算算法确定所述敏感词中的热度敏感词;对所述热度敏感词和所述第一网络文本进行第二相似度算法计算,并根据计算结果对所述第一网络文本进行舆情分类;/n将所述敏感词词表分类成至少一个敏感类别,每个敏感类别包含至少一个关键词;/n将所述至少一个关键词与网络文本进行匹配,获得匹配结果,根据第一相似度算法及匹配结果对所述网络文本进行舆情分类;其中,/n所述第一相似度算法的公式如下所示:/nSim[D
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中央民族大学,未经中央民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611260608.3/,转载请声明来源钻瓜专利网。