[发明专利]一种网络舆情监控方法及系统有效
申请号: | 201210586811.5 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103902619B | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 韩金宇;孙少陵 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06F17/28 |
代理公司: | 北京睿博行远知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种网络舆情监控方法及系统,该方法包括:采集待分析文本;检测所述待分析文本的语种,提取所述待分析文本的特征词;根据所述待分析文本的特征词,查询所述待分析文本的语种到基准语言语种的翻译词典,得到所述待分析文本的特征词在基准语言中的译文;计算基准语言热点舆情与所述待分析文本的特征词在基准语言中的译文的相似度,并根据计算结果,确定所述待分析文本与所述基准语言热点舆情的相关度,从而得到与基准语言热点舆情相关的其他语种的网络舆情信息,使得网络舆情监控的范围不再局限于基准语言的范围,提高网络舆情监控的有效性和广泛性。 | ||
搜索关键词: | 一种 网络 舆情 监控 方法 系统 | ||
【主权项】:
1.一种网络舆情监控方法,其特征在于,包括:采集待分析文本;检测所述待分析文本的语种,提取所述待分析文本的特征词;根据所述待分析文本的特征词,查询所述待分析文本的语种到基准语言语种的翻译词典,得到所述待分析文本的特征词在基准语言中的译文;计算基准语言热点舆情与所述待分析文本的特征词在基准语言中的译文的相似度,并根据计算结果,确定所述待分析文本与所述基准语言热点舆情的相关度;其中,所述采集待分析文本,具体包括:采集网络文本,确定所述网络文本的类别;判断所述网络文本的类别与基准语言热点舆情的类别是否相同,若相同,则将所述网络文本确定为待分析文本;所述网络文本是通过普通网页、动态网页、论坛评论、搜索引擎渠道中采集得到;提取所述待分析文本的特征词,具体包括:对所述待分析文本进行分词,得到词串;根据所述词串的词频、词长、词性权重、在文本中的段落分布,计算词串权重;将词串权重高于预设阈值的词串确定为所述待分析文本的特征词;所述词串是从待分析文本断句中生成的句子分词,且词串至少由2个词所组成。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210586811.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种海量移动目标聚合的方法及装置
- 下一篇:一种电动汽车用地面智能充电机结构