[发明专利]微信舆情监测系统有效
申请号: | 201510010368.0 | 申请日: | 2015-01-09 |
公开(公告)号: | CN104504151B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 成都布林特信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 郭霞 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 监测 系统 | ||
技术领域
本发明涉及互联网信息处理技术领域,具体来讲,涉及一种微信舆情监测系统。
背景技术
随着互联网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。
网络舆情是一股强大的舆论力量,会反作用于热点事件并对社会发展和事态进程产生一定的影响。由于网络的开放性,会导致网络舆情形成迅速,对社会影响巨大。特别是当出现负面的网络微信舆情时,若不能及时了解、有效引导,很容易形成舆论危机,严重时甚至影响公共安全。对网络微信舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。
最近,随着互联网技术的迅速发展,以微信为代表的新一代媒体打破信息的控制和垄断,在网络上人们自由表达自己的态度和意见,不再像过去那么容易地无条件接受,相反,不同阶层的利益诉求纷纷呈现,不同思想观点正面碰撞。对相关政府部门来说,如何及时准确的了解网络微信舆情,加强对网络微信舆论的及时监测、有效引导,成为网络微信舆情管理的一大难点。在这种情况下,建设能够覆盖微信数据源的微信舆情监测系统十分必要,此类系统可针对新的微信媒介传播环境,进一步深入研究微信舆情的热点研判方法以及新媒体带来的影响,对微信舆情研究进行丰富和完善。
虽然目前已经有很多单位针对网络微信舆情监控提出了一些不同的解决方案。但是,需要本领域技术人员解决的技术问题是如何提高判断网络微信舆情信息的效率和精确度。因为截至目前,尚未有较为高效、准确的针对微信媒体数据的网络舆情监测系统。
发明内容
本发明就是针对上述背景技术中的不足之处,而提出的一种微信媒体的舆情监测系统,其具有较高的准确率。本发明的目的是通过如下技术措施来实现的。
本发明提出一种微信舆情监测系统,该系统包括:数据获取单元1、噪声过滤去除单元2、初级处理单元3、特征串分析单元4、文本情感倾向性分析单元5、综合分析单元6、以及图表生成单元7,其中
数据获取单元1用于对微信的页面数据进行自动爬取,获取微信数据;
噪声过滤去除单元2用于对微信数据中的信息进行过滤,清除所述微信数据中的噪声;
初级处理单元3用于对所述微信数据依次进行各种初级处理;
特征串分析单元4用于对初级处理单元3处理后的微信数据中的特征串进行分析筛选;
文本情感倾向性分析单元5用于对所述微信数据执行文本情感倾向性分析;
综合分析单元6并行地执行多种分布式舆情热点发现算法,获得微信数据中的舆情热点;
图表生成单元7用于生成各种微信舆情分析报表和/或分析图。
可选地,所述噪声过滤去除单元2执行以下步骤:
步骤2-1,对于每项微信数据,按照标题进行语义分析,检测出网络中与该微信数据相似的所有微信数据,得到该微信数据的相似组;如果未发现与该微信数据相似的微信数据,则该微信数据的相似组为其本身;
步骤2-2,对于每项微信数据,将网络中所有位置出现的该微信数据的相似组中所有微信数据的总数量除以发布该微信数据的相似组中所有微信数据的网络地址的总数量,得到该微信数据的空间重复度值S1;
步骤2-3,对于每项微信数据,计算网络中出现的该微信数据的相似组中所有微信数据的总数量,得到该微信数据的时间重复度值S2;
步骤2-4,根据每项微信数据的空间重复度值S1和时间重复度值S2计算该微信数据的综合重复度值S,并进行阈值判断,如果所述综合重复度值S超过阈值,则过滤掉该微信数据及其相似组;
其中,所述综合重复度值S通过以下公式计算:
S=(log2(S1+50))1/2+(log2(S2+20))1/2+((lgS1)*(lgS2))1/4。
可选地,所述初级处理单元3对所述微信数据依次进行的各种初级处理包括:分词处理、过滤停用词、命名实体识别、语法解析、词性标注、情感识别、特征词提取、以及建立索引。
可选地,所述特征串分析单元4执行以下步骤:
步骤4-1,对特征串进行去重,包括:记录微信的文本中出现的重复性特征串以及其出现的次数,过滤掉出现频率低于重复阈值的重复性特征串和长度低于重复阈值的重复性特征串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都布林特信息技术有限公司,未经成都布林特信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510010368.0/2.html,转载请声明来源钻瓜专利网。