[发明专利]微信舆情监测系统有效
申请号: | 201510010368.0 | 申请日: | 2015-01-09 |
公开(公告)号: | CN104504151B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 成都布林特信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 郭霞 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 监测 系统 | ||
1.一种微信舆情监测系统,该系统包括:数据获取单元(1)、噪声过滤去除单元(2)、初级处理单元(3)、特征串分析单元(4)、文本情感倾向性分析单元(5)、综合分析单元(6)、以及图表生成单元(7),其中
数据获取单元(1)用于对微信的页面数据进行自动爬取,获取微信数据;
噪声过滤去除单元(2)用于对微信数据中的信息进行过滤,清除所述微信数据中的噪声;
初级处理单元(3)用于对所述微信数据依次进行各种初级处理;
特征串分析单元(4)用于对初级处理单元(3)处理后的微信数据中的特征串进行分析筛选;
文本情感倾向性分析单元(5)用于对所述微信数据执行文本情感倾向性分析;
综合分析单元(6)并行地执行多种分布式舆情热点发现算法,获得微信数据中的舆情热点;
图表生成单元(7)用于生成各种微信舆情分析报表和/或分析图;
所述噪声过滤去除单元(2)执行以下步骤:
步骤2-1,对于每项微信数据,按照标题进行语义分析,检测出网络中与该微信数据相似的所有微信数据,得到该微信数据的相似组;如果未发现与该微信数据相似的微信数据,则该微信数据的相似组为其本身;
步骤2-2,对于每项微信数据,将网络中所有位置出现的该微信数据的相似组中所有微信数据的总数量除以发布该微信数据的相似组中所有微信数据的网络地址的总数量,得到该微信数据的空间重复度值S1;
步骤2-3,对于每项微信数据,计算网络中出现的该微信数据的相似组中所有微信数据的总数量,得到该微信数据的时间重复度值S2;
步骤2-4,根据每项微信数据的空间重复度值S1和时间重复度值S2计算该微信数据的综合重复度值S,并进行阈值判断,如果所述综合重复度值S超过阈值,则过滤掉该微信数据及其相似组;
其中,所述综合重复度值S通过以下公式计算:
S=(log2(S1+50))1/2+(log2(S2+20))1/2+((lgS1)*(lgS2))1/4。
2.根据权利要求1所述的微信舆情监测系统,其特征在于:
所述初级处理单元(3)对所述微信数据依次进行的各种初级处理包括:分词处理、过滤停用词、命名实体识别、语法解析、词性标注、情感识别、特征词提取、以及建立索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都布林特信息技术有限公司,未经成都布林特信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510010368.0/1.html,转载请声明来源钻瓜专利网。