[发明专利]一种互联网舆情信息监测系统及监测方法有效
申请号: | 201310206112.8 | 申请日: | 2013-05-29 |
公开(公告)号: | CN103268350B | 公开(公告)日: | 2017-02-08 |
发明(设计)人: | 胡玉龙;李元;方谋富;石琴方;杨毛毛;李晓徽 | 申请(专利权)人: | 安徽雷越网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 合肥天明专利事务所34115 | 代理人: | 金凯 |
地址: | 230088 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种互联网舆情信息监测系统及监测方法,该系统包括采集模块、数据预处理模块、存储处理模块、服务监控模块与显示模块;所述采集模块的输出端与数据预处理模块的输入端通过有线连接,所述数据预处理模块与存储处理模块通过有线连接,所述服务监控模块与存储处理模块通过有线连接,所述存储处理模块与显示模块通过有线连接。本发明还提供一种互联网舆情信息监测方法。本发明集信息采集、分析处理、服务监控、存储、显示于一体,自动发现并深入分析互联网信息热点,帮助用户方便快捷地了解舆情事件的来龙去脉。 | ||
搜索关键词: | 一种 互联网 舆情 信息 监测 系统 方法 | ||
【主权项】:
一种互联网舆情信息监测方法,其特征在于:包括以下步骤:1)对互联网上的舆情信息进行采集,获取网页数据;2)对获取的网页数据进行分词及语义分析预处理并将预处理结果进行存储;3)对存储的预处理结果进行统计,形成统计图表,并将形成的统计图表进行存储,以及对达到预警阈值的信息进行预警通知;4)对存储的数据进行结果显示;步骤2)中,对获取的网页数据进行分词及语义分析预处理,具体包括以下步骤:采用基于球面四叉树的多级Hash结构的分词机制对获取的网页数据进行分词处理,分词的同时根据词的语法属性、情感属性、词类属性进行词性标注,解析出词语的倾向性、主题属性;根据汉语句子的构造原则,对分词处理后的网页数据文本进行句子切分,抽取文本的每一个句子,然后对每个句子进行句法分析,将整个文本的句子的语法形成语法网状规则图;根据语义建立语义规则库,根据语义规则库将语法网状规则图通过点对点映射,转换为语义概念图;根据语义概念图判断每个网页上的文章热点指数、情感倾向性指数,分析文章主题;所述基于球面四叉树的多级Hash结构的分词机制的构建包括以下步骤:依次对每个字建立Hash索引,构成多级TRIE树;所述TRIE树的结点构成Hash桶,将每个Hash桶内存放多个具有相同的前N个字的词,N为正整数;用循环算法对建立的每一级Hash桶内的词的个数进行计算,若计算结果大于预先设定的阈值,则以该Hash桶为基础建立下一级的Hash桶,直至每个Hash桶内的词的数量均小于或等于阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽雷越网络科技有限公司,未经安徽雷越网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310206112.8/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置