[发明专利]基于网络离散文本的舆情信息分析方法无效
申请号: | 201110030156.0 | 申请日: | 2011-01-26 |
公开(公告)号: | CN102110140A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | 赵峰;李生红;陈秀真;李海燕;黄慧琼 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 巢雄辉 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种网络信息安全领域的基于网络离散文本的舆情信息分析系统,包括以下模块:离散文本信息采集模块,按设定的分析周期对网络信息进行采集;离散文本信息追踪与复原模块,对原内容省略之处和远程指代之处进行复原,得到包含较为完整的篇章结构和语义信息的文本;语义信息挖掘与特征提取模块,利用潜在语义索引技术实现对文本信息的语义挖掘和特征提取;舆情信息聚类模块,通过将小生境遗传算法和K-Means方法相结合实现对信息的聚类;热点舆情事件发现模块,对聚类得到的话题和事件进行热点舆情挖掘;后台信息处理和数据支持中心,分析数据并提供网络专用用语库、网络新词、已有类别信息和已有热点话题等。本发明解决现有网络舆情信息篇章结构不完整、内容省略和远程指代多、网络新词多等对信息分析的影响,并用高效聚类方法提高舆情热点事件发现的准确性。 | ||
搜索关键词: | 基于 网络 离散 文本 舆情 信息 分析 方法 | ||
【主权项】:
基于网络离散文本的舆情信息分析方法,包括离散文本信息采集、离散文本信息处理,以及相应的数据库,其特征在于:包括如下步骤:a.离散文本信息采集模块首先按设定的分析周期对网络信息进行采集,保存到本地数据库;b.接下来,离散文本信息追踪与复原模块对原内容省略之处和远程指代之处复原;c.在步骤b基础上,语义信息挖掘与特征提取模块利用潜在语义索引技术对文本信息进行语义挖掘和特征提取;d.由步骤c得到的数据进入舆情信息聚类模块,通过小生境遗传算法和K‑Means方法相结合进行信息的聚类;同时,由后台信息处理和数据支持中心的数据指导类别信息对网络信息进行话题和事件聚类;e.最后由热点舆情事件发现模块对聚类得到的话题和事件进行热点舆情挖掘,得到最终的处理结果,交至系统管理员。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110030156.0/,转载请声明来源钻瓜专利网。
- 上一篇:多功能太阳能畜舍单元模块
- 下一篇:食用菌袋装机绞龙头装置