[发明专利]多语种网络舆情分析方法在审
申请号: | 201410663294.6 | 申请日: | 2014-11-19 |
公开(公告)号: | CN105893368A | 公开(公告)日: | 2016-08-24 |
发明(设计)人: | 宁勇 | 申请(专利权)人: | 北京航天长峰科技工业集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种多语种网络舆情分析方法,包括(1)采用基于云计算的分布式爬虫设计,将监控的网站分担到各个下载服务器上进行分布式下载,然后将数据汇总在数据服务器上;(2)对网络数据进行去重、去噪处理,即对同一网站上基本内容相同的数据进行去重,同时进行广告、不相关信息的去噪;(3)海量数据的高速检索,即对数据服务器上的海量数据内容,采用高速分布式检索算法,利用云计算资源对数据进行快速的查询和检索,并建立索引;(4)建立海量数据管理系统,对海量数据依托时间轴进行读写管理;(5)采用人工智能技术,对海量数据进行自动处理,然后经过分析,得出准确的监控内容,并提出预警信息。 | ||
搜索关键词: | 语种 网络 舆情 分析 方法 | ||
【主权项】:
一种多语种网络舆情分析方法,其特征在于:(1)采用基于云计算的分布式爬虫设计,将监控的网站分担到各个下载服务器上进行分布式下载,然后将数据汇总在数据服务器上;(2)对网络数据进行去重、去噪处理,即对同一网站上基本内容相同的数据进行去重,同时进行广告、不相关信息的去噪;(3)海量数据的高速检索,即对数据服务器上的海量数据内容,采用高速分布式检索算法,利用云计算资源对数据进行快速的查询和检索,并建立索引;(4)建立海量数据管理系统,对海量数据依托时间轴进行读写管理;(5)采用人工智能技术,对海量数据进行自动处理,然后经过分析,得出准确的监控内容,并提出预警信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长峰科技工业集团有限公司,未经北京航天长峰科技工业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410663294.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种手术辅助摄录照明系统
- 下一篇:一种设置收纳盒的节能双面床头灯