[发明专利]一种舆情分析系统在审

专利信息
申请号: 202211314749.4 申请日: 2022-10-26
公开(公告)号: CN115599981A 公开(公告)日: 2023-01-13
发明(设计)人: 单建炜;陈阳 申请(专利权)人: 苏州瑞泰信息技术有限公司
主分类号: G06F16/951 分类号: G06F16/951;G06F16/245;G06F16/248;G06F16/28;G06F16/81;G06F16/84;G06F40/30;G06Q30/02;G06Q50/00
代理公司: 北京科家知识产权代理事务所(普通合伙) 11427 代理人: 曹振中
地址: 215000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 舆情 分析 系统
【说明书】:

发明公开了一种舆情分析系统,涉及网站用户评论语义分析技术领域,包括数据收集模块、数据解析模块、数据存储模块、数据分析模块和数据展示模块,数据收集模块用于获取网站页面HTML数据;数据解析模块用于解析数据收集模块获取的网站页面HTML数据;数据存储模块用于存储数据解析模块解析得到的数据;本发明的有益效果为:该系统可以更加直观的展现出用户对产品、事件的情感,根据用户评论的情绪及云图展示出用户关注点,对产品进行及时的改善以及对事件发展的方向进行及时的调控,从而降低了分析时间以及人工成本,并提高实际的工作效率,而且收集数据的及时性好,且数据分析全面彻底。

技术领域

本发明涉及网站用户评论语义分析技术领域,具体为一种舆情分析系统。

背景技术

随着互联网技术以及国民经济的不断发展,参与互联网社交的人数日益增长,孕育出越来越多的社交平台,使得互联网中的“网民声音”与日俱增。这些“网民声音”在互联网发展中,慢慢形成网络舆情,这些舆情对事物影响及事件的发展都有着重要的意义。所以,为了更好的改进事件及发展事件,对舆情的语义分析也成为互联网大数据分析的主流。

在消费品行业,品牌商会在各大社交平台进行新品发布、活动预热。当经过一段时间后,需要对用户的反馈信息进行收集,来分析用户对新品及活动的情绪。

品牌商通常会安排运营人员,去各个平台收集用户言论数据,收集方式通常都是人工浏览社交平台下的数据,将其统计到Excel中,并逐一人工分析用户的对新品及活动的情绪。

现有技术存在的不足之处在于:首先,通过人工搜集用户言论数据,效率地下,且增加了分析时间、人工成本;其次,社交平台种类繁多,人工收集往往不够及时,且会漏统计,导致数据分析不全面;还有,用户言论数据收集后,只能简单分析用户对产品的情绪,无法直观的展示收集的数据。

发明内容

针对背景技术中提出的现有技术的问题,本发明提供了一种舆情分析系统,解决了上述背景技术中提出的问题。

为实现以上目的,本发明通过以下技术方案予以实现:一种舆情分析系统,包括:

数据收集模块,用于获取网站页面HTML数据;

数据解析模块,用于解析数据收集模块获取的网站页面HTML数据;

数据存储模块,用于存储数据解析模块解析得到的数据;

数据分析模块,用于对数据存储模块中存在的数据进行分析;以及数据展示模块,用于进行用户评论汇总展示、云图展示等工作。

优选的,所述数据收集模块包括开源包requests,该开源包requests用于HTTP请求,以获取网站页面数据。

优选的,所述数据解析模块包括:

开源爬虫框架Scrapy,所述开源爬虫框架Scrapy用于抓取web站点并从页面中提取结构化的数据;

开源包fontTools.ttLib,所述开源包fontTools.ttLib用于对网站页面编码字体进行解码;

开源包lxml,用于获取网页中的标签内容;

开源包os,用于对文件的操作,例如读取Azure相关配置;以及

开源包json,用于对Json字符串的序列化、反序列化。

利用开源爬虫框架Scrapy7,进行模拟点击下一页操作,在请求过程中,如果请求次数过于频繁会导致请求IP被禁止访问,所以需要增加代理服务,在Scrapy框架的setting.py文件中设置UserAgent及IP代理PROXIES,在中间件middlewares.py文件中调用设置的代理数据,解决了人工收集数据效率低、成本高的问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州瑞泰信息技术有限公司,未经苏州瑞泰信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211314749.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top