[发明专利]一种基于话题影响力的微博话题情感分析方法在审

专利信息
申请号: 201910036276.8 申请日: 2019-01-15
公开(公告)号: CN109684646A 公开(公告)日: 2019-04-26
发明(设计)人: 杨璐;刘志锋;周从华;单田华;李雷;韩飞 申请(专利权)人: 江苏大学
主分类号: G06F17/27 分类号: G06F17/27;G06F16/35
代理公司: 北京中政联科专利代理事务所(普通合伙) 11489 代理人: 何浩
地址: 212000 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 微博 话题 情感分析 情感极性 标注 排序 文本 用户影响力因子 用户个人信息 预处理 情感倾向性 热点话题 网络舆情 文本数据 系统监管 因子计算 舆情分析 相似度 聚类 采集 参考 监测 监管 应用 发现
【说明书】:

发明公开了一种基于话题影响力的微博话题情感分析方法,该方法包括以下步骤:采集微博用户个人信息数据及微博文本数据;对数据进行预处理;使用LDA模型进行主题聚类;选取话题的微博内容进行情感极性标注并训练生成SVM分类器;使用SVM分类器得到未标注文本的情感倾向性;计算微博用户影响力因子值及该微博与话题相似度,结合微博情感极性和话题影响力因子计算整个话题的情感值,并以此对话题进行排序,为舆情分析提供参考。本发明能及时发现微博文本的话题中可能突发的舆情事件及热点话题,并根据话题影响力对话题舆情度进行排序,可应用于网络舆情监管和突发舆情事件的监测,解决目前舆情系统监管不及时性和盲目性问题。

技术领域

本发明涉及一种基于话题影响力的微博话题情感分析方法,属于大数据以及文本挖掘技术领域。

背景技术

在当今的信息时代,人们越来越依赖于网络,也越来越习惯在社交网络上去获取信息、交流信息及表达自己的个人情感;新浪微博等社交平台拥有庞大的微博用户量和用户通过使用微博而产生的庞大数据,这些数据背后都蕴含着巨大的商业价值和社会价值。因此与微博相关的研究课题越来越受到我们的关注,而微博情感分析以及背后更深层次的舆情分析更是这些课题中的热点。

情感分析又称意见挖掘,其目的是通过对带有个人主观情感或者分析文本进行分析,挖掘其中的个人观点或评价信息,以更加直观的方式或者形式呈现给我们。微博由于文字限制,文本通常比较短小,且表达方式比较自由,对于语法结构要求也比较宽松,因此针对微博进行情感分析具有一定的难度。

现有技术中,微博情感分析方法主要分为两种:一种是基于情感语义词典的方法,一种是基于机器学习的方法。使用情感词典来分析文本情感,应用于词语特征级,分析精度高,但是受到NLP技术及相关抽取技术的限制,容易丢失数据集中隐藏的重要模式;使用机器学习的方法来进行分析主要是通过学习大量的数据来训练出分类模型,该方法对于情感分析比较客观,准确性高,但是对于训练语料依赖性很高,训练周期较长。

发明内容

针对上述问题,本发明提出了一种基于话题影响力的微博话题情感分析方法,实现了客观且精准的情感分析,并根据情感分析的结果做出舆情预警。

具体的技术方案如下:

一种基于话题影响力的微博话题情感分析方法,包括以下步骤:

步骤1,通过微博提供的API接口获取微博用户的个人信息数据,包括用户的用户微博数、粉丝数、关注数、评论数;采用网络爬虫方式获取大量微博文本;

步骤2,对微博文本进行数据预处理,包括过滤噪声、分词和去停用词;

步骤3,将微博文本按照自带hashtag进行粗分类,使用LDA模型进一步进行主题聚类:微博文本中经常会出现##话题,首先我们可以初步按照自带话题标签对微博文本进行分类;其次利用LDA模型得到主题分布,将微博文本进一步地细分为各主题区间;

步骤4,对部分微博文本进行情感极性标注,若该条微博文本情感倾向为正向,则标记为1,否则标记为-1;利用标注微博文本集进行训练并优化,生成SVM情感分类器;使用SVM分类器得到未标注微博文本情感极值;

步骤5,根据步骤1所采集到数据计算用户影响力和话题内该用户发布的微博文本与话题相似度来计算该文本的话题影响力;

步骤6,计算出该微博文本的主流情感倾向及情感值并对话题情感值进行排序;感极性值P接近0,则该话题为中性;P>0,则该话题为正向;P<0代表该话题为负面情绪;若一个话题负向情感值极高,则说明该话题很有可能引起突发舆情事件,应做出舆情预警。

步骤3中LDA模型进行主题聚类的方法为:

过程3.1,根据已有标签的微博文本语料库进行学习,生成LDA主题模型;具体LDA主题模型生成过程可以描述如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910036276.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top