[发明专利]一种基于话题影响力的微博话题情感分析方法在审
申请号: | 201910036276.8 | 申请日: | 2019-01-15 |
公开(公告)号: | CN109684646A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 杨璐;刘志锋;周从华;单田华;李雷;韩飞 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/35 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 何浩 |
地址: | 212000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于话题影响力的微博话题情感分析方法,该方法包括以下步骤:采集微博用户个人信息数据及微博文本数据;对数据进行预处理;使用LDA模型进行主题聚类;选取话题的微博内容进行情感极性标注并训练生成SVM分类器;使用SVM分类器得到未标注文本的情感倾向性;计算微博用户影响力因子值及该微博与话题相似度,结合微博情感极性和话题影响力因子计算整个话题的情感值,并以此对话题进行排序,为舆情分析提供参考。本发明能及时发现微博文本的话题中可能突发的舆情事件及热点话题,并根据话题影响力对话题舆情度进行排序,可应用于网络舆情监管和突发舆情事件的监测,解决目前舆情系统监管不及时性和盲目性问题。 | ||
搜索关键词: | 微博 话题 情感分析 情感极性 标注 排序 文本 用户影响力因子 用户个人信息 预处理 情感倾向性 热点话题 网络舆情 文本数据 系统监管 因子计算 舆情分析 相似度 聚类 采集 参考 监测 监管 应用 发现 | ||
【主权项】:
1.一种基于话题影响力的微博话题情感分析方法,其特征为,包括以下步骤:步骤1,通过微博提供的API接口获取微博用户的个人信息数据,包括用户的用户微博数、粉丝数、关注数、评论数;采用网络爬虫方式获取大量微博文本;步骤2,对微博文本进行数据预处理,包括过滤噪声、分词和去停用词;步骤3,将微博文本按照自带hashtag进行粗分类,使用LDA模型进一步进行主题聚类:微博文本中经常会出现##话题,首先我们可以初步按照自带话题标签对微博文本进行分类;其次利用LDA模型得到主题分布,将微博文本进一步地细分为各主题区间;步骤4,对部分微博文本进行情感极性标注,若该条微博文本情感倾向为正向,则标记为1,否则标记为‑1;利用标注微博文本集进行训练并优化,生成SVM情感分类器;使用SVM分类器得到未标注微博文本情感极值;步骤5,根据步骤1所采集到数据计算用户影响力和话题内该用户发布的微博文本与话题相似度来计算该文本的话题影响力;步骤6,计算出该微博文本的主流情感倾向及情感值并对话题情感值进行排序;感极性值P接近0,则该话题为中性;P>0,则该话题为正向;P<0代表该话题为负面情绪;若一个话题负向情感值极高,则说明该话题很有可能引起突发舆情事件,应做出舆情预警。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910036276.8/,转载请声明来源钻瓜专利网。
- 上一篇:中文分词方法及装置
- 下一篇:电影评论情感分析方法及装置