[发明专利]一种基于主题的舆情情感演化的方法在审

专利信息
申请号: 201910536657.2 申请日: 2019-06-20
公开(公告)号: CN111143549A 公开(公告)日: 2020-05-12
发明(设计)人: 夏小玲;石秀金;王绍宇;吴永博 申请(专利权)人: 东华大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/33;G06F16/38
代理公司: 上海申汇专利代理有限公司 31001 代理人: 翁若莹;柏子雵
地址: 201600 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 主题 舆情 情感 演化 方法
【说明书】:

发明提供一种基于主题的舆情情感演化的方法,涉及自然语言处理领域。该方法主要步骤:利用爬虫技术从网络上获取舆情语料数据;对语言数据的预处理;对预料信息进行词向量训练并且判断出词向量间相似度,并且进行离散的时间片划分;通过计算不同时间片内舆情的话题热度以及话题相对熵等度量指标,判断舆情热点热度变化以及相邻时间片内的舆情主题内容相关性;结合舆情信息的特点,将舆情主题作为增强特征,与文本特征结合起来输入到联合深度神经网络模型中进行情感分类;根据舆情话题演化模型获得的热点话题,对各热点话题不同评价对象的情感倾向进行抽取;对不同时间片内热点话题各评论对象的情感倾向进行对比分析。

技术领域

本发明涉及一种基于主题的舆情情感演化的方法,属于自然语言处理及深度学习领域。

背景技术

情感分析也被称为情感挖掘、意见挖掘、观点抽取等,是指用自然语言处理、文本挖掘的方法来对文本信息中包含主管情感极性的文本信息进行分析、处理,然后归纳总结并推理,最终挖掘出作者的观点、情感、评价、态度等信息的过程。近些年来文本情感分析受到学术界越来越高的重视,例如国外有著名的国际语义评测会议(SemEval)每年都会有对文本进行情感倾向性判断的测评任务。在国内,由于中文文本的复杂性导致研究起步较晚,但在中文分词技术得到提高后,发展速度开始变快,也出现了类似的中文情感倾向性测评会议(COAE)。这些测评会议发布的评测任务促进了国内外文本情感分析的发展。目前中文文本情感倾向分析主要分为以情感词典和语义规则为主和以机器学习为主两种方法,随着深度学习的迅速发展,深度学习方法也被应用于自然语言处理研究中,并取得了突出的研究成果。

在传统的基于文本统计和知识字典的研究方法中不考虑词语之间的关联,把文本当作是词语的集合,首先对情感词典进行构建,然后根据词典将目标文本中的情感词进行抽取,对目标文本进行段落拆解、句法分析,基于制定好的情感计算规则将文本中的词语与情感词典进行匹配,根据结果得到文本的情感分类。因此如何构造一个高质量的情感词典至关重要。目前构造情感词典的方法主要分为人工标注和自动构建两种方法,中文常用的情感词典主要有知网的HowNet和哈工大的《同义词词林》等。

但是基于情感词典的分析方法并不再适用于当今各种网络词语大量涌现的时代,它过度依赖于情感词典的构建,而如今很难对构建好的情感词典进行更新和完善,人工添加的方法费时费力,同时这种方法忽略了上下文之间信息的关联,因此准确性也很低。

Pang等人最先使用不同的机器学习算法来解决情感分析问题,分类结果高于基于词典的方法。由于机器学习分类方法是有监督的学习,因此需要对语料进行大量标注然后再进行模型训练,不依赖于情感词典的构建,可以自动提取文本特征。常用的机器学习模型有逻辑回归模型、支持向量机、最大熵模型等方法。 Boiy等人使用最大熵模型等多种机器学习方法对情感信息进行挖掘;Ye等人对不同的机器学习算法进行比较,发现使用支持向量机和N-grame模型的准确率远远高于其他机器学习算法;Wang等人根据文本主题将数据集分割,在每个主题的数据集上单独进行机器学习的模型训练,有效的提高了文本的分类准确率;魏晶晶等利用SVM算法进行电商购物评论的情感分析,结果表明比一般的统计方法准确率有所提高。以上为有监督的机器学习算法,依赖于人工标注文本分类,无监督的机器学习方法有K-means、 OPTICS(OrderingPointToIdentifytheClusterStructure)等聚类方法,通过自动学习数据之间潜在的相似性来进行分类,不需要人工标注特征。如Zagibalov等人通过自动选择种子词,实现了对中国商品评论的无监督情感分类。该方法降低了人工标注所浪费的人力物力,但是准确率与有监督的机器学习方法相比要低。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910536657.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top