[发明专利]一种社交网络情绪焦点的挖掘方法及系统有效

专利信息
申请号: 201810271740.7 申请日: 2018-03-29
公开(公告)号: CN108536781B 公开(公告)日: 2022-04-01
发明(设计)人: 刘金硕;牟成豪;李改潮;李晨曦;李扬眉;杨广益;陈煜森;邓娟 申请(专利权)人: 武汉大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06Q50/00
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人: 鲁力
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 社交 网络 情绪 焦点 挖掘 方法 系统
【说明书】:

发明属于数据挖掘、舆情分析的研究范畴,涉及一种社交网络情绪焦点的挖掘方法及系统,包括:语料数据预处理、神经网络模型构建及训练、情绪焦点聚类三个步骤。深入挖掘用户在社交网络中展现的情绪的关注焦点,从而为社会舆论引导提供更为明确的决策辅助。本发明可用于舆情监控与干预、谣言检测等网络信息监管领域。

技术领域

本发明涉及一种社交网络情绪焦点的挖掘方法及系统,涉及数据挖掘、舆情分析的研究领域。

背景技术

文本情绪分析是自然语言处理领域主要研究方向之一,它主要研究文本所蕴含的情绪及与情绪相关的深层信息。情绪原因或者情绪焦点的挖掘主要是分析大众产生特定情绪的具体关注点,针对文本中出现的被描述者的情绪,抽取出触发被描述者情绪产生的原因信息。

目前,情绪归因一般采用基于规则和统计的方法。Ying Chen和Sophia Yat MeiLee等人建立了一个情绪归因的语料库,并且根据标注的语料库建立了相应的规则,用于情绪原因句子的识别。Kai Gao等人提出一种基于规则的情绪原因识别模型,然后对相应的微博数据进行情绪原因的抽取。Alena Neviarouskaya通过句法、语法和规则相结合的方法,分析“乐”的8种情绪原因的语言现象,以此来推测一段文本的情绪类别和情绪原因。Weiyuan Li等人通过抽取情绪原因特征进行情绪分类,其特征抽取采用基于规则的方法。

在基于统计方法的情绪原因识别方面,袁丽提取语言学线索词的特征、句子距离特征、候选词词法特征等信息,然后得到特征向量空间,最后应用SVM分类器和条件随机场对文本情绪归因进行了判别。Lin Gui 等人既通过建立25条规则来进行文本情绪原因的预测,还运用分类方法来预测文本情绪原因。李逸薇将情绪归因识别任务看成序列标注,并建立了相应的模型,将所有候选原因子句当成一个序列,从而标记出哪些属于原因子句。Ghazi D等人利用FrameNet建立了情绪和情绪原因相关联的数据集,然后利用CRF来预测文本句子级别的情绪。Gaoyan Ou 等人建立文本公众情绪和情绪事件之间关系,利用文本情绪来进行文本中事件的预测。Lin Gui等人首先构建了一个情绪归因语料库,标注了表达情绪的核心子句,在核心句的前后子句中标注情绪原因子句,然后从核心句的前后每个子句中抽取候选原因事件,通过训练分类器,最后判定抽取的候选原因事件是否是情绪核心子句。

近期,深度学习的应用也在该任务上取得了一定进展。慕永利等人采用结合卷积神经网络,融合句子的语义上下文信息对情绪原因子句进行了情绪原因识别。但是相关任务的结果准确度较低。

因此,更好地利用深度学习,挖掘句法以及语义层面的情感信息来进行情绪焦点的方法显得尤为重要。

发明内容

本发明的目的是为了解决社交用户情感焦点挖掘问题,旨在为舆论引导,舆情处理提供更为精确的辅助信息。

本发明是采用如下技术方案:

一种社交网络情绪焦点的挖掘方法,其特征在于,包括以下步骤:

步骤1,对语料数据进行数据预处理,包括:分句、分词、过滤,数据预处理中,每一条语料数据,根据汉语句号、逗号、分号、冒号、感叹号、问号以及顿号进行句子切分,形成子句集;对每一条子句进行分词处理,通过常用停用词词表过滤去掉分词中出现的停用词,最终形成的预处理后预料数据格式如下:

X=[x0=[w0,w1,…,wn],…,xm]

y=[y0,…,ym]

其中,X表示语料中的文本数据集,xi,0≤i≤m,m表示语料的子句数量,xi表示语料中的第i个子句,与之对应的yi=1,如果当前子句为情绪焦点,否则yi=0;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810271740.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top