[发明专利]一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法有效
申请号: | 202110443368.5 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113051916B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 曹玖新;顾天韵;赵志翔 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/9536;G06Q50/00;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 211100 江苏省南京市江宁*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 基于 情感 偏移 感知 交互 式微 文本 挖掘 方法 | ||
1.一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述方法包括如下步骤:
步骤1)根据社交网络中单条微博文本以及其交互历史的上下文语义信息,标注微博文本的情感极性,并划分训练集、验证集与测试集;
步骤2)采用自然语言处理领域中的预训练语言模型BERT,提取语句级的微博情感语义特征;
步骤3)针对交互式的社交网络语境进行分析,基于长短期记忆网络LSTM,提取语境级的微博情感语义特征;
步骤4)将步骤2)、步骤3)得到的特征拼接为特征向量,以表示微博的基本情感语义特征;
步骤5)针对情感偏移进行分析,要感知微博用户在时间维度上相邻文本之间所体现出的情感偏移,可抽象为句子对分类建模问题,因此将步骤4)所得的微博基本情感语义特征输入多层感知机,映射至情感偏移标签空间,进行参数学习,同时得到用户情感偏移特征;
步骤6)针对情感影响关系进行分析,由于情感偏移能够为各条微博之间的情感交互关系提供显式且精确的线索,并且步骤5)中得到的情感偏移特征可以看作是情感偏移感知任务结果的估计值,此时情感偏移程度可以看作一个已知量,那么在已知各微博与上句相比是否会发生情感变化的基础上再从语境中进一步提取信息,能够更有针对性地挖掘出交互式语境中相关情感影响因素,由此可将步骤5)所得的情感偏移特征与步骤4)所得的基本情感语义特征进行融合,设计情感关联关系增强的语境级Attention机制,进一步从交互历史中提取出与当前微博相关的情感影响因素;
步骤7)根据步骤6)所得的情感影响因素,再与步骤4)所得的基本情感语义特征融合,得到在交互式语境下当前微博文本的最终情感特征,并输入多层感知机,映射至微博情感极性标签空间,进行参数学习;
步骤8)引入多任务学习范式,步骤5)可看作用户情感偏移感知的辅助任务,步骤7)可看作微博文本情感识别的主任务,使两者共享隐层参数共同学习,从而完成微博文本情感识别模型的构建,并通过采用最大似然估计和梯度下降法训练学习得到模型参数;
步骤9)将待推断文本情感的新样本输入步骤8)所得模型,最终输出各情感极性类别下的概率值,概率值最大的类别就是推断所得的微博文本情感。
2.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步骤1)的数据集中对微博文本情感极性标注的具体方法为:综合考虑社交网络中单条微博文本以及其交互历史的上下文语义信息,人工标注每条微博的情感极性。
3.跟据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步骤2)中由于目前能够获取到的微博情感数据集的数据量有限,而自然语言处理领域流行的预训练语言模型BERT已通过海量语料训练出了提取句子通用语义表征的方式,利用BERT提取单条微博的通用语义表征,并且针对本情感分析任务,以Fine-tuning微调的方式使该部分在通用语义表征的基础上更加关注情感语义信息,具体而言,对于某一交互式场景下包含的第i条微博,首先按照BERT的标准预处理方法对该条微博文本进行分词并映射成Token Embeddings,输入经过预训练参数初始化的BERT模型,经过层层编码,使用最终输出的[CLS]对应位的隐含表示作为微博i的基本语义表征ti。
4.跟据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步骤3)中考虑到社交网络中的单条微博文本,其历史语境是由一系列时序上连续、语义上连贯的语句所构成的语言整体,而循环神经网络作为一种建模数据之间顺序关系的标准方法被广泛用于捕捉语言序列的上下文特征,因此基于循环神经网络的某变体,长短期记忆网络LSTM,提取语境级的微博情感语义特征。
5.根据权利要求1所述的一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法,其特征在于,所述步骤4)中将步骤2)、步骤3)得到的特征拼接为特征向量,以表示微博的基本语义特征
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110443368.5/1.html,转载请声明来源钻瓜专利网。