[发明专利]基于情感中心的文本情感分类方法有效
申请号: | 201710588604.6 | 申请日: | 2017-07-19 |
公开(公告)号: | CN107491490B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 王茂全;陈诗韵;吕钊 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 情感 中心 文本 分类 方法 | ||
1.一种基于情感中心的文本情感分类方法,其特征在于,该方法包括以下具体步骤:
步骤1:情感中心约束的损失函数
将文本向量与情感类别向量中心的距离加入损失函数,通过损失函数将情感中心的影响加入到分类模型中;
步骤2:文本表征和注意力机制
使用BLSTM将文本进行初步编码,通过注意力机制改善文本表示的准确度;在文本表征之上,通过情感类别向量与文本表征的距离值引入情感中心的信息,并在模型训练的过程中不断更新情感中心的实值向量表示,使其更加精准;其中:
所述将文本向量与情感类别向量中心的距离加入损失函数,采用学生t-分布来度量文本表征向量和相关情感中心向量的距离;记归一化函数的损失函数值为Lsoft,情感中心的损失函数值为:Lcenter;通过引入一个超参λ将所述两个损失函数值链接起来构成整个模型的损失函数,既:L=λLsoft+(1-λ)Lcenter;
所述情感中心的损失函数值Lcenter的计算,采用随机产生的批量样本来更新情感中心向量;其计算更新梯度为:其中△Cj为梯度,δ是条件函数,如果条件为真,则δ=1,否则δ=0;m为批量样本大小,用i表示第i个样本;为yi的情感中心向量,为样本属于的概率,yi为样本类别,j∈[1,k],k为分类类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710588604.6/1.html,转载请声明来源钻瓜专利网。