[发明专利]结合情感原因发现的文本情感预测学习系统有效

专利信息
申请号: 201910511670.2 申请日: 2019-06-13
公开(公告)号: CN110222342B 公开(公告)日: 2023-05-02
发明(设计)人: 徐睿峰;范创;杜嘉晨;黄锦辉;陆勤 申请(专利权)人: 哈尔滨工业大学(深圳)
主分类号: G06F40/30 分类号: G06F40/30;G06F16/35
代理公司: 深圳市添源创鑫知识产权代理有限公司 44855 代理人: 覃迎峰
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 结合 情感 原因 发现 文本 预测 学习 系统
【权利要求书】:

1.一种文本情感原因发现装置,其特征在于,该装置包括词-子句层级结构,包含有四部分:词级别编码器、词级别注意力、子句级别注意力、子句级别编码器;其中,

词级别编码器,将文本送入词级别编码器,用于捕获词与词之间的序列特征;

词级别注意力,通过当前词语的隐状态表示和与之对应的情绪表达之间的关系来获得词级别的注意力值,用来指示当前词在其所在的子句中所占的重要程度,然后通过权重和累加操作获得每个子句的表示,其中,所述词级别注意力的计算公式如下:

其中,w为参数矩阵,为情绪表达ew的向量表示,αit指示单词,wit在子句ci中的重要程度,为子句ci的输出标识,git和git'为不同时间步中计算注意力值的中间值,hit为第i个子句的向量表示;

子句级别注意力,利用一个分类器来获得当前子句是情感原因的概率以此作为子句的注意力值,在子句层级将当前子句距离情绪表达词的距离与子句表示拼接;

子句级别编码器,通过子句级别编码器获取不同子句之间的结构性信息更新子句表示,通过softmax来获得分类特征的概率分布。

2.根据权利要求1所述的文本情感原因发现装置,其特征在于:所述词级别编码器采用门限循环单元。

3.根据权利要求1所述的情感原因发现装置,其特征在于:子句级别注意力中,在子句层级将当前子句距离情感表达词的距离与子句表示拼接,计算公式如下:

其中,Wv为参数矩阵,li为位置信息向量表示,qi为子句ci是情感原因的概率,同时也表示将有多少信息被保留到

4.根据权利要求3所述的情感原因发现装置,其特征在于:子句级别编码器中的计算公式如下:

其中,和是子句GRU单元,li为位置信息向量表示,和为子句的ci前向和后向隐状态表示,Wm为参数矩阵,为不同子句的情感原因概率分布。

5.一种结合情感原因发现的情感预测学习系统,该系统包括如权利要求1-4任一项所述的情感原因发现装置以及共享模块、情感预测模块。

6.如权利要求5所述的情感预测学习系统,其特征在于:共享模块捕获两个任务间的共享信息,并通过一共享GRU单元实现,其计算公式如下:

其中,和为前向和后向GRU单元,xst为情感原因发现文本或者情感预测文本,和为情感文本的前向和后向表示,hst为和的连接表示。

7.如权利要求5所述的情感预测学习系统,其特征在于:所述情感预测模块利用GRU单元捕获情感预测文本的序列特征,并通过注意力机制获取文本的隐状态表示,最后和共享层的输出一起用于情感预测。

8.如权利要求5所述的情感预测学习系统,其特征在于:对情感原因发现和情感预测分别进行优化,将交叉熵作为损失函数,

L=-∑Dc∈Cyclogfc(x;θ)

其中,D是训练数据,C是样例的所有类别,yc是真实类别的分布,fc(x;θ)是模型预测为c-th类别的概率分布。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910511670.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top