[发明专利]一种用于目标情感分类的多跳注意力深度模型、方法、存储介质和终端有效
申请号: | 201910370891.2 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110083705B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 李晓瑜;邓钰;郑德生 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭;徐丰 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于目标情感分类的多跳注意力深度模型、方法、存储介质和终端,在模型中,前面各跳注意力计算模块hop中使用由第一卷积操作模块产生的二维词汇组合特征matrix3,并将其注意力权值信息不断向下层传递;而在最后一跳计算之前,模型使用注意力(第一注意力计算模块)对输入的一维词汇进行加权处理(词向量加权模块),再进行卷积操作(第二卷积操作模块),生成参与最后注意力计算的加权二维词汇组合特征matrix4。本发明的模型同时拥有了一维和二维词汇特征的注意力权值信息,使其能够充分利用注意力机制在多维特征空间中提取和学习关于目标更多的隐藏信息,以更好地预测基于不同目标的情感极性。 | ||
搜索关键词: | 一种 用于 目标 情感 分类 注意力 深度 模型 方法 存储 介质 终端 | ||
【主权项】:
1.一种用于目标情感分类的多跳注意力深度模型,输入包括词向量矩阵matrx1和目标词向量aspect,词向量矩阵matrx1表示为V={V1,V2,V3,...,Vn};其特征在于:所述模型包括:第一卷积操作模块:用于对词向量矩阵matrix1进行一维卷积操作,生成相邻词汇组合特征向量矩阵matrix3;第一注意力计算模块:用于计算词向量矩阵matrix1针对目标词向量aspect的注意力权值向量,注意力权值向量表示为α={α1,α2,α3,...,αn};词向量加权模块:用于将词向量矩阵matrix1与得到的注意力权值向量执行
操作,得到注意力加权词向量矩阵matrix2;其中,
操作的定义为:
第二卷积操作模块:用于对注意力加权词向量矩阵matrix2进行一维卷积操作,生成加权相邻词汇组合特征向量矩阵matrix4;多个顺次连接的注意力计算层hop,每个注意力计算层hop的结构相同,均包括:注意力计算单元:用于计算相邻词汇组合特征向量矩阵matrix3针对目标词向量aspect的注意力权值向量,或者计算相邻词汇组合特征向量矩阵matrix3针对上一个注意力计算层hop输出的新目标词向量aspect’的注意力权值向量;其中第一个注意力计算层hop1针对目标词向量aspect的注意力权值向量,其余注意力计算层hopm针对上一个注意力计算层hopm‑1输出的新目标词向量aspect’;注意力加权单元:用于将相邻词汇组合特征向量矩阵matrix3与注意力计算单元得到的注意力权值向量进行⊙操作,得到注意力加权和向量;其中⊙操作的定义为:
新目标词向量生成单元:用于将注意力加权单元得到的注意力权值向量与目标词向量aspect执行
操作,或者将注意力加权单元得到的注意力权值向量与上一个注意力计算层hop输出的新目标词向量aspect’的注意力权值向量执行
操作;其中,
操作的定义为:
其中第一个注意力计算层hop1针对目标词向量aspect,其余注意力计算层hopm针对上一个注意力计算层hopm‑1输出的新目标词向量aspect’;所述模型还包括:第二注意力计算模块:用于计算加权相邻词汇组合特征向量矩阵matrix4针对最后一层注意力计算层hop输出的新目标词向量aspect’的注意力权值向量;注意力加权模块:用于将加权相邻词汇组合特征向量矩阵matrix4与第二注意力计算模块得到的注意力权值向量执行⊙操作,得到注意力加权和向量;全连接层:用于将注意力加权模块输出的注意力加权和向量作为输入文本的最终向量表示,通过所述全连接层后得到情感分类预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910370891.2/,转载请声明来源钻瓜专利网。