[发明专利]基于卷积注意力机制网络的实体级别情感分类方法在审
申请号: | 201811394014.0 | 申请日: | 2018-11-21 |
公开(公告)号: | CN109213868A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 张树武;易谦;刘杰;张桂煊;关虎 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本特征向量 情感分类 实体级别 文本矩阵 预处理 注意力机制 目标实体 卷积 向量 激活函数 目标文本 情感表达 文本表示 线性变换 拼接 权重 注意力 词语 网络 文本 重复 概率 | ||
本发明提出一种基于卷积注意力机制网络的实体级别情感分类方法,所述方法通过对目标文本进行处理获得文本矩阵以及目标实体向量;将文本矩阵以及目标实体向量进行预处理获得文本特征向量;将文本特征向量以及文本矩阵进行预处理获得新的文本特征向量;重复M次步骤S30,获得M次文本特征向量;将所有文本特征向量拼接后进行线性变换,输入激活函数,获得文本属于各个感情类别的概率。本发明的方法在获得注意力权重时将词语周围的词也纳入考虑范围,从而使最终获得的文本表示具有更强的情感表达能力。最终实现了比较精确的实体级别情感分类任务。
技术领域
本发明涉及自然语言分析技术领域,尤其涉及一种基于卷积注意力机制网络的实体级别情感分类方法。
背景技术
近年来,随着互联网技术飞速发展以及网络购物的普及,互联网上存在着大量对于商品的评论。利用这些评论,对这些文字的情感倾向进行判断,从而对顾客对于产品的需求进行分析进而改进产品,是近年来很受关注的研究热点。而实体级别的情感分析技术,则更加细化地获得评论者对商品某一具体属性的情感倾向。早先的基于人工设计特征的情感分类方法已经逐渐无法满足使用的需求,基于神经网络的方法已经成为现在情感分析的主流方向。基于神经网络的情感分类方法,已经被用于舆情分析、商品用户反馈分析等应用场景中。
现有的实体级别的情感分类方法主要基于循环神经网络(RNN)以及注意力机制。循环神经网络由于具有能够保留过去的信息的能力,故常被用于对具有时序关系的量进行表示。而在文本中,词语与词语之间恰好也保持着固定的次序,所以循环神经网络正适合用于表示这种词语与词语之间的上下文关系,从而能够获得包含文本语义内容的向量表达。
注意力机制的主要作用是对句子中的每一个词赋予一个权值,这个权值代表着这个词在这个句子当中的重要程度,从而使得对句子的语义贡献更大的词所对应的向量能够获得更大的权值。在情感分类当中,通过使用注意力机制可以将一些用于表示情感的词以及程度副词赋予更大的权值,从而获得与句子的情感相关的向量表示。而实体级别的情感分类是更细化的情感分类任务,它需要获得一段文字针对某一给定实体的情感类别,而在一段文本中,会包含多个实体,并且这段文本针对不同实体所表达出的情感也是不同的。这时,注意力机制的作用除了强调表达情感的词汇之外,还需要区分这些表达情感的词语是否是针对目标实体,而仅赋予针对目标词语的情感词汇比较大的权重,而赋予针对其他实体的情感词汇赋予比较小的权值。这样最终获得的文本向量就是针对目标实体的情感类别的。
但这种基于循环神经网络以及注意力机制的方法具有两个问题。一个问题是,由于循环神经网络具有保留过去的信息的特点,它在计算时必须按照次序依次计算,并且保留过去的所有信息。而这样的特性,使得循环神经网络在GPU上运行时无法进行并行计算,从而使得计算的效率无法提高。第二个问题是,一般情况下,在利用注意力机制计算一个词语的权值时,仅考虑这个词语与目标实体之间的关联程度。但有时一个词对于整个句子的语义贡献不仅与它本身有关,还与这个词周围的词有关,因为修饰一个词的程度副词或是否定词都能很大程度的改变这个词语在句子中的作用,但目前的注意力机制并未考虑到这种情况。
鉴于上述原因,有必要提出一种基于卷积注意力机制网络的实体级别情感分类方法的方法。
发明内容
为了解决上述技术问题,即为了解决如何提高实体级别情感分类准确度的技术问题,本发明提出了一种基于卷积注意力机制网络的实体级别情感分类方法,所述方法还包括:
步骤S10,对目标文本进行处理获得文本矩阵以及目标实体向量;
步骤S20,将文本矩阵以及目标实体向量进行预处理获得文本特征向量;
步骤S30,将文本特征向量以及文本矩阵进行预处理获得新的文本特征向量;
将步骤S30重复M次,每重复一次所获得的文本特征向量将作为下一次的输入,最终获得M个文本特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811394014.0/2.html,转载请声明来源钻瓜专利网。