[发明专利]语句文本方面级情感分类方法及系统有效
申请号: | 202110372212.2 | 申请日: | 2021-04-07 |
公开(公告)号: | CN113157919B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 鲁燃;李筱雯;刘培玉;朱振方 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/216;G06F40/284;G06F40/289;G06F40/30;G06N3/0442;G06N3/084 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 朱忠范 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 文本 方面 情感 分类 方法 系统 | ||
1.一种语句文本方面级情感分类方法,其特征在于,包括:
将每个单词进行序列化表示,获取序列的上下文序列信息,通过结构化自注意力机制生成结构化方面表示和结构化上下文表示;
包括:利用GloVE词嵌入进行预处理操作,将每个单词进行序列化表示,得到文本的词嵌入表示;
利用双向长短时记忆网络Bi-LSTM从前后两个方向提取序列的特征,获取捕捉序列的上下文序列信息;
根据结构化方面表示和结构化上下文表示,利用依存关系树的句法依存信息,结合平均池化聚合方面向量的信息,提取分类任务的最终嵌入;
包括:构造基于依存关系树的图注意力神经网络,利用依存关系树的句法依存信息对依赖关系构建提取模型;
利用构建的提取模型,结合平均池化聚合方面向量的信息,提取分类任务的最终嵌入;
包括:针对上下文序列信息中上下文记忆和方面记忆,提取与方面词相关的语义片段,并利用自我注意操作将方面记忆转换为结构化的方面表示,获得方面矩阵;
添加一个惩罚项获取方面表示中加权和向量的多样性;
获取方面矩阵之间的关系,构建一个上下文矩阵,利用前馈网络将上下文矩阵进行变换后,与上下文矩阵组合,获得最终的结构化上下文表示;
根据最终嵌入,结合反向传播算法,计算不同情感极性的概率分布,预测语句文本的最终情感极性。
2.根据权利要求1所述的语句文本方面级情感分类方法,其特征在于:
将提取的最终嵌入经过全连接层后输入到最终的softmax分类器中,从而预测最终的情感极性。
3.根据权利要求2所述的语句文本方面级情感分类方法,其特征在于:
将文本句子中的单词表示依存关系树中的节点,将单词之间的句法依赖路径表示依存关系树中的节边,依存关系树的节点由Bi-LSTM建模的实值向量给出;
将注意力分配到中心节点的邻居节点集上,对注意力系数进行归一化,重新计算权重系数;
通过多头注意力机制来捕获邻居节点在不同的方面对中心节点影响力的强弱,将提取的多个节点特征表示进行拼接作为最终的节点表示;
结合重新计算的权重系数,使用平均替代拼接得到最终的嵌入。
4.根据权利要求3所述的语句文本方面级情感分类方法,其特征在于:
利用GloVE词嵌入进行词嵌入预处理操作,给定一个长度为n的上下文句子S={w1,w2,...,wn},其包含方面的上下文输入序列,方面a={wi,wi+1,...,wi+m-1}包含m个单词;
将每个单词wi映射到一个低维的单词嵌入向量中,dw是单词向量的维数,是预训练GloVE的嵌入矩阵,其中,|V|表示词汇表的大小。
5.根据权利要求4所述的语句文本方面级情感分类方法,其特征在于:
利用Bi-LSTM网络从前后两个方向提取序列的特征,在t时刻正向LSTM输出的隐藏状态为反向LSTM输出的隐藏状态为Bi-LSTM输出的隐藏状态为其中,
其中,x1,x2,...,xn指上下文输入序列;
序列h分为上下文记忆Mc和方面记忆Ma;Mc包含所有上下文单词的表示,Ma包含所有方面词的表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110372212.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的智慧城市环境管理方法及系统
- 下一篇:一种流道式打标装置