[发明专利]一种细粒度情感分析方法有效
申请号: | 202110945239.6 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113688634B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 闫琰;周法国;张潇;李旭峰;葛逸凡;李嘉裕 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 细粒度 情感 分析 方法 | ||
1.一种用于细粒度情感分析的方法,其特征在于,所述方法包括以下步骤:
步骤1:为数据集中每条样本生成序列标签和位置嵌入向量、标识样本的首尾并补齐样本长度,之后将样本转化为整数编码序列,输入bert模型生成样本的嵌入向量;
步骤2:搭建实体数量预测模型、实体起始位置标注模型和实体长度预测模型,并将步骤1中的样本的嵌入向量分别输入三个模型进行训练,完成评价对象提取任务;
步骤3:搭建情感预测模型,并将步骤1中的样本的嵌入向量输入情感预测模型进行训练,完成情感极性分析任务;
步骤4:顺次连接训练后的实体数量预测模型、实体起始位置标注模型、实体长度预测模型以及情感预测模型,输入待预测文本,抽取评价对象并分析评价对象的情感极性,
其中,步骤2中,实体数量预测模型的搭建步骤具体包括:
搭建输入层,输入向量化的文本序列;
搭建可训练的位置嵌入模型,与向量输入连接相加;
搭建批量归一化模型,使得加上可训练的位置嵌入模型的样本近似服从N(0,1)分布;
搭建双向门控循环单元网络提取样本特征,增强词语间的前后联系;
搭建注意力池化模型,对样本特征进行降维压缩;
使用focal loss作为损失函数、Nadam作为优化器,将步骤1中的样本的嵌入向量输入实体数量预测模型进行训练;
其中,步骤2中,实体起始位置标注模型的搭建步骤具体包括:
搭建输入层,输入向量化的文本序列;
搭建可训练的可训练的位置嵌入模型,与向量输入连接相加;
搭建批量归一化模型,使得加上可训练的位置嵌入模型的样本近似服从N(0,1)分布;
搭建集成学习层,将双向门控循环单元网络、动态图卷积神经网络、有序长短时记忆模型和多头注意力机制模型融合;
将步骤1中的样本的嵌入向量输入实体起始位置标注模型进行训练,
其中,集成学习层的搭建步骤具体包括:
搭建双向门控循环单元网络,增强样本词语间的前后联系,通过奇异值矩阵分解算法将其输出分解,仅取其奇异值矩阵V;
搭建动态图卷积神经网络,将序列中的前后语句构建联系;
搭建有序长短时记忆模型,提取语句的层次结构;
搭建多头注意力机制模型,提取词语间的相互影响关系;
将未经过任何处理的双向门控循环单元网络的输出直接输入进动态图卷积神经网络、有序长短时记忆模型以及多头注意力机制模型,得到以上各个模型的输出,再将所得输出与经过Dense层处理的奇异值矩阵V进行点积,处理得到经过动态图卷积神经网络,有序长短时记忆模型以及多头注意力机制模型的中间输出;
将处理后的中间输出相加得到最终输出;
其中,步骤2中,实体长度预测模型的搭建步骤具体包括:
搭建输入层,输入向量化的文本序列;
搭建可训练的可训练的位置嵌入模型,与向量输入连接相加;
搭建批量归一化模型,使得加上可训练的位置嵌入模型的样本近似服从N(0,1)分布;
搭建双向门控循环单元网络提取样本特征,增强词语间的前后联系;
搭建CRF算法通过实体的起始位置作为约束,预测实体的长度;
其中,步骤3中,情感预测模型的搭建步骤具体包括:
搭建输入层,输入向量化的文本序列和向量化的实体序列;
搭建注意力池化层与Dense层处理实体序列,统一其长度;
搭建条件层归一化,将文本序列作为输入,处理后的实体序列作为约束,得到情感倾向隐藏态;
搭建两层双向门控循环单元网络,输入情感倾向隐藏态进一步提取隐藏特征;
搭建胶囊网络,分析双向门控循环单元传递的隐藏特征得到不同情感分类的概率。
2.根据权利要求1所述的方法,其特征在于,搭建动态图卷积神经网络时,膨胀系数取句长除以8。
3.根据权利要求1所述的方法,其特征在于,搭建有序长短时记忆模型时,层次数量取4。
4.一种用于细粒度情感分析的系统,所述系统包括:处理器和用于存储可执行指令的存储器;其中,所述处理器被配置为执行所述可执行指令,以执行如权利要求1至3中任一项所述的细粒度情感分析的方法。
5.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的用于细粒度情感分析的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110945239.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于追踪高空落物的视频监控系统
- 下一篇:密闭型套管