[发明专利]一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法在审
| 申请号: | 202310229392.8 | 申请日: | 2023-03-10 |
| 公开(公告)号: | CN116257782A | 公开(公告)日: | 2023-06-13 |
| 发明(设计)人: | 侯彦娥;王春雨;党兰学;葛强;刘扬;左宪禹;韩宏宇;谢毅 | 申请(专利权)人: | 河南大学 |
| 主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/22;G06F18/214;G06F18/25;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 张立强 |
| 地址: | 475004 河南省开封市金明区*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 通道 卷积 门控 循环 单元 文本 情感 分析 方法 | ||
1.一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,包括:
步骤1:对获得的文本数据进行预处理,将预处理后的数据作为模型的输入;
步骤2:使用不同大小的滑动窗口来提取浅层的文本信息,使用融合Concatenate操作将文本特征信息合并;
步骤3:分别使用残差单元和门控循环单元对文本的抽象特征进行提取,并使用连接操作将提取到的特征信息进行合并;
步骤4:引入注意力机制,对句子中的单词给予不同的权重,使用批标准化处理和全连接层最终完成分类。
2.根据权利要求1所述的一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,所述步骤1包括:
步骤1.1:通过使用正则表达式删除@user、链接、标点符号、数字和特殊字符,当单词长度小于3时,将其删除;
步骤1.2:使用Python库中的NLTK对词干进行提取;
步骤1.3:将停止词删除;
步骤1.4:使用BERT模型来训练得到相应的词向量。
3.根据权利要求1所述的一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,所述步骤1.2包括:
使用NLTK包获得英语开源sentiwordnet情感词典,给句子中的每个词赋予相应的情感权重;
情感权重公式如下:
其中wi表示一个单词,vi表示单词wi在情感词典中的权重,WD表示情感词典。
4.根据权利要求1所述的一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,所述步骤2包括:
分别使用滤波器大小为2,3,4,5,6和7的一维卷积提取特征值。
5.根据权利要求1所述的一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,所述步骤3中,残差单元结构的具体执行顺序为BN→ReLU→Conv→BN→ReLU→Conv。
6.根据权利要求1所述的一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,所述残差单元使用3×3卷积的特征学习方式提取文本信息。
7.根据权利要求1所述的一种基于注意力机制的多通道卷积与门控循环单元的文本情感分析方法,其特征在于,所述门控循环单元通过使用更新门和重置门来决定传递给输出的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大学,未经河南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310229392.8/1.html,转载请声明来源钻瓜专利网。





