[发明专利]一种基于中文数据集的文本情感分析方法在审
| 申请号: | 201810552925.5 | 申请日: | 2018-06-01 |
| 公开(公告)号: | CN108763216A | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 李辉;郑媛媛;余伟阳;高娜;周巧喜 | 申请(专利权)人: | 河南理工大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 454000 河南*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明针对目前文本情感分析任务中所使用的神经网络结构无法提取文本重要特征的问题,提出了一种基于中文数据集的文本情感分析方法,包括步骤:首先对语料进行预处理,将其转换为词向量矩阵;然后使用卷积神经网络(CNN)进行局部信息特征的提取,接着将其作为长短时记忆网络(LSTM)的输入,学习文本词语,句子之间的序列关系;在其后引入注意力机制,来学习重要的文本特征;最后使用分类层对输出进行分类。本发明所提方法在中文数据集上具有可行性和优越性。 | ||
| 搜索关键词: | 文本情感 数据集 中文 文本 预处理 矩阵 卷积神经网络 神经网络结构 注意力机制 记忆网络 局部信息 文本特征 序列关系 分析 词向量 分类 语料 句子 词语 输出 学习 引入 转换 | ||
【主权项】:
1.一种基于中文数据集的文本情感分析方法,其特征在于,所述文本情感分析方法包括以下步骤:步骤1、对中文语料进行预处理,将文本转换为固定大小的词向量矩阵;步骤2、使用卷积神经网络(CNN)进行局部信息特征的提取,将其作为长短时记忆网络(LSTM)的输入,学习文本词语,句子之间的序列关系;步骤3、引入注意力机制,将步骤2得到的特征作为输入,进一步学习重要的文本特征;步骤4、将得到的文本特征表示输入softmax分类层进行分类,积极为1,消极为0,并与文本标签进行对比计算,得出文本分类正确率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810552925.5/,转载请声明来源钻瓜专利网。





