[发明专利]一种结合情感词典的卷积神经网络文本情感分析方法在审

申请号：	201810215323.0	申请日：	2018-03-15
公开（公告）号：	CN108647219A	公开（公告）日：	2018-10-12
发明（设计）人：	杨骏;印鉴;高静	申请（专利权）人：	中山大学;广东恒电信息科技股份有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06N3/04
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	林丽明
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种结合情感词典的卷积神经网络文本情感分析方法。通过获取英文评论，进行情感极性的标注的方法。得到所需要的语料，并对其做去停用词的操作，然后采用word2vec算法对处理得到的语料进行训练，得到相应的词向量。把每句话中的词向量与词典中对应的各情感分值相乘并拼接，得到句子的矩阵表示，将其输入到的卷积神经网络(CNN)结构中，从而在模型训练过程中，将词语的情感极性程度嵌入其中，让模型的关注点更接近于人类的理解，提高了文本情感分析的准确度。
搜索关键词：	卷积神经网络文本情感情感词典情感极性词向量语料相乘模型训练过程准确度矩阵表示分析关注点停用词算法拼接句子嵌入标注词语英文评论
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种结合情感词典的卷积神经网络文本情感分析方法，其特征在于，包括以下步骤：S1：首先获取英文文本语料，接着对语料进行情感分类标注，最后将语料分为训练和测试集两个集合；S2：对步骤S1)中的所有语料集进行停用词处理；S3：使用word2vec算法对步骤S2)中获取的语料进行训练得到相应的词向量；S4：根据sentiwordnet(情感词典)获取预知的各词语的情感极性分布，并利用词语在不同极性上的权重与该词语的词向量相乘，得到词语在不同情感取向下的特征表示；S5：将处理后的训练集语料按照句子顺序拼接起来形成矩阵放进卷积神经网络中进行训练，其中句子里的词语在多个情感取向下的表示可以拼接得到多个矩阵，而这多个矩阵对应卷积神经网络中的多个频道；S6：将步骤S2)、S3和步骤S4处理获取的测试集语料放入步骤S5中训练好的情感分析模型，最终获取测试集的情感分类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学;广东恒电信息科技股份有限公司，未经中山大学;广东恒电信息科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810215323.0/，转载请声明来源钻瓜专利网。

上一篇：激光打印3D信息数据存储方法、数据处理方法及系统
下一篇：基于事件间接先于关系的科学工作流挖掘方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种结合情感词典的卷积神经网络文本情感分析方法在审

专利文献下载