[发明专利]一种结合情感词典的卷积神经网络文本情感分析方法在审
申请号: | 201810215323.0 | 申请日: | 2018-03-15 |
公开(公告)号: | CN108647219A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 杨骏;印鉴;高静 | 申请(专利权)人: | 中山大学;广东恒电信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种结合情感词典的卷积神经网络文本情感分析方法。通过获取英文评论,进行情感极性的标注的方法。得到所需要的语料,并对其做去停用词的操作,然后采用word2vec算法对处理得到的语料进行训练,得到相应的词向量。把每句话中的词向量与词典中对应的各情感分值相乘并拼接,得到句子的矩阵表示,将其输入到的卷积神经网络(CNN)结构中,从而在模型训练过程中,将词语的情感极性程度嵌入其中,让模型的关注点更接近于人类的理解,提高了文本情感分析的准确度。 | ||
搜索关键词: | 卷积神经网络 文本情感 情感词典 情感极性 词向量 语料 相乘 模型训练过程 准确度 矩阵表示 分析 关注点 停用词 算法 拼接 句子 嵌入 标注 词语 英文 评论 | ||
【主权项】:
1.一种结合情感词典的卷积神经网络文本情感分析方法,其特征在于,包括以下步骤:S1:首先获取英文文本语料,接着对语料进行情感分类标注,最后将语料分为训练和测试集两个集合;S2:对步骤S1)中的所有语料集进行停用词处理;S3:使用word2vec算法对步骤S2)中获取的语料进行训练得到相应的词向量;S4:根据sentiwordnet(情感词典)获取预知的各词语的情感极性分布,并利用词语在不同极性上的权重与该词语的词向量相乘,得到词语在不同情感取向下的特征表示;S5:将处理后的训练集语料按照句子顺序拼接起来形成矩阵放进卷积神经网络中进行训练,其中句子里的词语在多个情感取向下的表示可以拼接得到多个矩阵,而这多个矩阵对应卷积神经网络中的多个频道;S6:将步骤S2)、S3和步骤S4处理获取的测试集语料放入步骤S5中训练好的情感分析模型,最终获取测试集的情感分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广东恒电信息科技股份有限公司,未经中山大学;广东恒电信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810215323.0/,转载请声明来源钻瓜专利网。