[发明专利]一种基于深度学习的评论词情感分析方法及系统在审
申请号: | 201710510221.7 | 申请日: | 2017-06-28 |
公开(公告)号: | CN107291696A | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 纪传俊;陈运文;纪达麒;桂洪冠;江永青 | 申请(专利权)人: | 达而观信息科技(上海)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京卓唐知识产权代理有限公司11541 | 代理人: | 唐海力,韩来兵 |
地址: | 200000 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 评论 情感 分析 方法 系统 | ||
技术领域
本发明涉及情感分析及自然语言处理技术领域,具体涉及一种基于深度学习的评论词情感分析方法及系统。
背景技术
在互联网日益发达的今天,许多用户不管是通过电商网站或者线下门店购买商品后,包括买车、买手机,都会到品牌官网或者一些专业网站、社交媒体去发表对产品的评价。对于买家来说,评论是了解一款产品真实情况的重要途径。对于商家而言,评论则是了解客户反馈、了解产品优势和潜在问题的第一手渠道。因此,对评论数据的挖掘分析目前有着相当大的市场需求。判断评论的情感倾向,即一个评论文本是表达正面情感还是负面情感,是评论分析的核心。
当下业界最热门的情感分析方法,主要是基于深度学习技术。深度学习无需特征工程,也就不需要使用传统方法经常用到的情感词典。但不使用情感词典也存在弊端,相当于弱化了情感词表达的倾向信息。尤其在处理较为专业的垂直领域评论文本的情感分析时,会导致准确率不高。
发明内容
本发明的目的是提高评论文本的情感分析的准确率。
为了实现上述目的,本发明提供了一种基于深度学习的评论词情感分析方法,包括如下步骤:
接收待评论文本,将待评论文本进行分词,得到词语序列;
利用词向量生成模型将词语序列转换为对应的词向量序列;
根据领域情感词典判断词语序列是否包括情感倾词,根据情感倾向词得到其对应的扩展向量,将扩展向量添加至词向量序列;
将添加扩展词向量的词向量序列输入至情感判断模型,输出判断结果。
进一步,所述利用词向量生成模型将词语序列转换为对应的词向量序列之前包括
获取词向量训练文本;
将词向量训练文本输入词向量模型进行训练,得到词向量生成模型。
进一步,所述将添加扩展词向量的词向量序列输入至情感判断模型之前包括
构建情感分析模型;
利用情感倾向词对情感分析模型进行训练,得到情感判断模型。
进一步,所述根据领域情感词典判断词语序列是否包括情感倾词,根据情感倾向词得到其对应的扩展向量,将扩展向量添加至词向量序列包括
构建领域情感词典;
提取不同领域情感词典中的情感倾向词,根据情感倾向词类型生成情感倾向词典,其中,情感倾向词典包括正面情感词典、负面情感词典、程度词典和否定词典。
进一步,情感判断模型为基于LSTM的模型。
本发明还提供了一种基于深度学习的评论词情感分析系统,包括
评论分词模块,用于接收待评论文本,将待评论文本进行分词,得到词语序列;
向量生成模块,用于利用词向量生成模型将词语序列转换为对应的词向量序列;
向量扩展模块,用于根据领域情感词典判断词语序列是否包括情感倾词,根据情感倾向词得到其对应的扩展向量,将扩展向量添加至词向量序列;
情感判断模块,用于将添加扩展词向量的词向量序列输入至情感判断模型,输出判断结果。
进一步,向量生成模块包括
训练准备单元,用于获取词向量训练文本;
向量生成单元,用于将词向量训练文本输入词向量模型进行训练,得到词向量生成模型。
进一步,情感判断模块包括
模型构建单元,用于构建情感分析模型;
模型训练单元,用于利用情感倾向词对情感分析模型进行训练,得到情感判断模型。
进一步,向量扩展模块包括
词典构建单元,用于构建领域情感词典;
特征提取单元,用于提取不同领域情感词典中的情感倾向词,根据情感倾向词类型生成情感倾向词典,其中,情感倾向词典包括正面情感词典、负面情感词典、程度词典和否定词典。
在上述技术方案中,本发明基于领域情感词典对传统的词向量进行扩展,增强了领域情感词的信息强度,能够精确识别在特定领域中才具有情感倾向,有效提高了情感倾向分析的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明所述的基于深度学习的评论词情感分析方法一个实施例的流程示意图;
图2为本发明基于深度学习的评论词情感分析方法中获取评论文本的一个来源效果示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于达而观信息科技(上海)有限公司,未经达而观信息科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710510221.7/2.html,转载请声明来源钻瓜专利网。