[发明专利]情感分析方法、装置、计算机可读存储介质及电子设备有效
申请号: | 201711287858.0 | 申请日: | 2017-12-07 |
公开(公告)号: | CN108197100B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 刘嘉伟;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/279 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏嘉熹;南毅宁 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 分析 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本公开涉及一种情感分析方法、装置、计算机可读存储介质及电子设备,所述方法包括:获取待分析语料的第一分词集合;通过句法分析模型对所述第一分词集合进行句法分析,以获得所述第一分词集合中各个分词间的关系;根据所述各个分词间的关系以及预置的情感词库,确定所述待分析语料的情感词以及该情感词的对象;根据所述情感词和所述对象查询三维情感辞典,以确定所述待分析语料的情感类型,其中,所述三维情感辞典包括情感词、情感词的对象及情感类型三者之间的对应关系。通过上述技术方案,可以准确地确定出同一情感词在对应不同对象时可能表示的不同情感类型,有效避免根据情感词进行单一判断的片面结果,有效提高情感分析的准确度。
技术领域
本公开涉及情感分析领域,具体地,涉及一种情感分析方法、装置、计算机可读存储介质及电子设备。
背景技术
情感分析是对带有主观情感色彩的文本或文字进行分析、归类、整理、推理的一类分析。目前常用的情感分析方法主要分为以下两种:
(一)基于情感词匹配的方法。基于情感词匹配的方法一般需要情感辞典、否定辞典。情感辞典一般包含主观的情感,如“好”、“优秀”、“脏”等。否定辞典一般会将情感反转,如“不”、“非”、“无”、“没”等。然而通过情感词匹配的方法只是单纯对语料中出现的词语进行匹配,而不会考虑整段语料的语义信息,影响对该语料的情感分析的结果。如,对于同一词语而言,其可能有不同词性,例如,“这个电影真垃圾”中“垃圾”是表示负向的情感词,但是在“扔垃圾”中“垃圾”只是单纯的名词。又例如,同一词语在不同的语言环境下其含义不同,同一情感词和不同词语搭配可以表示不同的情感,如,“这个车的空间大”中的“大”可以认为是正向的情感,“这个车的油耗大”中的“大”可以认为是负向的情感。
(二)基于机器学习(深度学习)的方法。现在一般会使用word2vec进行词向量转换,后续再使用SVM、LSTM等方法进行分类。在该方法中,一般会先对语料进行预处理,如人为地将和情感无关的文本过滤掉,以防止这些文本在机器学习过程中造成的干扰。另外,在机器学习的过程中一般会针对不同领域进行不同学习训练,使得不同领域的模型难以共享。
发明内容
本公开的目的是提供一种使用范围广、准确率高的情感分析方法、装置、计算机可读存储介质及电子设备。
为了实现上述目的,根据本公开的第一方面,提供一种情感分析方法,所述方法包括:
获取待分析语料的第一分词集合;
通过句法分析模型对所述第一分词集合进行句法分析,以获得所述第一分词集合中各个分词间的关系;
根据所述各个分词间的关系以及预置的情感词库,确定所述待分析语料的情感词以及该情感词的对象;
根据所述情感词和所述对象查询三维情感辞典,以确定所述待分析语料的情感类型,其中,所述三维情感辞典包括情感词、情感词的对象及情感类型三者之间的对应关系。
可选地,所述根据所述各个分词间的关系以及预置的情感词库,确定所述待分析语料的情感词,包括:
将所述第一分词集合中的分词逐个与所述情感词库中的情感词进行匹配,并将匹配成功的分词确定为候选情感词;
当所述候选情感词为多个时,根据所述各个分词间的关系,确定所述第一分词集合中是否存在与候选情感词之间的关系为转折关系的转折分词;
若所述第一分词集合中存在与候选情感词之间的关系为转折关系的转折分词,则将与所述转折分词之间的关系为转折关系的至少一个候选情感词确定为所述待分析语料的情感词;
若所述第一分词集合中不存在与候选情感词之间的关系为转折关系的转折分词,则将所述多个候选情感词中的至少一者确定为所述待分析语料的情感词。
可选地,所述根据所述情感词和所述对象查询三维情感辞典,以确定所述待分析语料的情感类型,包括;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711287858.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本信息提取方法及计算机可读存储介质
- 下一篇:一种语料标注方法及装置