[发明专利]文本情感分析方法及装置、存储介质、终端在审
申请号: | 201711441070.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108052505A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 陈培华;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军;吴敏 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 分析 方法 装置 存储 介质 终端 | ||
1.一种文本情感分析方法,其特征在于,包括:
获取待分析文本,所述待分析文本包括多个第一词语;
将所述待分析文本中的各个第一词语转换为词向量;
利用各个词向量及其对应的情感权重计算得到所述待分析文本的句向量,每个词向量的情感权重是预先确定的;
根据所述待分析文本的句向量确定所述待分析文本的情感类别。
2.根据权利要求1所述的文本情感分析方法,其特征在于,所述获取待分析文本包括:
根据词典对待分析文本进行分词处理,得到多个第一词语,所述词典包括多个第二词语。
3.根据权利要求2所述的文本情感分析方法,其特征在于,所述获取待分析文本包括还包括:
获取每个第二词语的初始权重;
根据每个第二词语在预设情感词典中的情感倾向对所述初始权重进行调整,以得到每个第二词语对应的情感权重,第二词语对应的情感权重等同于所述第一词语的词向量对应的情感权重。
4.根据权利要求3所述的文本情感分析方法,其特征在于,所述根据每个第二词语在预设情感词典中的情感倾向对所述初始权重进行调整包括:
如果第二词语的情感倾向为正面,则在所述第二词语的初始权重的基础上进行增大,以得到该第二词语的情感权重;
如果第二词语的情感倾向为负面,则在所述第二词语的初始权重的基础上进行减小,以得到该第二词语的情感权重。
5.根据权利要求1所述的文本情感分析方法,其特征在于,所述根据所述待分析文本的句向量确定所述待分析文本的情感类别包括:
根据所述待分析文本的句向量计算所述待分析文本的情感概率;
如果所述情感概率达到设定阈值,则确定所述待分析文本为正面情绪。
6.根据权利要求1所述的文本情感分析方法,其特征在于,所述根据所述待分析文本的句向量确定所述待分析文本的情感类别包括:
根据所述待分析文本的句向量计算所述待分析文本的情感概率;
将所述情感概率与多个阈值区间进行比对,每一阈值区间对应一种情感类别;
确定所述待分析文本的情感类别为所述情感概率落入的阈值区间对应的情感类别。
7.根据权利要求1所述的文本情感分析方法,其特征在于,采用softmax函数、负采样函数或层次softmax函数确定所述待分析文本的情感类别。
8.根据权利要求1所述的文本情感分析方法,其特征在于,所述将所述待分析文本中的各个第一词语转换为词向量包括:
对于未登录词,将所述未登录词的各个字转换为字向量,并将所有字向量之和作为所述未登录词的词向量。
9.根据权利要求1所述的文本情感分析方法,其特征在于,所述获取待分析文本之前还包括:
利用预设原始语料训练词向量模型,以用于将所述待分析文本中的各个第一词语转换为词向量。
10.根据权利要求1所述的文本情感分析方法,其特征在于,所述词向量为N元语法特征向量,N为大于等于2的正整数。
11.根据权利要求1所述的文本情感分析方法,其特征在于,所述利用各个词向量及其对应的情感权重计算得到所述待分析文本的句向量包括:
将各个词向量与其对应的情感权重的乘积之和作为所述待分析文本的句向量。
12.一种文本情感分析装置,其特征在于,包括:
待分析文本获取模块,用以获取待分析文本,所述待分析文本包括多个第一词语;
词向量转换模块,用以将所述待分析文本中的各个第一词语转换为词向量;
句向量计算模块,用以利用各个词向量及其对应的情感权重计算得到所述待分析文本的句向量,每个词向量的情感权重是预先确定的;
情感类别确定模块,用以根据所述待分析文本的句向量确定所述待分析文本的情感类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711441070.0/1.html,转载请声明来源钻瓜专利网。