[发明专利]文本情感分析方法及装置、存储介质、终端在审
申请号: | 201711441070.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108052505A | 公开(公告)日: | 2018-05-18 |
发明(设计)人: | 陈培华;朱频频 | 申请(专利权)人: | 上海智臻智能网络科技股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张振军;吴敏 |
地址: | 201803 上海市嘉*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 分析 方法 装置 存储 介质 终端 | ||
一种文本情感分析方法及装置、存储介质、终端,文本情感分析方法,包括:获取待分析文本,所述待分析文本包括多个第一词语;将所述待分析文本中的各个第一词语转换为词向量;利用各个词向量及其对应的情感权重计算得到所述待分析文本的句向量,每个词向量的情感权重是预先确定的;根据所述待分析文本的句向量确定所述待分析文本的情感类别。通过本发明技术方案可以提高文本情感分析的效率和准确性。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种文本情感分析方法及装置、存储介质、终端。
背景技术
文本情感分析,又称意见挖掘(Opinion Mining),是指对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分析技术在网络营销、企业舆情监控、政府舆论监控等扮演越来越重要的角色。情感分类是文本情感分析技术的一项子任务,其利用底层情感信息抽取的结果将情感文本分为若干情感类别,如分为褒贬两类情感类别,其中,褒类情感类别对应的文本为正面文本,贬类情感类别对应的文本为负面文本。
现有技术中,对文本进行分类的方法主要采用基于机器学习的监督分类方法。基于机器学习的监督分类方法包括训练分类器过程和使用分类器对待分类文本进行分类过程。其中,在训练分类器过程中,需要人工构建大量的特征工程,因此需要人工进行长时间劳动,极大的耗费了人力;另一方面,传统方法中所构建的文本向量表示存在稀疏性,容易导致维度灾难,并使分类器的训练时间较长,从而降低了对待分类文本进行分类的效率。训练得到的分类器由于缺乏对文本的语义信息表示,导致使用分类器对待分类文本进行分类的结果的准确率较低。
发明内容
本发明解决的技术问题是如何提高文本情感分析的效率和准确性。
为解决上述技术问题,本发明实施例提供一种文本情感分析方法,文本情感分析方法包括:获取待分析文本,所述待分析文本包括多个第一词语;将所述待分析文本中的各个第一词语转换为词向量;利用各个词向量及其对应的情感权重计算得到所述待分析文本的句向量,每个词向量的情感权重是预先确定的;根据所述待分析文本的句向量确定所述待分析文本的情感类别。
可选的,所述获取待分析文本包括:根据词典对待分析文本进行分词处理,得到多个第一词语,所述词典包括多个第二词语。
可选的,所述获取待分析文本包括还包括:获取每个第二词语的初始权重;根据每个第二词语在预设情感词典中的情感倾向对所述初始权重进行调整,以得到每个第二词语对应的情感权重,第二词语对应的情感权重等同于所述第一词语的词向量对应的情感权重。
可选的,所述根据每个第二词语在预设情感词典中的情感倾向对所述初始权重进行调整包括:如果第二词语的情感倾向为正面,则在所述第二词语的初始权重的基础上进行增大,以得到该第二词语的情感权重;如果第二词语的情感倾向为负面,则在所述第二词语的初始权重的基础上进行减小,以得到该第二词语的情感权重。
可选的,所述根据所述待分析文本的句向量确定所述待分析文本的情感类别包括:根据所述待分析文本的句向量计算所述待分析文本的情感概率;如果所述情感概率达到设定阈值,则确定所述待分析文本为正面情绪。
可选的,所述根据所述待分析文本的句向量确定所述待分析文本的情感类别包括:根据所述待分析文本的句向量计算所述待分析文本的情感概率;将所述情感概率与多个阈值区间进行比对,每一阈值区间对应一种情感类别;确定所述待分析文本的情感类别为所述情感概率落入的阈值区间对应的情感类别。
可选的,采用softmax函数、负采样函数或层次softmax函数确定所述待分析文本的情感类别。
可选的,所述将所述待分析文本中的各个第一词语转换为词向量包括:对于未登录词,将所述未登录词的各个字转换为字向量,并将所有字向量之和作为所述未登录词的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海智臻智能网络科技股份有限公司,未经上海智臻智能网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711441070.0/2.html,转载请声明来源钻瓜专利网。