[发明专利]一种文本情感识别方法、装置、计算机设备和存储介质在审

专利信息
申请号: 202111101875.7 申请日: 2021-09-18
公开(公告)号: CN113779991A 公开(公告)日: 2021-12-10
发明(设计)人: 谭又伟;赖金南 申请(专利权)人: 广州荔支网络技术有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/242;G06F40/211
代理公司: 广州佳睿知识产权代理事务所(普通合伙) 44610 代理人: 李健富
地址: 510000 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 情感 识别 方法 装置 计算机 设备 存储 介质
【说明书】:

发明涉及一种文本情感识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别文本的文本数据,对所述文本数据进行分词处理,确定文本数据的目标分词;将目标分词与预设情感词典进行匹配,识别出极性词、修饰词;计算由极性词与其相应的修饰词所组成的极性短语的极性强度,根据得到的极性短语的极性强度确定文本数据的极性强度;若文本数据的极性强度大于或小于预设阀值,则根据文本数据的极性强度确定所述待识别文本所属的情感类别;若文本数据的极性强度等于预设阀值,则获取待识别文本的表情符号;根据表情符号的极性强度确定所述待识别文本所属的情感类别。所述方法能够有效提升情感分析的准确率。

技术领域

本发明涉及情感分析技术领域,尤其是涉及一种文本情感识别方法、装置、计算机设备和存储介质。

背景技术

文章、语句、评论等文本通常能够反映发表者的情感倾向,如针对某事件的态度倾向、针对某物体或某人物的喜好倾向等。现阶段,行业内采用多种方式实现对文本的情感识别。

其中,基于情感词典的文本情感分析,是对人的记忆和判断思维的最简单的模拟。首先通过学习来记忆一些基本词汇,如否定词语有“不”,积极词语有“喜欢”、“爱”,消极词语有“讨厌”、“恨”等,从而在大脑中形成一个基本的语料库。然后,再对输入的句子进行最直接的拆分,看看所记忆的词汇表中是否存在相应的词语,然后根据这个词语的类别来判断情感,比如“我喜欢白菜”,“喜欢”这个词在所记忆的积极词汇表中,所以判断它具有积极的情感。

然而,基于情感词典的文本情感分析存在以下缺点:

1、假设了所有积极词语、消极词语的权重都是相等的,这只是在简单的判断情况下成立,更精准的分类显然不成立的,比如“恨”要比“讨厌”来得严重;

2、假设了权值是线性叠加的,这在多数情况下都不会成立;

3、对于否定词和程度副词的处理,仅仅是作了简单的取反和加倍,而事实上,各个否定词和程度副词的权值也是不一样的,比如“非常喜欢”显然比“挺喜欢”程度深,但传统的基于词典的方法对此并没有区分。

基于有监督的机器学习方法,是把情感识别当做普通的分类问题,即对每个文本判断是否为(negative,positive,neutral)的多分类问题。常用的分类算法LR、朴素贝叶斯、 SVM、GBDT、神经网络等分类算法都可以使用。

然而,基于有监督的机器学习方法存在以下缺点:

1、需要人工标注训练集合,费时费力,不适合网络上的大规模应用;

2、需要人工特征工程。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种文本情感识别方法、装置、计算机设备和存储介质。

第一方面,本发明实施例提供了一种文本情感识别方法。

所述文本情感识别方法包括以下步骤:

获取待识别文本的文本数据,对所述文本数据进行分词处理,根据得到的分词确定文本数据的目标分词;

将目标分词与预设情感词典的极性词进行匹配,识别出文本数据的极性词;

将目标分词与预设情感词典的修饰词进行匹配,识别出文本数据的修饰词;

计算由极性词与其相应的修饰词所组成的极性短语的极性强度,根据得到的极性短语的极性强度确定文本数据的极性强度;

若文本数据的极性强度大于或小于预设阀值,则根据文本数据的极性强度确定所述待识别文本所属的情感类别;

若文本数据的极性强度等于预设阀值,则获取待识别文本的表情符号;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州荔支网络技术有限公司,未经广州荔支网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111101875.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top