[发明专利]文本的情感识别方法、装置、电子设备和存储介质在审
申请号: | 202110343166.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113095085A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 刘美宁;王方舟;王文韬 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/295;G06F40/284;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 识别 方法 装置 电子设备 存储 介质 | ||
本公开关于文本的情感识别方法、装置、电子设备和存储介质。所述方法包括:确定待识别文本的字符矩阵,所述字符矩阵由待识别文本中各个字符分别对应的字符向量构成;确定待识别文本的位置向量,所述位置向量用于表征目标字符在待识别文本中的位置,所述目标字符为所述各个字符中匹配目标情感的字符;将字符矩阵与位置向量构成的文本矩阵输入预训练的情感识别模型中,所述情感识别模型用于从文本矩阵中提取待识别文本的上下文信息,及根据该上下文信息对应的信息向量确定并输出待识别文本与目标情感的匹配程度。该方案能够提取待识别文本的上下文信息并充分理解文本的真实语义,所以该位置向量能够保证了情感识别的准确度。
技术领域
本公开涉及机器学习领域,尤其涉及文本的情感识别方法、装置、电子设备和存储介质。
背景技术
文章、语句、评论等文本通常能够反映作者的情感倾向,如针对某事物的好恶倾向、针对某货品的喜好倾向等,对文本的情感倾向进行识别是现阶段自然语言处理(Natural Language Processing,NLP)技术的重要手段。现阶段,行业内采用多种方式实现对文本的情感识别。
一类方案是采用情感字典匹配的方式或基于机器学习的分类模型对文本进行情感识别。这类方案通常根据预先建立的情感词典由前至后遍历待识别文本,然后在提取出被命中的情感实体词后通过相应的匹配策略确定待识别文本的情感倾向。然而这类方案不仅识别结果很大程度上依赖于情感词典的构建方式和词汇丰富程度,而且仅能够从词粒度上分析文本的情感倾向而无法理解文本语义,故准确度较低且适用场景有限。
另一类方案采用SVM(支持向量机,Support Vector Machine)或朴素贝叶斯等基于机器学习的分类模型对文本进行情感识别,但是这类模型对词语特征的选择依赖性较强,而且因为使用词向量因而也难以完整表达语义层面的信息,因此使用难度较高且准确度有待提升。
发明内容
本公开提供了文本的情感识别方法、装置、电子设备和存储介质,以至少解决相关技术中的技术问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提出一种文本的情感识别方法,包括:
确定待识别文本的字符矩阵,所述字符矩阵由所述待识别文本中各个字符分别对应的字符向量构成;
确定所述待识别文本的位置向量,所述位置向量用于表征目标字符在所述待识别文本中的位置,所述目标字符为所述各个字符中匹配目标情感的字符;
将所述字符矩阵与所述位置向量构成的文本矩阵输入预训练的情感识别模型中,所述情感识别模型用于从所述文本矩阵中提取所述待识别文本的上下文信息,根据所述上下文信息对应的信息向量确定并输出所述待识别文本与所述目标情感的匹配程度。
可选的,所述确定待识别文本的字符矩阵,包括:
在预设的字向量库中查询待识别文本中各个字符分别对应的字符向量;
将所述各个字符分别对应的字符向量合并为对应于所述待识别文本的字符矩阵。
可选的,所述确定所述待识别文本的位置向量,包括:
在记录有情感实体词的情感词库中,查询所述各个字符中匹配所述情感实体词的目标字符;
根据查询到的所述目标字符在所述待识别文本中的位置,生成所述待识别文本的位置向量。
可选的,所述情感词库中的情感实体词,包括下述至少之一:
中文单字、中文词语、英文单词、英文短语、图形表情。
可选的,通过下述之一的算法生成所述待识别文本的位置向量:BIE表示法、SBME表示法、CS表示法。
可选的,还包括:
获取待识别的原始文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343166.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铝合金免二次镀镍处理环保工艺
- 下一篇:CT扫描方法、装置及电子设备