[发明专利]文本的情感识别方法、装置、电子设备和存储介质在审
申请号: | 202110343166.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113095085A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 刘美宁;王方舟;王文韬 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/295;G06F40/284;G06F40/242;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 陈蕾 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 情感 识别 方法 装置 电子设备 存储 介质 | ||
1.一种文本的情感识别方法,其特征在于,包括:
确定待识别文本的字符矩阵,所述字符矩阵由所述待识别文本中各个字符分别对应的字符向量构成;
确定所述待识别文本的位置向量,所述位置向量用于表征目标字符在所述待识别文本中的位置,所述目标字符为所述各个字符中匹配目标情感的字符;
将所述字符矩阵与所述位置向量构成的文本矩阵输入预训练的情感识别模型中,所述情感识别模型用于从所述文本矩阵中提取所述待识别文本的上下文信息,根据所述上下文信息对应的信息向量确定并输出所述待识别文本与所述目标情感的匹配程度。
2.根据权利要求1所述的方法,其特征在于,所述确定待识别文本的字符矩阵,包括:
在预设的字向量库中查询待识别文本中各个字符分别对应的字符向量;
将所述各个字符分别对应的字符向量合并为对应于所述待识别文本的字符矩阵。
3.根据权利要求1所述的方法,其特征在于,所述确定所述待识别文本的位置向量,包括:
在记录有情感实体词的情感词库中,查询所述各个字符中匹配所述情感实体词的目标字符;
根据查询到的所述目标字符在所述待识别文本中的位置,生成所述待识别文本的位置向量。
4.根据权利要求3所述的方法,其特征在于,所述情感词库中的情感实体词,包括下述至少之一:
中文单字、中文词语、英文单词、英文短语、图形表情。
5.一种情感识别模型的训练方法,其特征在于,包括:
获取样本待识别文本以及所述样本待识别文本的情感标记结果,所述情感标记结果包括所述样本待识别文本与样本目标情感的真实匹配程度;
确定所述样本待识别文本的样本字符矩阵和样本位置向量,所述样本字符矩阵由所述样本待识别文本中各个样本字符分别对应的样本字符向量构成,所述样本位置向量用于表征样本目标字符在所述样本待识别文本中的位置,所述样本目标字符为所述样本待识别文本中匹配所述样本目标情感的样本字符;
将所述样本字符矩阵与所述样本位置向量构成的样本文本矩阵输入待训练模型中,以获取所述待训练模型从所述样本文本矩阵中提取所述样本待识别文本的样本上下文信息后,根据所述样本上下文信息对应的样本信息向量确定并输出的所述样本待识别文本与所述样本目标情感的预测匹配程度;
根据所述预测匹配程度与所述真实匹配程度之间的差异调整所述待训练模型的模型参数并继续训练,直至预设的终止条件满足时终止训练,得到所述情感识别模型。
6.一种文本的情感识别装置,其特征在于,包括:
矩阵确定单元,被配置为确定待识别文本的字符矩阵,所述字符矩阵由所述待识别文本中各个字符分别对应的字符向量构成;
向量确定单元,被配置为确定所述待识别文本的位置向量,所述位置向量用于表征目标字符在所述待识别文本中的位置,所述目标字符为所述各个字符中匹配目标情感的字符;
情感识别单元,被配置为将所述字符矩阵与所述位置向量构成的文本矩阵输入预训练的情感识别模型中,所述情感识别模型用于从所述文本矩阵中提取所述待识别文本的上下文信息,根据所述上下文信息对应的信息向量确定并输出所述待识别文本与所述目标情感的匹配程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110343166.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铝合金免二次镀镍处理环保工艺
- 下一篇:CT扫描方法、装置及电子设备