[发明专利]一种情绪类别确定方法、装置、设备及可读存储介质在审
| 申请号: | 202210813487.X | 申请日: | 2022-07-11 |
| 公开(公告)号: | CN115171731A | 公开(公告)日: | 2022-10-11 |
| 发明(设计)人: | 赵沁;杨栋;曹木勇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L17/02;G10L15/26;G06F40/30;G06K9/62 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 彭程 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 情绪 类别 确定 方法 装置 设备 可读 存储 介质 | ||
本申请实施例公开了一种情绪类别确定方法、装置、设备及可读存储介质,涉及人工智能中机器学习技术和语音处理技术,其中,方法包括:获取待识别的目标语音,以及该目标语音对应的目标文本;从该目标语音中提取声纹信息,基于该声纹信息确定第一情绪类别;从目标文本中提取语义信息,基于语义信息确定第二情绪类别;基于声纹信息中的声纹嵌入向量和该语义信息中的语义嵌入向量进行特征融合处理,得到融合嵌入向量,基于融合嵌入向量确定第三情绪类别;基于该第一情绪类别、该第二情绪类别和该第三情绪类别,确定该目标语音的目标情绪类别,目标情绪类别用于反映该目标语音所属的情绪类别。采用本申请实施例,可以提高情绪类别确定的准确性。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种情绪类别确定方法、装置、设备及可读存储介质。
背景技术
基于语音的情绪理解技术遇到的挑战并不少,尤其涉及到情绪的定义及准确标定,情绪数据的收集与筛选等,这些困难都会影响到语音情绪理解系统的准确性。
目前的方案一般是通过对语音数据进行语音识别得到文本数据,基于文本数据确定语音数据包含的情绪,该种方式不能充分挖掘语音中的情绪信息,导致情绪类别确定的准确率较低。
发明内容
本申请实施例提供一种情绪类别确定方法、装置、设备及可读存储介质,可以提高情绪类别确定的准确性。
第一方面,本申请提供一种情绪类别确定方法,包括:
获取待识别的目标语音,以及该目标语音对应的目标文本;
从该目标语音中提取声纹信息,基于该声纹信息确定第一情绪类别,该声纹信息包括声纹嵌入向量;
从该目标文本中提取语义信息,基于该语义信息确定第二情绪类别,该语义信息包括语义嵌入向量;
对该声纹嵌入向量和该语义嵌入向量进行特征融合处理,得到融合嵌入向量;
基于该融合嵌入向量确定该目标语音与多个预设融合情绪类别中每个预设融合情绪类别之间的匹配概率;
基于该多个预设融合情绪类别和匹配概率确定第三情绪类别;
基于该第一情绪类别、该第二情绪类别和该第三情绪类别,确定该目标语音的目标情绪类别,该目标情绪类别用于反映该目标语音所属的情绪类别。
第二方面,本申请提供一种情绪类别确定装置,包括:
数据获取单元,用于获取待识别的目标语音,以及该目标语音对应的目标文本;
声纹提取单元,用于从该目标语音中提取声纹信息,基于该声纹信息确定第一情绪类别,该声纹信息包括声纹嵌入向量;
语义提取单元,用于从该目标文本中提取语义信息,基于该语义信息确定第二情绪类别,该语义信息包括语义嵌入向量;
信息融合单元,用于对该声纹嵌入向量和该语义嵌入向量进行特征融合处理,得到融合嵌入向量;
该信息融合单元,还用于基于该融合嵌入向量确定该目标语音与多个预设融合情绪类别中每个预设融合情绪类别之间的匹配概率;
该信息融合单元,还用于基于该多个预设融合情绪类别和匹配概率确定第三情绪类别;
类别确定单元,用于基于该第一情绪类别、该第二情绪类别和该第三情绪类别,确定该目标语音的目标情绪类别,该目标情绪类别用于反映该目标语音所属的情绪类别。
第三方面,本申请提供了一种计算机设备,包括:处理器、存储器;
上述处理器与存储器相连,其中,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以使包含该处理器的计算机设备执行上述情绪类别确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210813487.X/2.html,转载请声明来源钻瓜专利网。





