[发明专利]语音情感识别方法及相关装置、电子设备和存储介质在审
申请号: | 202111363984.6 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114333786A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 石周;高天;方昕 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/25;G10L25/63 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 方法 相关 装置 电子设备 存储 介质 | ||
本申请公开了一种语音情感识别方法及相关装置、电子设备和存储介质,其中,语音情感识别方法包括:获取待识别语音;利用情感识别网络对待识别语音进行识别,得到待识别语音的情感类别;其中,情感识别网络包含于联合模型,联合模型还包括域识别网络,联合模型是基于情感识别网络对属于第一数据域类别的第一样本语音的情感分类损失以及域识别网络分别对第一样本语音和第二样本语音的域分类损失联合训练得到的,且第二样本语音属于第二数据域类别,第一样本语音标注有样本情感类别。上述方案,能够在具有准确情感类别标注的样本数据较为稀少的情况下,提升语音情感识别的准确性。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种语音情感识别方法及相关装置、电子设备和存储介质。
背景技术
语音情感识别是指从说话人的语音中识别出说话人即时的情绪状态(即情感类别),如包括但不限于:高兴、悲伤、生气、吃惊、厌恶、恐惧等等。在人机交互、医疗、教育、话务等诸多需要与人交互以开展业务的行业或场景中,语音情感识别的作用也愈发突显。
随着深度学习的飞速发展,采用网络模型进行语音情感识别已经逐渐成为主流技术之一。通常来说,网络模型的精准识别依赖于对大量样本数据的标注。然而,由于真实环境下语音情感数据的缺乏、情感的主观性等诸多因素导致具有准确情感类别标注的样本数据较为稀少,从而严重制约了网络模型的准确性,影响语音情感识别。有鉴于此,如何在具有准确情感类别标注的样本数据较为稀少的情况下,提升语音情感识别的准确性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种语音情感识别方法及相关装置、电子设备和存储介质,能够在具有准确情感类别标注的样本数据较为稀少的情况下,提升语音情感识别的准确性。
为了解决上述技术问题,本申请第一方面提供了一种语音情感识别方法,包括:获取待识别语音;利用情感识别网络对待识别语音进行识别,得到待识别语音的情感类别;其中,情感识别网络包含于联合模型,联合模型还包括域识别网络,联合模型是基于情感识别网络对属于第一数据域类别的第一样本语音的情感分类损失以及域识别网络分别对第一样本语音和第二样本语音的域分类损失联合训练得到的,且第二样本语音属于第二数据域类别,第一样本语音标注有样本情感类别。
为了解决上述技术问题,本申请第二方法提供了一种语音情感识别装置,包括:语音获取模块和情感识别模块,语音获取模块用于获取待识别语音;情感识别模块用于利用情感识别网络对待识别语音进行识别,得到待识别语音的情感类别;其中,情感识别网络包含于联合模型,联合模型还包括域识别网络,联合模型是基于情感识别网络对属于第一数据域类别的第一样本语音的情感分类损失以及域识别网络分别对第一样本语音和第二样本语音的域分类损失联合训练得到的,且第二样本语音属于第二数据域类别,第一样本语音标注有样本情感类别。
为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的语音情感识别方法。
为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的语音情感识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111363984.6/2.html,转载请声明来源钻瓜专利网。