[发明专利]语音情感识别模型的确定方法、装置、设备及存储介质有效
申请号: | 202010079139.5 | 申请日: | 2020-02-03 |
公开(公告)号: | CN111210844B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 韩文静;李岩;姜涛 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/06 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 模型 确定 方法 装置 设备 存储 介质 | ||
本公开的实施例所得到的语音情感识别模型的确定方法、装置、设备及存储介质,可以通过获取语音样本;将语音样本输入待训练的语音情感识别模型,通过待训练的语音情感识别模型的输出层中预设的K‑1个输出节点对语音样本进行分类,得到输出结果,其中,输出层中预设的K‑1个输出节点为按照指定顺序排列的输出节点;基于预设损失函数根据输出结果,通过确定待训练的语音情感识别模型的损失;当待训练的语音情感识别模型的损失不满足预设条件时,根据损失对待训练的语音情感识别模型的参数进行调整,直至得到训练好的语音情感识别模型,从而可以是的所获得的语音情感识别模型兼顾情感数值的大小和相对顺序,增加情感分类的准确性。
技术领域
本公开涉及信息技术领域,尤其涉及语音情感识别模型的确定方法、装置、设备及存储介质。
背景技术
语音情感识别技术有着广泛的应用场景,根据应用领域的不同,不同的情感识别任务所关注的情感种类也有所不同。例如,电话客服中心关注的多为用户的负面情绪程度,尤其要对用户的愤怒、厌恶等情绪进行监控和干预。
相关技术中,通过回归模型可以识别语音片段的情感属性值,同时回归模型的情感属性值的输出是有大小含义的实数值,因此通过回归模型可以根据该语音片段的情感属性值大小对语音情感进行区分。然而,在回归模型训练中使用均方差作为损失函数,在情感属性值的方差大小相同时,对分类的精度较差。
发明内容
本公开提供语音情感识别模型的确定方法、装置、设备及存储介质,以至少解决相关技术中情感分类不准确的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种语音情感识别模型的确定方法,包括:
获取语音样本;
将语音样本输入待训练的语音情感识别模型,通过待训练的语音情感识别模型的输出层中预设的K-1个输出节点对语音样本进行分类,得到输出结果,其中,输出层中预设的K-1个输出节点为按照指定顺序排列的输出节点,K为大于2的正整数;
基于预设损失函数根据输出结果,确定待训练的语音情感识别模型的损失;
当待训练的语音情感识别模型的损失不满足预设条件时,根据损失对待训练的语音情感识别模型的参数进行调整,直至当待训练的语音情感识别模型的损失满足预设条件时,得到训练好的语音情感识别模型。
可选的,语音样本为标记有K-1个二值标签的向量,获取语音样本包括多个语音片段,二值标签的向量为通过各个语音片段的情感属性预测分值判断得到的向量。
可选的,二值标签的向量的获取方法,包括:
获取第i个语音样本xi的第i语音片段{xi,yi}的情感属性预测分值yi,通过预设函数:
得到语音样本对应的二值标签向量rk为预设阈值。
可选的,上述方法还包括:
获取待识别语音信息,通过训练好的语音情感识别模型对待识别语音信息进行识别,得到待识别语音信息的情感种类。
可选的,将语音样本输入待训练的语音情感识别模型,通过待训练的语音情感识别模型的输出层中预设的K-1个输出节点对语音样本进行分类,得到输出结果,包括:
将语音样本输入待训练的语音情感识别模型,利用待训练的语音情感识别模型,提取语音片段的语音向量;
通过待训练的语音情感识别模型的输出层中预设的K-1个输出节点对语音样本的语音向量进行映射,得到输出结果。
可选的,基于预设损失函数根据输出结果,通过确定待训练的语音情感识别模型的损失,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010079139.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离心式多次雾化分离装置
- 下一篇:壳体加工方法、壳体及电子设备