[发明专利]一种语音情绪识别方法、装置及电子设备有效
| 申请号: | 202110929972.9 | 申请日: | 2021-08-13 |
| 公开(公告)号: | CN113808619B | 公开(公告)日: | 2023-10-20 |
| 发明(设计)人: | 陈蓉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/24;G06N3/0464;G06N3/084 |
| 代理公司: | 北京猷德知识产权代理有限公司 16084 | 代理人: | 范继晨 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 情绪 识别 方法 装置 电子设备 | ||
1.一种语音情绪识别方法,包括:
获取目标对象的原始语音特征;
获取所述原始语音特征的原始区域,其中,所述原始区域用于表征所述原始语音特征在原始粒度中的情绪信息;
对所述原始区域中包括的至少两个单元进行合并处理,基于处理结果得到目标区域,并基于所述原始区域和所述目标区域对所述原始语音特征进行处理,得到目标语音特征,其中,所述目标区域用于表征所述原始语音特征在目标粒度中的所述情绪信息,所述目标粒度大于所述原始粒度;
对所述目标语音特征进行识别,得到与所述目标语音特征匹配的语音情绪结果。
2.根据权利要求1所述的方法,其中,所述目标区域包括如下至少之一:第一区域、第二区域,所述目标粒度包括如下至少之一:第一粒度、第二粒度,对所述原始区域中包括的至少两个单元进行合并处理,基于处理结果得到目标区域,包括:
将所述原始区域中的第一单元和第一相邻单元进行合并,得到合并后的所述第一区域,其中,所述第一区域用于描述所述原始语音特征在所述第一粒度中的情绪信息,所述第一粒度大于所述原始粒度,所述第一相邻单元为与所述第一单元相邻的一个单元;
将所述原始区域中的第二单元和第二相邻单元进行合并,得到合并后的所述第二区域,其中,所述第二区域用于描述所述原始语音特征在所述第二粒度中的情绪信息,所述第二粒度大于所述第一粒度,所述第二相邻单元为与所述第二单元相邻的两个单元。
3.根据权利要求1所述的方法,其中,基于所述原始区域和所述目标区域对所述原始语音特征进行处理,得到目标语音特征,包括:
获取所述原始区域中每个单元的第一键值;
对所述每个单元的所述第一键值进行处理,得到所述原始区域的第一目标键值;
获取所述目标区域中所述每个单元的第二键值;
对所述每个单元的所述第二键值进行处理,得到所述目标区域的第二目标键值;
基于所述第一目标键值和所述第二目标键值对所述原始语音特征进行处理,得到所述目标语音特征。
4.根据权利要求1所述的方法,其中,
获取所述原始语音特征的原始区域,包括:
利用第一神经网络获取所述原始语音特征的所述原始区域;
对所述目标语音特征进行识别,得到与所述目标语音特征匹配的语音情绪结果,包括:
利用第二神经网络对所述目标语音特征进行识别,得到与所述目标语音特征匹配的所述语音情绪结果。
5.根据权利要求4所述的方法,还包括:
获取样本语音数据;
根据预设时长对所述样本语音数据进行划分,得到样本语音片段;
提取所述样本语音片段中的样本语音特征;
基于所述样本语音特征对第一预设神经网络和第二预设神经网络进行训练,得到所述第一神经网络和所述第二神经网络。
6.根据权利要求5所述的方法,其中,基于所述样本语音特征对第一预设神经网络和第二预设神经网络进行训练,得到第一神经网络和第二神经网络,包括:
利用预设卷积层对所述样本语音特征进行处理,得到样本抽象特征;
利用所述样本抽象特征对所述第一预设神经网络进行训练,得到所述第一神经网络,并输出样本目标特征;
基于所述样本目标特征对所述第二预设神经网络进行训练,输出训练结果,并得到所述第二神经网络。
7.根据权利要求6所述的方法,其中,利用样本抽象特征对所述第一预设神经网络进行训练,得到第一神经网络,并输出样本目标特征,包括:
利用所述样本抽象特征对所述第一预设神经网络中所述原始区域对应的第一键值和所述目标区域对应的第二键值进行训练,得到所述第一神经网络;
并利用所述第一神经网络提取所述样本语音特征中的所述样本目标特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110929972.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多级时间呈现装置及其方法
- 下一篇:一种镁合金笔记本外壳磨抛装置





