|
钻瓜专利网为您找到相关结果 35个,建议您 升级VIP下载更多相关专利
- [发明专利]基于时空多重融合网络的变长语音情感识别方法-CN202210554870.8在审
-
甘臣权;王可欣;祝清意
-
重庆邮电大学
-
2022-05-19
-
2022-10-18
-
G10L15/06
- 本发明涉及一种基于时空多重融合网络的变长语音情感识别方法,属于人工智能领域。该发明包括以下步骤:利用短时傅里叶变换和Mel滤波器组将语音映射为对数Mel滤波能量谱,并保持能量谱的原始长度;利用双向门控循环单元(Bidirectional gated recurrent unit,BiGRU)和注意力机制捕获能量谱的时域情感变化;利用卷积神经网络(Convolutional neuralnetwork,CNN)和全局平均池化定位能量谱的空域情感触发;利用直接连接和集成策略引入多重融合方法,用于能量谱时域与空域的情感交互;利用多分类交叉熵损失函数作为模型训练的指导,实现模型优化。本发明保持语音能量谱的长度不变,可对能量谱的时域与空域实现特征提取互不影响,并通过多重融合获得更完整的时空域情感信息,从而提升语音的情感识别精度。
- 基于时空多重融合网络变长语音情感识别方法
|