[发明专利]一种使用谱图和深卷积神经网络进行语音情感识别的方法在审
| 申请号: | 201710724721.0 | 申请日: | 2017-08-22 |
| 公开(公告)号: | CN107705806A | 公开(公告)日: | 2018-02-16 |
| 发明(设计)人: | 袁家政;刘宏哲;龚灵杰 | 申请(专利权)人: | 北京联合大学 |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30 |
| 代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙)11367 | 代理人: | 谢亮 |
| 地址: | 100101 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 使用 卷积 神经网络 进行 语音 情感 识别 方法 | ||
1.一种使用谱图和深卷积神经网络进行语音情感识别的方法,包括以下步骤:
步骤1:根据语音信号生成频谱图;
步骤2:构建深卷积神经网络模型;
步骤3:用大量的频谱图作为输入,训练并优化所述深卷积神经网络模型;
步骤4:对训练好的所述深卷积神经网络模型进行测试并优化。
2.如权利要求1所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述频谱图是语音信号的特定波形的频率随时间变化的视觉表现。
3.如权利要求2所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述频谱图是一个二位图形,横坐标表示时间,纵坐标表示频率。
4.如权利要求3所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述频谱图是指对所述语音信号加入FFT转换计算得到时间和频率的关系。
5.如权利要求4所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:为了观察所述语音信号某一时刻的频率,将所述语音信号分成多个块,每一块都进行FFT转换。
6.如权利要求5所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于非周期性连续时间信号X(t)的傅里叶变化定义为:计算出来的是信号X(t)的连续频谱,在实际应用中得到的是连续信号X(t)的离散采样值X(nT)。
7.如权利要求6所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:利用离散信号X(nT)来计算信号X(t)的频谱,有限长离散信号X(n),n=0,1,...,N-1的DFT定义其中,N为采样点个数,j表负数的虚部。
8.如权利要求7所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述深卷积神经网络模型由三个卷积层,三个全连接层和一个softamx层组成。
9.如权利要求8所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:所述步骤1还包括把得到的N*N像素的所述频谱图作为卷积神经网络的输入。
10.如权利要求9所述的使用谱图和深卷积神经网络进行语音情感识别的方法,其特征在于:初始的所述卷积层中用卷积函数从频谱图中提取特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710724721.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低功耗待机休眠电路
- 下一篇:一种基于身份证件的访客管理系统及方法





