[发明专利]一种基于集成深度信念网络的语音情感识别方法有效
申请号: | 201610590174.7 | 申请日: | 2016-07-25 |
公开(公告)号: | CN106297825B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 文贵华;黄驹斌 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L15/14;G10L15/06 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 郑浦娟 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于集成深度信念网络的语音情感识别方法,步骤如下:S1、获取深度信念网络分类器,其中该深度信念网络分类器包括M个深度信念网络模型以及M个深度信念网络模型输出端共同连接的分类器;所述M个深度信念网络模型及M个深度信念网络模型输出端共同连接的分类器经过语音情感识别数据库数据集训练后得到深度信念网络分类器;S2、获取待测语音信号的特征向量;S3、在测试时,将待测语音信号的特征向量输入步骤S1获取到的深度信念网络分类器中,获得语音情感类别。本发明方法具有语音情感识别准确率高的优点,并且减少了语音情感特征提取对人的依赖性,能够能识别出多种语言的语音情感。 | ||
搜索关键词: | 一种 基于 集成 深度 信念 网络 语音 情感 识别 方法 | ||
【主权项】:
1.一种基于集成深度信念网络的语音情感识别方法,其特征在于,步骤如下:S1、获取深度信念网络分类器,其中该深度信念网络分类器包括M个深度信念网络模型以及M个深度信念网络模型输出端共同连接的分类器;所述M个深度信念网络模型及M个深度信念网络模型输出端共同连接的分类器经过语音情感识别数据库数据集训练后得到深度信念网络分类器,其中,深度信念网络分类器获取过程具体如下:S11、针对语音情感识别数据库抽取特征,获取到语音情感识别数据库中每个样本对应的特征向量,从语音情感识别数据库抽取一部分样本作为验证集;S12、设置子空间规模M以及子空间中每个样本特征向量每次被抽取的维度n;S13、针对每个样本的特征向量进行M次的随机抽取组成M个子空间,即每次每个样本特征向量被抽取部分组合构成一个子空间,一个子空间对应形成一个新的训练集;其中每次针对每个样本特征向量随机抽取的维度为n维;S14、生成M个深度信念网络模型,并且在M个深度信念网络模型输出端共同连接一个分类器,采用步骤S12中获取的M个新的训练集分别对对应的M个深度信念网络模型及M个深度信念网络模型输出端共同连接的分类器进行训练,得到一个深度信念网络分类器;S15、子空间规模M以步长X值遍历X1~X2值,每个样本特征向量被抽取的维度n以步长Z值遍历Z1~Z2值,然后分别通过步骤S13至步骤S14获取到对应的[(X2‑X1)/X+1]*[(Z2‑Z1)/Z+1]个深度信念网络分类器;S16、采用步骤S11中获取到的验证集针对S15获取到的[(X2‑X1)/X+1]*[(Z2‑Z1)/Z+1]个深度信念网络分类器分别进行验证,然后选取出识别准确率最高的一个深度信念网络分类器;S2、获取待测语音信号的特征向量;S3、在测试时,将待测语音信号的特征向量输入步骤S1获取到的深度信念网络分类器中,获得语音情感类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610590174.7/,转载请声明来源钻瓜专利网。