[发明专利]基于声道调制信号MFCC的汉语语音情感点识别方法无效

专利信息
申请号: 201210076307.0 申请日: 2012-03-21
公开(公告)号: CN102655003A 公开(公告)日: 2012-09-05
发明(设计)人: 毛峡;魏鹏飞 申请(专利权)人: 北京航空航天大学
主分类号: G10L17/00 分类号: G10L17/00;G10L15/14
代理公司: 暂无信息 代理人: 暂无信息
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种可以提高情感点平均识别率的方法,该方法为:制定电声门图情感数据和语音数据库规范;收集电声门图情感数据和语音数据;对收集的数据进行主观评测,选出其中一套数据子集作为研究对象。对数据子集中的电声门图信号和语音信号进行预处理,并提取语音信号中的短时特征及相应的统计特征和MEL倒谱系数SMFCC;再将电声门图信号和语音信号进行快速傅里叶变换后相除,计算相除后得到的声道信息的MEL倒谱系数TMFCC。分别用不同的特征组合进行实验,求解说话人相关和说话人无关时28个情感点在不同特征组合下的平均识别率。实验结果表明采用TMFCC特征组合可以提高情感点平均识别率。
搜索关键词: 基于 声道 调制 信号 mfcc 汉语 语音 情感 识别 方法
【主权项】:
汉语声门激励信息和语音信息提取,其步骤如下:步骤1:制定语音数据库规范;选择10名发音人员,年龄20至30周岁,职业为学生,其中包括5名女性,5名男性;选择28个常用的没有明显情感倾向的汉语普通话感叹词作为情感点用于录音脚本;步骤2:收集电声门图数据和情感语音数据;步骤2.1:录音地点为一间空旷的实验室,录制时间选择在晚上,录音设备采用DELLOPTIPLEX 330电脑,TIGEX‑EGG3电声门图仪,BE‑8800驻极体电容式麦克风,录音软件采用的是GOLDWAVE,录制双声道数据,左声道为麦克风采集的语音数据,右声道为电声门图仪采集的声门激励数据;步骤2.2:请说话者以指定的情感朗读所有录音脚本,重复3遍,并请说话者对录制语音进行个人评价,如符合本人的表达意愿,则将结果保存为采样率44100Hz,16Bit双声道PCM编码格式的WAV文件,否则重复步骤2.2;步骤2.3:更换说话者重复步骤2.2,得到10名说话者的电声门图数据和语音数据各840条;步骤3:邀请10位评测者对2.3中得到的电声门图数据和语音数据进行评测,据评测结果,从数据全集中选择1套数据子集,该数据子集中的电声门图数据和语音数据至少被7人正确识别,该子集包括3男2女共5名说话者的电声门图数据和语音数据各420条。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210076307.0/,转载请声明来源钻瓜专利网。

同类专利
  • 家电设备语音控制方法-201210314209.6
  • 金启明;赵仕才;范晓波;杨芳 - 四川长虹电器股份有限公司
  • 2012-08-30 - 2012-12-26 - G10L17/00
  • 本发明涉及控制技术。本发明解决了现有家电设备语音控制方法中无法区分使用人员的问题,提供了一种家电设备语音控制方法,其技术方案可概括为:首先在语音控制的家电设备上建立使用者声纹特征库及使用者声纹特征库管理界面,然后存储至少一个使用者的声纹特征于使用者声纹特征库,在使用时,家电设备开始监听语音输入,若接收到语音信息则根据接收到的语音信息判断其中是否包含控制指令,若不是则不进行处理,若是则根据接收到的语音信息判断其中的控制指令发出者声纹是否与使用者声纹特征库中的某个使用者的声纹特征相符,若不是则不进行处理,若是则根据该控制指令执行相应的操作。本发明的有益效果是,方便用户,适用于家电设备语音控制。
  • 一种声纹识别方法-201210295572.8
  • 申富饶;唐泽林;赵金熙;程佳 - 南京大学
  • 2012-08-17 - 2012-12-12 - G10L17/00
  • 本发明公开了一种声纹识别方法,包括以下步骤:步骤1,对训练语音集内每个说话人的分段语音数据预处理,形成预处理后对应每个说话人的一组样本集合;步骤2,对所有样本集合中每一个样本进行提取梅尔倒谱系数;步骤3,逐一选定一个样本集合并随机选取其中部分样本的梅尔倒谱系数,对该样本集合训练高斯混合模型;步骤4,将步骤3中未被选取训练过的样本,与其对应样本集合的高斯混合模型逐个进行增量学习得到所有优化后的高斯混合模型,利用所有优化后的高斯混合模型优化模型库;步骤5,输入并识别测试语音数据,利用步骤4中优化的模型库识别测试语音数据对应的样本集合的高斯混合模型,将测试语音数据加入到该说话人对应的样本集合中。
  • 说话人估计方法和说话人估计设备-201110145601.8
  • 鲁耀杰;尹悦燕;郑继川 - 株式会社理光
  • 2011-06-01 - 2012-12-05 - G10L17/00
  • 本发明实施例提供一种说话人估计方法,包括:分类器建立步骤,建立用于将输入的语音数据转换为关于各个类别的语音帧集合的分类器;建模及加权步骤,利用所述分类器处理已知说话人的样本语音数据,关于各个类别分别建立说话人模型,并对各个类别分别设定权重;以及估计步骤,利用所述分类器处理未知说话人的测试语音数据,根据各个类别的说话人模型及权重,来估计该测试语音数据的说话人。本发明实施例还相应地提供一种说话人估计设备。