[发明专利]一种基于背景噪声最小统计量特征的声音环境识别方法有效

申请号：	201310507384.1	申请日：	2013-10-24
公开（公告）号：	CN103544953A	公开（公告）日：	2014-01-29
发明（设计）人：	邓世文	申请（专利权）人：	哈尔滨师范大学
主分类号：	G10L15/20	分类号：	G10L15/20;G10L15/02;G10L15/06;G10L15/08
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	杨立超
地址：	150080 黑龙***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于背景噪声最小统计量特征的声音环境识别方法，涉及声音场景的分类识别技术，为了解决在声音环境识别中由于声音环境结构复杂、易混淆、声学特征不确定和维度高所造成的提取有效特征、建立统计模型困难，导致识别性能差的问题。本发明提出了噪声最小统计量特征的提取、建模以及识别方法：在特征提取与建模阶段，分别对声音信号的能量谱进行频域平滑和时域平滑并追踪其最小统计量，将最小统计量转换到对数域进行标准化和降维处理，从而提取出声音环境的噪声最小统计量特征，并采用高斯混合模型对噪声最小统计量建模；在识别阶段，对输入声音进行特征提取，计算所提取出的最小统计量特征在每个模型下的似然值，并依据此似然值进行类别决策。
搜索关键词：	一种基于背景噪声最小统计特征声音环境识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于背景噪声最小统计量特征的声音环境识别方法，其特征在于它由以下步骤实现：步骤一、将采集的声音信号进行短时傅里叶变换得到信号的能量谱，而后对能量谱系数分别进行频域平滑和时域平滑，对平滑后的结果进行最小统计量追踪，提取出最小统计量并将其映射到对数域后进行标准化；步骤二、将在训练数据上使用步骤一所得到的标准化后的最小统计量进行特征值分解，提取前K个重要基向量UK；将标准化后的最小统计量投影到K个重要基向量UK上得到降维后的特征，完成特征提取过程；将重要基向量UK进行存储以用于声音环境识别步骤四中；步骤三、依据步骤二中所得到的训练数据降维后的最小统计量特征，采用高斯混合模型分别对每类环境声音进行建模，得到高斯混合模型（GMM）并将其进行存储以用于声音环境识别步骤四中；步骤四、利用步骤一对所采集的声音信号提取标准化后的最小噪声统计量特征，利用步骤二所得到的重要基向量UK对其进行降维，完成对采集声音信号的特征提取；再利用步骤三所得到的高斯混合模型（GMM）进行声音环境识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨师范大学，未经哈尔滨师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310507384.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于背景噪声最小统计量特征的声音环境识别方法有效

专利文献下载