[发明专利]基于纯净语音与背景噪声两极建模的音频类型检测方法有效
申请号: | 201610847518.8 | 申请日: | 2016-09-23 |
公开(公告)号: | CN106448661B | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 贺前华;李洪滔;蔡梓文 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/14;G10L15/20;G10L21/0216;G10L21/0264 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于纯净语音与背景噪声两极建模的音频类型检测方法,包括步骤:S1、构建纯净语音GMM模型以及纯粹背景噪声GMM模型;S2、计算纯净语音模型自身各高斯混元间的距离,判断高斯混元是否位于特征重叠空间;S3、剔除位于特征重叠空间中的高斯混元,重新构建纯净语音统计模型、纯粹背景噪声统计模型;S4、计算新的纯净语音统计模型、纯粹背景噪声统计模型的概率,以及估算音频样本信噪比;S5、根据计算得到的概率以及估算信噪比,构建特征矢量且利用SVM模型进行判决,将样本判别为纯净语音、背景噪声或含噪声语音。本发明在降低GMM‑SVM运算量的同时,能有效地区分纯净语音、纯净背景噪声和含噪声语音。 | ||
搜索关键词: | 基于 纯净 语音 背景 噪声 两极 建模 音频 类型 检测 方法 | ||
【主权项】:
1.一种基于纯净语音与背景噪声两极建模的音频类型检测方法,其特征在于,包括如下步骤:S1、构建纯净语音模型以及纯粹背景噪声模型:基于足够的合适训练数据,训练一个N个高斯混元的纯净语音模型和一个M个高斯混元的背景噪声模型;S2、计算纯净语音模型自身各高斯混元间的距离,得到N*N的语音模型自距离矩阵;计算纯粹背景噪声模型的自身各高斯混元间的距离,得到M*M的背景噪声模型自距离矩阵;计算纯净语音模型与纯粹背景噪声模型对应各高斯混元间的距离,得到N*M的互距离矩阵;根据上述矩阵以及高斯混元的邻域成分分析,判断高斯混元是否位于特征重叠空间;S3、剔除位于特征重叠空间中的高斯混元,利用非重叠空间的高斯成分重新构建纯净语音统计模型、纯粹背景噪声统计模型;S4、计算新的纯净语音统计模型、纯粹背景噪声统计模型的概率,以及估算音频样本信噪比;S5、根据计算得到的概率以及估算信噪比,构建特征矢量且利用SVM模型进行判决,将样本判别为纯净语音、背景噪声或含噪声语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610847518.8/,转载请声明来源钻瓜专利网。