首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种阵列语音增强算法在审

申请号：	201811227423.1	申请日：	2018-10-22
公开（公告）号：	CN109308904A	公开（公告）日：	2019-02-05
发明（设计）人：	蔡洪滨;何昕;陈学超;顾樑	申请（专利权）人：	上海声瀚信息科技有限公司
主分类号：	G10L21/02	分类号：	G10L21/02;G10L15/22;G10L21/0216;G10L21/0224;G10L21/0232
代理公司：	上海海贝律师事务所 31301	代理人：	范海燕
地址：	200433 上海市杨***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	时频语音增强算法语音噪声掩蔽多路输入信号语音信号识别权系数向量粗略估计定义接收后验概率目标声源频域向量掩蔽系数音频信号有效语音语音功率语音信号噪声估计可懂度小畸变信噪比多路跟踪概率
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种阵列语音增强算法，其特征在于包括以下步骤：

S10噪声估计：通过定义接收到的音频信号，利用对每个频带跟踪带噪语音功率的最小值来实现对该频带的噪声的粗略估计；

S20时频掩蔽估计：通过定义某个时频点上语音出现的后验概率为当前时频点的掩蔽系数，用于估计噪声和语音在语谱图上存在的概率；

S30阵列MVDR权系数向量估计：通过定义多路输入信号每帧的频域向量，用于估计目标声源的具体方位。

2.根据权利要求1所述的一种阵列语音增强算法，其特征在于，于步骤S10中定义接收到的音频信号表示为：Y(k,l)＝X(k,l)+D(k,l),其中X(k,l)表示语音信号，D(k,l)表示噪声信号频谱，然后定义语音功率谱为λ_x(k,l)，噪声功率谱为λ_d(k,l)，通过递归平均方法估计λ_d。

3.根据权利要求2所述的一种阵列语音增强算法，其特征在于，利用递归平均方法估计λ_d的具体执行如下：

a、不考虑噪声不存在概率时，可以通过递归平均估算噪声功率谱：

λ_d＝α_dλ_d+(1-α_d)||Y(k,l)||²，为简化表示，此处λ_d＝λ_d(k,l)表示第l帧第k个频点上的噪声功率；

b、考虑噪声不存在的情况下：

(1)、估计时频点功率：S_f＝|Y|²

(2)、功率谱沿时间平滑：S＝λ_sS+(1-λ_s)S_f

(3)、累积实时记录最小功率值S_min，通过当前帧功率与加权后S_min值比较估计当前时频点为语音的概率I_f(0,1分布)，该概率实时平均结果P_S作为当前点的语音mask，其中：

S_min＝min(S_min,S)

I_f＝S＞S_min·δ_s

P_S＝λ_pP_S+(1-λ_p)I_f

(4)、P_S＝1即当前时频点很可能是语音信号时，不更新噪声谱；只有在当前帧有可能是噪声信号时才会利用当前功率跟新噪声谱，由此以软判决方式估计当前时频点的功率值：λ_d＝P_Sλ_d+(1-P_S)(α_dλ_d+(1-α_d)|Y|²)；

c、噪声跟踪实时处理：

在累积记录最小功率值时，为保证最小功率跟踪的实时性，每跨越若干帧，及时修正最小功率，具体实现如下：

(1)、定义矩阵SW用于存储N_WIN(＝8)次累积的NFFT_BINS个频点的最小功率值；

(2)、累积记录跨越的帧数，当计数到V_WIN(＝15)帧时，存入当前V_WIN帧的功率最小值S_tmp＝min(S_tmp,S)，同时将S_tmp重新初始化：S_tmp＝S；当存满N_WIN帧时，每次存入新数据的同时剔除最早存储的那个最小功率；

(3)、修正后的最小功率值为：S_min＝min(SW)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海声瀚信息科技有限公司，未经上海声瀚信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811227423.1/1.html，转载请声明来源钻瓜专利网。

上一篇：语音模仿方法、终端设备及计算机可读存储介质
下一篇：音频数据处理方法、装置、电子设备和存储介质

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top