[发明专利]一种智能双向定向拾音麦克风在审
申请号: | 202210476623.0 | 申请日: | 2022-04-30 |
公开(公告)号: | CN114827795A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 王建兵;何凯 | 申请(专利权)人: | 上海浩宜信息科技有限公司 |
主分类号: | H04R1/08 | 分类号: | H04R1/08;H04R3/00;G10L15/16;G10L21/0216;G10L25/24 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 吴少均 |
地址: | 200331 上海市嘉定区众*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 双向 定向 麦克风 | ||
1.一种智能双向定向拾音麦克风,包括麦克风本体2,其特征在于:所述麦克风本体2的环形阵列形成拾音波束;
所述拾音波束进行特征抽取,将音频短时傅里叶变换后的特征经过滤波器处理后做对数变换再做DCT得到树皮频率倒谱系数,使用粗糙分辨率估计临界带增益;
所述拾音波束通过以下步骤消除噪声:
S1:音频特征先过两个卷积神经网络对数据降采样;
S2:经过5个门控循环单元循环层做语音活动检测、噪声谱估计和噪声消除;
S3:输出音频增益和vad信息。
2.根据权利要求1所述的一种智能双向定向拾音麦克风,其特征在于:所述拾音波束的形成数量为4个,且拾音波束的波束范围为0~3,各自对应90°范围。
3.根据权利要求2所述的一种智能双向定向拾音麦克风,其特征在于:所述拾音波束拾音时,阵列算法增强波束范围内的声音,削弱波束外的声音,以增强录音信噪比。
4.根据权利要求3所述的一种智能双向定向拾音麦克风,其特征在于:所述拾音波束指定波束0和波束2位目标拾音方向,波束0的范围为90°,345°-45°范围录音增强,其他范围内录音减弱。
5.根据权利要求4所述的一种智能双向定向拾音麦克风,其特征在于:所述波束2在收音时,145°-225°的范围录音增强,其他范围录音被减弱。
6.根据权利要求5所述的一种智能双向定向拾音麦克风,其特征在于:所述特征抽取和音高分析得到的人声的基频信息组合作为神经网络模型的输入特征。
7.根据权利要求6所述的一种智能双向定向拾音麦克风,其特征在于:所述分辨率包括频率窗口以及频带,频带划分选择Opus的pitch计算代码,每个频带至少有4个bins,并使用三角频带每个三角的峰值和其相邻三角的边界点重合。
8.根据权利要求7所述的一种智能双向定向拾音麦克风,其特征在于:所述频带中,用ωb(k)表示第b个band在频率k处的幅度,有∑bwb(k)=1,对于频率信号X(k),某一个band的能量为Eb=∑kwb(k)|X(k)|2,每个band的增益为
其中Es(b)为纯净语音的band能量,Ex(b)为带噪语音的band能量。
9.根据权利要求1所述的一种智能双向定向拾音麦克风,其特征在于:所述门控循环单元中,其中一个门控循环单元循环层是语音活动检测,其他的四个门控循环单元循环层做噪声谱估计和噪声消除。
10.根据权利要求9所述的一种智能双向定向拾音麦克风,其特征在于:步骤S3中,模型的损失函数用交叉熵损失,通过最小化真实增益gb和预测增益的差值,训练得到神经网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浩宜信息科技有限公司,未经上海浩宜信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210476623.0/1.html,转载请声明来源钻瓜专利网。