[发明专利]声音信号处理方法、语音识别方法、电子设备和存储介质有效
申请号: | 202210002730.X | 申请日: | 2022-01-05 |
公开(公告)号: | CN114023307B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 黄伟隆;冯津伟 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L21/0216 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;兰淑铎 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 信号 处理 方法 语音 识别 电子设备 存储 介质 | ||
1.一种声音信号处理方法,包括:
获取同心圆麦克风阵列采集到的输入声音信号;
根据所述同心圆麦克风阵列中每个麦克风的声学特征,对所述输入声音信号进行波束形成,获得输出声音信号;
所述声学特征通过所述同心圆麦克风阵列的幅度响应向量表征,其中,所述幅度响应向量用于在对所述输入声音信号进行波束形成的过程中调整所述输入声音信号的幅度;
所述幅度响应向量根据每个麦克风的指向性参数和方向参数获得,所述指向性参数用于指示麦克风的指向性,所述方向参数用于指示麦克风的指向性方向与所述同心圆麦克风阵列的径向方向的夹角。
2.根据权利要求1所述的声音信号处理方法,其中,所述幅度响应向量包括:
用于表征所述幅度响应向量,up(qp,θ)用于表征所述同心圆麦克风阵列中第p环上麦克风的响应向量,up(qp,θ)由所述第p环上麦克风的指向性参数和方向参数确定,P用于表征所述同心圆麦克风阵列所包括环的数量,1≤p≤P,T用于表征转置运算符。
3.根据权利要求2所述的声音信号处理方法,其中,所述同心圆麦克风阵列中第p环上麦克风的响应向量包括:
um,p用于表征所述同心圆麦克风阵列中第p环上第m麦克风的幅度响应,um,p由所述第p环上第m麦克风的所述指向性参数和方向参数确定,Mp用于表征所述第p环上麦克风的数量。
4.根据权利要求3所述的声音信号处理方法,其中,所述第p环上第m麦克风的幅度响应包括:
用于表征所述第p环上第m麦克风在所述第p环上的角位置,N用于表征所述同心圆麦克风阵列的差分阶数,qi,p用于表征所述第p环上第m麦克风对应于第i阶的指向性参数,αm,p用于表征所述第p环上第m麦克风的所述方向参数,θ用于表征所述输入声音信号的声源的期望方向。
5.根据权利要求1-4中任一所述的声音信号处理方法,其中,所述根据所述同心圆麦克风阵列中每个麦克风的声学特征,对所述输入声音信号进行波束形成,获得输出声音信号,包括:
根据所述同心圆麦克风阵列的相位响应向量和所述幅度响应向量,对所述输入声音信号进行波束形成,获得输出声音信号,其中,所述相位响应向量用于在对所述输入声音信号进行波束形成的过程中调整所述输入声音信号的相位。
6.根据权利要求5所述的声音信号处理方法,其中,所述根据所述同心圆麦克风阵列的相位响应向量和所述幅度响应向量,对所述输入声音信号进行波束形成,获得输出声音信号,包括:
获取所述输入声音信号的频率表示;
将所述频率表示输入包括所述相位响应向量和所述幅度响应向量的波束形成器,获得所述波束形成器输出的频域估计值;
根据所述频域估计值生成所述输出声音信号。
7.根据权利要求6所述的声音信号处理方法,其中,所述波束形成器包括:
hccddma(ω)用于表征所述波束形成器输出的频域估计值,A(ω,θ)用于表征包括所述相位响应向量的相位响应矩阵,U(q,θ)用于表征包括所述幅度响应向量的幅度响应矩阵,cθ用于表征第一个元素为1且其他元素为0的列矩阵,ω用于表征所述频率表示,〇用于表征哈达玛积运算符,H用于表征共轭转置运算符。
8.根据权利要求7所述的声音信号处理方法,其中,所述幅度响应矩阵包括:
U(q,θ)用于表征所述幅度响应矩阵,用于表征所述幅度响应向量,θ用于表征声源的期望方向,Δθ1至Δθ2用于表征预设的与所述期望方向的角间距,N用于表征所述同心圆麦克风阵列的阶数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210002730.X/1.html,转载请声明来源钻瓜专利网。