[发明专利]语音分离方法、语音识别方法及相关设备有效
| 申请号: | 201910745682.1 | 申请日: | 2019-04-12 |
| 公开(公告)号: | CN110459237B | 公开(公告)日: | 2020-11-20 |
| 发明(设计)人: | 陈联武;于蒙;苏丹;俞栋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/30;G10L21/0216;G10L21/0208 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 分离 方法 识别 相关 设备 | ||
1.一种语音分离方法,其特征在于,包括:
获取包括至少两个目标对象的语音信号的混合语音信号;
获取所述混合语音信号对应的单通道频谱特征和多通道方位特征;
通过多通道分离网络对所述单通道频谱特征和多通道方位特征进行处理,获得所述混合语音信号中各目标对象的第一语音频谱掩码矩阵;
通过单通道分离网络对所述单通道频谱特征进行处理,获得所述混合语音信号中各目标对象的第二语音频谱掩码矩阵;
通过重叠判断模型对所述单通道频谱特征和多通道方位特征进行处理,获得所述混合语音信号中的目标对象之间是否存在重叠的判断结果,所述重叠判断模型用于判断目标对象之间是否存在空间上的重叠;
根据所述判断结果确定所述混合语音信号中各目标对象的目标语音频谱掩码矩阵;
其中,根据所述判断结果确定所述混合语音信号中各目标对象的目标语音频谱掩码矩阵,包括:
若所述判断结果为目标对象之间不存在重叠,则选择所述第一语音频谱掩码矩阵作为所述目标语音频谱掩码矩阵;
若所述判断结果为目标对象之间存在重叠,则选择所述第二语音频谱掩码矩阵作为所述目标语音频谱掩码矩阵。
2.根据权利要求1所述的语音分离方法,其特征在于,获得所述混合语音信号中的目标对象之间是否存在重叠的判断结果,包括:
确定各目标对象的空间位置;
将采集所述混合语音信号的麦克风阵列作为参照点,根据各目标对象的空间位置获得任意两个目标对象之间的夹角;
获取任意两个目标对象之间的夹角的最小值;
若所述夹角的最小值小于门限值,则所述判断结果为目标对象之间存在重叠;
若所述夹角的最小值不小于所述门限值,则所述判断结果为目标对象之间不存在重叠。
3.根据权利要求1所述的语音分离方法,其特征在于,获取所述混合语音信号对应的单通道频谱特征和多通道方位特征,包括:
获取所述混合语音信号对应的全语音频段的单通道频谱特征和多通道方位特征。
4.根据权利要求3所述的语音分离方法,其特征在于,所述全语音频段包括K个子频段,K为大于等于2的正整数;其中,获取所述混合语音信号对应的单通道频谱特征和多通道方位特征,还包括:
从所述全语音频段的单通道频谱特征和多通道方位特征中,提取K个子频段的单通道频谱特征和多通道方位特征。
5.根据权利要求4所述的语音分离方法,其特征在于,所述重叠判断模型包括K个第一神经网络和第四预测网络;其中,通过重叠判断模型对所述单通道频谱特征和多通道方位特征进行处理,获得所述混合语音信号中的目标对象之间是否存在重叠的判断结果,包括:
通过所述K个第一神经网络对所述K个子频段的单通道频谱特征和多通道方位特征进行处理,获得K个第一特征向量;
根据所述K个第一特征向量生成合并特征向量;
将所述合并特征向量输入所述第四预测网络,输出所述判断结果。
6.根据权利要求5所述的语音分离方法,其特征在于,所述多通道分离网络包括第五预测网络;其中,通过多通道分离网络对所述单通道频谱特征和多通道方位特征进行处理,获得所述混合语音信号中各目标对象的第一语音频谱掩码矩阵,包括:
通过所述第五预测网络对所述合并特征向量进行处理,获得所述混合语音信号中各目标对象的第一语音频谱掩码矩阵。
7.根据权利要求3所述的语音分离方法,其特征在于,所述多通道分离网络包括第四神经网络;其中,通过多通道分离网络对所述单通道频谱特征和多通道方位特征进行处理,获得所述混合语音信号中各目标对象的第一语音频谱掩码矩阵,包括:
通过所述第四神经网络对所述全语音频段的单通道频谱特征和多通道方位特征进行处理,获得所述混合语音信号中各目标对象的第一语音频谱掩码矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910745682.1/1.html,转载请声明来源钻瓜专利网。





