[发明专利]一种掩码估计方法及装置有效
申请号: | 201910092059.0 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109859769B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 张健;曹圣红;王海坤 | 申请(专利权)人: | 西安讯飞超脑信息科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
地址: | 710003 陕西省西安市高新区西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 掩码 估计 方法 装置 | ||
本申请公开了一种掩码估计方法及装置,该方法包括:生成能量表征信息,该能量表征信息表征了频点为f的方向性信号在N个波束上输出的能量差异信息,该N个波束是以麦克风阵列为基准而预设的具有不同指向的各个波束;然后,根据生成的能量表征信息估计得到N个掩码值,该N个掩码值用于表征方向性信号分别来自N个波束所指向的空间区域时的概率。可见,本申请在进行掩码估计时,考虑了能量差异信息,该能量差异信息不受环境噪声的影响,可以保证掩码估计结果的有效性。
技术领域
本申请涉及信号处理技术领域,尤其涉及一种掩码估计方法及装置。
背景技术
实际中,远距离拾音的应用需求非常广泛。例如,学生上课时想把老师们的授课内容录下来,供以后重听、复习;在一些会议场合,秘书希望能够录下领导们的发言,甚至将录音用语音识别软件直接转写为文字,便于整理会议纪要。远距离拾音相比近距离拾音的优势在于:
1)灵活便利:不需要在每个发言人面前都摆放一个拾音设备,布置更加便利,避免了更换发言人时还需要移动拾音设备的麻烦。而且,有时候用户自带的拾音设备也不方便放置在发言人面前。
2)隐蔽:远距离拾音技术降低了拾音设备的存在感,提高了讲话者的舒适度,也使拾音场所的室内布置更加简洁。甚至有些应用场景需要秘密拾音,对远距离拾音的需求更加强烈。
虽然远距离拾音在应用上更有优势,但当前的远距离拾音技术还无法达到近距离拾音的效果。其原因在于输入信号的信噪比极低,即,由于拾音设备距离说话人较远,意味着录到的说话人语音的音量较低,尽管拾音场所的环境噪声本来不大,但实际录到的信号的信噪比也很低,在这种情况下,环境噪声的影响非常显著,使得现有的掩码估计方法会失效,从而导致语音无法增强,进而无法保证远距离的拾音效果。
发明内容
本申请实施例的主要目的在于提供一种掩码估计方法及装置,能够保证掩码估计结果的有效性。
本申请实施例提供了一种掩码估计方法的流程示意图,包括:
生成能量表征信息,所述能量表征信息表征了频点为f的方向性信号在N个波束上输出的能量差异信息,所述N个波束是以麦克风阵列为基准而预设的具有不同指向的各个波束,N≥2;
根据所述能量表征信息估计得到N个掩码值,所述N个掩码值用于表征所述方向性信号分别来自所述N个波束所指向的空间区域时的概率。
可选的,所述生成能量表征信息,包括:
生成所述N个波束中的每一波束对应的夹角差异信息,作为能量表征信息;
其中,所述夹角差异信息包括:对应波束与所述N个波束中的每一波束之间的夹角。
可选的,所述生成能量表征信息,包括:
生成所述N个波束中的每一波束对应的延迟差异信息,作为能量表征信息;
其中,所述延迟差异信息包括:当所述方向性信号位于对应波束指向的空间区域时,所述方向性信号从所述麦克风阵列中的每一麦克风到所述麦克风阵列的中心位置之间的时间延迟。
可选的,所述根据所述能量表征信息估计得到N个掩码值,包括:
根据所述能量表征信息,为所述N个波束分别构建一个掩码计算模型;
利用构建的N个掩码计算模型,估计得到N个掩码值。
可选的,所述利用构建的N个掩码计算模型,估计得到N个掩码值,包括:
生成所述方向性信号在所述N个波束上输出的能量值;
根据生成的N个能量值以及构建的N个掩码计算模型,估计得到N个掩码估计值。
可选的,所述方向性信号包括方向性噪声,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安讯飞超脑信息科技有限公司,未经西安讯飞超脑信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910092059.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人工耳蜗语音增强方法
- 下一篇:音乐分离方法、装置及计算机可读存储介质