[发明专利]声音处理方法、装置和电子设备在审
申请号: | 201711258117.X | 申请日: | 2017-12-04 |
公开(公告)号: | CN107993671A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 朱长宝;陈本东;李育国 | 申请(专利权)人: | 南京地平线机器人技术有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;H04N5/232 |
代理公司: | 北京市正见永申律师事务所11497 | 代理人: | 黄小临,王怀章 |
地址: | 210046 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 方法 装置 电子设备 | ||
1.一种声音处理方法,包括:
根据麦克风阵列所采集的多个声音信号和摄像头所采集的图像信号确定声音预处理方向;
基于所述声音预处理方向选择预处理滤波系数;
使用所述预处理滤波系数对所述多个声音信号进行预处理滤波,以得到初始信号源信号和初始噪声源信号;
确定自适应滤波系数;以及
使用所述自适应滤波系数来对所述初始信号源信号和所述初始噪声源信号进行自适应滤波,以得到增强信号源信号。
2.如权利要求1所述的声音处理方法,其中,根据麦克风阵列所采集的多个声音信号和摄像头所采集的图像信号确定声音预处理方向包括:
根据所述多个声音信号确定声音声源方向;
根据所述图像信号确定图像声源方向;以及
基于所述声音声源方向和所述图像声源方向来确定声音增强方向和声音抑制方向中的至少一个,作为所述声音预处理方向。
3.如权利要求2所述的声音处理方法,其中,基于所述声音声源方向和所述图像声源方向来确定声音增强方向和声音抑制方向中的至少一个包括:
确定所述图像声源方向是否包含与信号源相关联的至少一个图像信号源方向;以及
响应于确定所述图像声源方向包含与信号源相关联的至少一个图像信号源方向,将所述至少一个图像信号源方向确定为所述声音增强方向。
4.如权利要求3所述的声音处理方法,基于所述声音声源方向和所述图像声源方向来确定声音增强方向和声音抑制方向中的至少一个进一步包括:
将所述声音声源方向中所述声音增强方向以外的方向确定为所述声音抑制方向。
5.如权利要求2所述的声音处理方法,其中,基于所述声音声源方向和所述图像声源方向来确定声音增强方向和声音抑制方向中的至少一个包括:
确定所述图像声源方向是否包含与信号源相关联的至少一个图像信号源方向;以及
响应于确定所述图像声源方向包含与信号源相关联的至少一个图像信号源方向,基于所述声音声源方向和所述至少一个图像信号源方向联合确定所述声音增强方向和所述声音抑制方向中的至少一个。
6.如权利要求5所述的声音处理方法,其中,基于所述声音声源方向和所述至少一个图像信号源方向联合确定所述声音增强方向和所述声音抑制方向中的至少一个包括:
确定所述声音声源方向与所述至少一个图像信号源方向的第一差异性;
响应于所述第一差异性取最小值,确定与所述取最小值的第一差异性对应的候选声音声源方向和候选图像声源方向;以及
基于所述候选声音声源方向和所述候选图像声源方向确定所述声音增强方向。
7.如权利要求6所述的声音处理方法,其中,基于所述候选声音声源方向和所述候选图像声源方向确定所述声音增强方向包括:
将所述候选声音声源方向、所述候选图像声源方向、或者所述候选声音声源方向和所述候选图像声源方向的中值作为所述声音增强方向。
8.如权利要求6所述的声音处理方法,其中,基于所述声音声源方向和所述至少一个图像信号源方向联合确定所述声音增强方向和所述声音抑制方向中的至少一个进一步包括:
确定所述声音声源方向中除所述声音增强方向以外的方向与所述至少一个图像信号源方向中除所述声音增强方向以外的方向的第二差异性;
确定所述第二差异性是否小于一预定相似度阈值;以及
响应于所述第二差异性小于所述预定相似度阈值,确定与所述第二差异性对应的所述声音声源方向中除所述声音增强方向以外的方向为所述声音抑制方向。
9.如权利要求2所述的声音处理方法,其中,基于所述声音预处理方向选择预处理滤波系数包括:
预先设计对应于不同角度的增强滤波系数和抑制滤波系数;以及
选择分别与所述声音增强方向对应的增强滤波系数和与所述声音抑制方向对应的抑制滤波系数。
10.如权利要求9所述的声音处理方法,其中,预先设计对应于不同角度的增强滤波系数和抑制滤波系数包括:
基于所述麦克风阵列的阵型预先设计对应于不同角度的增强滤波系数和抑制滤波系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京地平线机器人技术有限公司,未经南京地平线机器人技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711258117.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于统计模型的麦克风阵列语音增强方法
- 下一篇:频带扩展方法及装置