[发明专利]一种说话人数未知的多通道语音分离方法有效
申请号: | 202010796279.4 | 申请日: | 2020-08-10 |
公开(公告)号: | CN112116920B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 曲天书;吴玺宏;彭超 | 申请(专利权)人: | 北京大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L21/0232;G10L21/0224;G10L21/0216;G10L25/30;H04R3/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种说话人数未知的多通道语音分离方法。本方法步骤包括:1)采集目标空间中的多通道音频信号,并提取该多通道音频信号的时频特征和空间特征;2)利用所述时频特征和所述空间特征估计出该目标空间中说话人所在方向的数目;3)利用所述时频特征、空间特征及估计出的方向数目,获得该目标空间中各说话人所在目标方向;4)利用估计出的各说话人所在目标方向设计方向特征,并结合时频特征和空间特征从该多通道音频信号中提取出每一目标方向上的语音信号;5)从每一目标方向上的语音信号中迭代分离出对应目标方向上可能存在的多个说话人语音。本发明既规避了语音迭代分离误差随迭代次数增大而增大的问题,又提高了语音分离的性能。 | ||
搜索关键词: | 一种 说话 人数 未知 通道 语音 分离 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010796279.4/,转载请声明来源钻瓜专利网。