[发明专利]一种时延估计系统及装置有效
申请号: | 202211380324.3 | 申请日: | 2022-11-03 |
公开(公告)号: | CN115798497B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 刘杨;杨飞然;杨军 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0224;G10L21/0232;G10L25/30 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;张红生 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 估计 系统 装置 | ||
本发明提供了一种时延估计系统及装置,所述系统基于编码器‑时序建模结构实现,用于经过训练后计算时延估计值;所述系统包括:信号时频特征提取模块、编码器模块、时序建模模块、时延分类器和时延计算模块。本发明的优势在于:将时延估计设计问题为分类问题,通过设计训练集和标签,可以控制时延估计的精度、上限和估计误差;时延时变的训练集,能够降低时延估计的方差;进一步减小时延估计的误差和方差,并尽量避免时延过估计的现象;在长混响、大时延和双端对讲情况下,本发明的时延估计收敛时间、跟踪时间更短,过估计率更低。本发明与自适应滤波级联的系统具有更大的远端单讲回声抵消量和更好的双端对讲语音质量。
技术领域
本发明属于音频信号处理领域,具体涉及一种时延估计系统及装置。
背景技术
在语音通信、人机交互等应用中,扬声器播放的信号又被传声器接收,造成通信质量和语音识别率下降,这就是声学回声问题。声学回声抵消利用远端信号作为参考,从近端传声器接收信号中消除回声的干扰。回声抵消的解决方案包括自适应滤波、深度学习和混合模型。
在线会议等系统的快速发展对回声抵消提出了新的挑战,时延估计是其中的一个关键问题。网络传输、数模或模数转换、语音编解码和信号预处理等实际情况,会导致超长时延和时变时延的问题。时延会导致回声抵消算法性能下降,因而需要在回声抵消前增加一个时延估器。时延估计器估计参考信号与回声信号之间的时延,并利用估计的时延对齐参考信号。时延估计的代表性算法包括广义互相关(Generalized Cross Correlationwith Phase Transform,GCC-PHAT)法、WebRTC中的帧能量对比法、参数模型法等。GCC-PHAT方法在大时延时复杂度较高,无法满足实时估计要求。帧能量对比法需要提前测量时延值的更新概率,参数模型利用降采样后的信号进行初步的回声路径估计,根据滤波器的峰值位置求时延。这两种方法在长混响、非线性回声和双端对讲场景下性能下降。而在实际使用场景中,由于设备的多样性,长时延、时变时延、长混响、非线性回声和低信号回声比都是不可避免的问题。
随着深度学习技术的不断发展,编码器-时序建模-解码器的结构在深度学习语音增强、回声抵消中表现优异。在波达时间差估计领域已有将信号相关系数作为特征输入到全连接网络中来估计时延的方法,但此类方法在估计长时延时计算量过大,并且全连接网络也不具备记忆能力。现有的时延估计方法存在计算量大、复杂声环境性能退化的问题。
发明内容
本发明的目的在于克服现有时延估计技术存在长混响、大时延和双端对讲容易误估计的缺陷。
为了实现上述目的,本发明提出了一种时延估计系统,所述系统基于编码器-时序建模结构实现,用于经过训练后,计算时延估计值;所述系统包括:
信号时频特征提取模块,用于提取输入的远端参考信号和传声器信号的时频特征;
编码器模块,用于对信号时频特征提取模块输出的时频特征进行模式识别,得到频率分辨率更低、通道数更多的信号特征;
时序建模模块,用于利用编码器模块输出的信号特征提取远端参考信号和传声器信号之间的时延特征;
时延分类器,用于对时序建模模块输出的时延特征分类得到时延估计位;
时延计算模块,用于根据时延分类器输出的时延估计位计算得到估计的时延块数,将估计的时延块数与时延估计精度相乘,得到时延估计值。
作为上述系统的一种改进,所述信号时频特征提取模块的工作流程具体为:对远端参考信号和传声器信号做短时傅里叶变换得到由时间帧和频率块两个维度组成的时频特征。
作为上述系统的一种改进,所述编码器模块包括多个编码器基本单元。
作为上述系统的一种改进,所述编码器基本单元包括复数二维卷积层、复数批归一化层和复数参数化整流线性单元;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211380324.3/2.html,转载请声明来源钻瓜专利网。