[发明专利]一种适用于声源定位的时延估计方法有效
申请号: | 201910242080.4 | 申请日: | 2019-03-28 |
公开(公告)号: | CN109901114B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 张承云;梁龙腾 | 申请(专利权)人: | 广州大学 |
主分类号: | G01S5/22 | 分类号: | G01S5/22 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;麦小婵 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 声源 定位 估计 方法 | ||
本发明公开了一种适用于声源定位的时延估计方法,包括对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;根据所述最小相位分量的复倒谱计算信号最小相位分量频谱和全通分量频谱;利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱;通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间。本发明提供的时延估计方法能够在混响和噪声环境下,有效地减少由噪声和混响带来的影响,从而提高对于噪声的适应性和时延估计的准确度。
技术领域
本发明涉及声源定位技术领域,具体涉及到一种适用于声源定位的时延估计方法。
背景技术
近几年来,基于传声器阵列的声源定位技术被广泛应用于各种场景,声源定位技术确定的时延和位置信息为波束成形、语音增强、语音识别、盲信号分离等各种语音算法提供重要的信息。基于时延估计的声源定位技术具备运算成本少、所需要传声器数量较少等优点,因此被广泛应用于各种实时处理环境中。声源定位技术的定位方法分为两步,第一步是估计声波从声源传播到两个传声器之间的时间差,第二步是根据时间差对声源位置进行估计,其中,第一步时间差估计的准确度决定了第二步声源定位的准确度。
现有技术中,基于互功率谱的时延估计方法因其具备运算成本少、定位精确度较高、在低混响(0ms-300ms)下能够估计的优点而被广泛的研究,但其估计性能在混响较高的环境下会下降,从而导致时延估计的准确度降低。针对于此,有学者提出了基于倒谱预滤波的时延估计方法,但是这种方法虽然能够很好的降低混响对时延估计的影响,却容易受到噪声的影响。
发明内容
本发明提供了一种适用于声源定位的时延估计方法,以解决现有技术难以减少噪声和混响带来的影响的技术问题,本发明能够在混响和噪声环境下,有效地减少由噪声和混响带来的影响,从而提高对于噪声的适应性和时延估计的准确度。
为了解决上述技术问题,本发明实施例提供了一种适用于声源定位的时延估计方法,包括:
对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱;
根据所述最小相位分量的复倒谱计算信号最小相位分量的频谱和全通分量信号的频谱;
利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱;
通过快速傅里叶反变换方法求解所述互功率谱的互相关函数,并根据所述互相关函数计算得到延迟时间。
作为优选方案,所述利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱计算得到改进的全通分量频谱,并根据所述改进的全通分量频谱计算得到改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算互功率谱,具体为:
利用所述最小相位分量的频谱的模值与所述全通分量信号的频谱相乘得到所述改进的全通分量频谱;
根据所述改进的全通分量频谱计算得到所述改进的相位加权函数,结合所述改进的全通分量频谱和所述改进的相位加权函数计算得到所述互功率谱。
作为优选方案,所述对通过两个传声器获得的语音信号进行信号处理,获得最小相位分量的复倒谱,具体为:
通过两个传声器分别获得第一通道语音信号和第二通道语音信号;
对所述第一通道语音信号和所述第二通道语音信号进行信号处理,得到第一通道复倒谱和第二通道复倒谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910242080.4/2.html,转载请声明来源钻瓜专利网。