[发明专利]基于多标准融合频点筛选的盲源分离快速方法及系统有效
申请号: | 201810985050.8 | 申请日: | 2018-08-28 |
公开(公告)号: | CN108877831B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 魏莹;闫宁 | 申请(专利权)人: | 山东大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0224;G10L21/0232 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 标准 融合 筛选 分离 快速 方法 系统 | ||
本发明公开了一种基于多标准融合频点筛选的盲源分离快速方法及系统,对待分离的声音信号进行短时傅里叶变换,将变换后的所有频点划分为两个集合;对其中一个集合进行多标准融合的频点筛选,利用复数域独立性成分分析算法选择出信号能量和独立性满足设定阈值的频点;对筛选出的频点进行聚类,进一步减少选择的频点数量;对由多标准融合的方法筛选出的频点,利用ICA算法求解分离矩阵,对其他集合的频点利用未选频点的分离方法恢复出源信号。对分离信号进行逆短时傅里叶变换。采用本发明的方法可以更好地兼顾性能的提升和时间的减少问题,与单一标准相比,同样的性能下,本发明的方法所需的运行时间更少,可以更好地用于语音增强。
技术领域
本发明涉及一种基于多标准融合频点筛选的盲源分离快速方法及系统。
背景技术
盲源分离(BSS)是一种不利用源信号与传输信道的先验信息,仅依靠观测混合信号就可以很好地恢复出源信号的算法。不仅在生物电信号处理、图像处理、人工耳蜗系统得到了广泛的应用而且在助听器尤其是双耳助听器语音增强方面体现出潜在应用价值。盲源分离在进行语音增强时,能够在不知道麦克风阵列分布和不破坏双耳线索的情况下,保持声源的双耳线索。然而数字助听器要求低功耗,低延迟与传统盲源分离算法的高复杂度相矛盾,因此为了将盲源分离用于助听器中分离目标信号,首要任务便是要降低BSS算法的复杂度。
盲源分离中最简单的混合模型被称为瞬时混合,大多数早期的BSS算法是在此基础上设计的。实际上,在真实的环境中,麦克风接收的信号为经历衰减和延迟之后的信号的线性组合,即卷积模型。在20世纪90年代末,Murata和Smaragdis提出频率域ICA(FDICA),将复杂时域卷积模型变换成相对简单的频域瞬时混合模型。ICA算法将高阶统计量作为目标函数,每次迭代更新都需要估计新的高阶统计量并且需要在每一个频点上都进行迭代求解。另外,KondoKazunobu简单估计了FDICA算法每一步的复杂度,同时证明了算法的高复杂度主要来源于ICA迭代求解分离矩阵的过程。根据这种想法,很多专家学者对此展开了研究。研究方向主要分为两类,一是降低ICA的迭代次数加速收敛,二是选择较少的频点进行ICA迭代。
目前通过第二种思想来降低算法复杂度的主要有以下几种方法。1.依据50000次以上的实验的平均分离性能选择出最优的频点组合,然后利用选择出的这些频点进行ICA。计算速度比未筛选时快了40倍,但是该算法选择的频点为连续频点的集合并且一旦随麦克风阵列的分布以及声源位置发生变化,该集合的又要经大量实验重新确定。2.利用混合信号的特性来进行频点选择,如混合信号协方差矩阵的行列式。3.采用互信息选择出一个中心频点,仅利用这个频点来估计信号的混合参数。方法二和方法三都可以降低算法的复杂度,但是方法的实验环境主要是在麦克风间距很小的时候,并且方法三只选择一个频点进行,鲁棒性不好。4.采用混合信号协方差矩阵的行列式和箱线图对频点进行两次筛选。该方法适用于双耳系统且算法的复杂度得到了降低,但是由于影响频点分离性能的因素有多个,目前这种采用单一的标准对频点衡量的方法不够全面,很容易造成误选,错筛的现象。换句话说,容易出现剔除的一些频点为分离性能好的频点,被选中的这些频点反而性能比较差的现象。在这种情况下,无法为未被选择的频点提供准确的参数估计。
发明内容
本发明为了解决上述问题,提出了一种基于多标准融合频点筛选的盲源分离快速方法及系统,本发明利用多标准融合的频点筛选方法,对频点上的信号特性进行更为全面的描述。
为了实现上述目的,本发明采用如下技术方案:
一种基于多标准融合频点筛选的盲源分离快速方法,包括以下步骤:
对待分离的声音信号进行短时傅里叶变换,按照是否会发生混叠,将变换后的所有频点划分为初选频点和未选频点两个独立的集合;
对初选频点集合进行多标准融合的频点筛选,选择出信号能量和独立性都满足设定阈值的频点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810985050.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于连续混合最大熵的回声消除方法
- 下一篇:一种基于GAN的音频音质还原系统