[发明专利]一种立体声音频的带宽扩展方法与装置有效
| 申请号: | 201710203054.1 | 申请日: | 2017-03-30 |
| 公开(公告)号: | CN106960672B | 公开(公告)日: | 2020-08-21 |
| 发明(设计)人: | 高昕;颜永红;邹潇湘;白海钏;舒敏;云晓春;王锟;张震;计哲;董琳;金暐;王中华;李海灵;李佳 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;中国科学院声学研究所 |
| 主分类号: | G10L21/0388 | 分类号: | G10L21/0388;H04S7/00 |
| 代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 于金平 |
| 地址: | 100029*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 立体声 音频 带宽 扩展 方法 装置 | ||
本发明公开了一种立体声音频的带宽扩展方法与装置。该方法包括:将立体声信号分解为直达声和扩散声;按照预设的频带扩展方法对扩散声进行带宽扩展;将直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;将带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声;根据带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。借助于本发明的技术方案,解决了现有技术中仅根据单个声道重建信号的主观质量实现对信号带宽的扩展,没有考虑到两个声道中信号能量和相位的相关性,其重建立体声信号严重影响了听者对声源位置和距离的判定的问题。
技术领域
本发明涉及网络技术应用领域,特别涉及一种立体声音频的带宽扩展方法与装置。
背景技术
在数字音频信号处理技术中,通常将覆盖人耳可感知的20Hz~20KHz全部频率范围内的音频信号称作全带音频,这类信号主要应用于音乐信号的高保真重现。现阶段的音频即时通信系统无法提供足够的网络传输速率和终端处理能力,不可避免地会限制重建信号的有效带宽,优先量化编码音频信号的低频成分,进而提升音频通信系统的编码效率。
传统电话语音通信系统通常传输的是窄带信号,其频率分布在300~3400Hz范围内,采样率为8kHz。相关主观听力测试结果表明,窄带语音中保留了91%的音节可懂度以及99%的语句可理解性。但是相比于真实语音,在实际通话中所传输窄带信号的自然度和主观质量均有明显下降。由于高频成分的缺失,窄带语音无法良好地区分部分的清音或爆破音,并削弱了其描述说话人特性的能力。为了有效地克服窄带音频的不足,宽带音频被广泛应用到了电话语音通信领域中,其有效带宽扩展到50Hz~7kHz,较好地覆盖了表征语音信号重要特性的大部分频谱,实现了接近调幅广播的音质水平。然而受到历史、经济、技术等诸多问题的限制,传统固定和移动通信完全实现从窄带向宽带音频的迈进还需要相当长的一段过渡期。
作为一种有效的音频增强方法,频带扩展方法可以在不改变窄带信号信源编码和网络传输的前提下,通过分析原始音频信号的时频特性,在接收端从重建的宽带音频中人为地恢复出编码端所截去的高频成分,进而达到增强重建音频听觉质量的目的。对于听力有损人士,频带扩展方法能够进一步改善其音素和语义的分辨能力。近十几年来,许多研究机构与科研人员针对单声道语音信号的频带扩展相继提出了众多解决方案。这些方法通常分别从频谱包络扩展和频谱细节扩展两个方面出发,进而合成信号高频成分,其原理如图1所示。首先根据人耳听觉感知原理对窄带信号进行时频特征提取;接下来,借助边信息或者先验知识所描述高低频特征之间的映射关系来对高频成分的频谱包络和能量进行估计;同时,选择适当的频谱修补方法来扩展频谱细节;最终,结合扩展后的频谱包络和频谱细节,实现宽带音频信号高频成分的有效重建。
对于立体声音频,传统频带扩展方法多针对两个声道进行高频成分独立重建,这类方法仅根据单个声道重建信号的主观质量实现对信号带宽的扩展,没有考虑到两个声道中信号能量和相位的相关性,其重建立体声信号严重影响了听者对声源位置和距离的判定。
发明内容
鉴于上述问题,本发明提供了一种立体声音频的带宽扩展方法与装置。
本发明提供的立体声音频的带宽扩展方法,包括以下步骤:
将立体声信号分解为直达声和扩散声;
按照预设的频带扩展方法对所述扩散声进行带宽扩展;
将所述直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;
将所述带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声;
根据所述带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院声学研究所,未经国家计算机网络与信息安全管理中心;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710203054.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种录音方法和电子设备
- 下一篇:一种语音掩蔽方法和设备





