[发明专利]音频编码方法和多点音频信号混音控制方法及相应设备无效

专利信息
申请号: 200710180316.3 申请日: 2007-10-15
公开(公告)号: CN101414462A 公开(公告)日: 2009-04-22
发明(设计)人: 张清;李伟;许丽净;杜正中;许剑峰;胡晨;杨毅;苗磊;齐峰岩 申请(专利权)人: 华为技术有限公司
主分类号: G10L19/00 分类号: G10L19/00;G10K15/08;H04L12/18
代理公司: 北京集佳知识产权代理有限公司 代理人: 彭愿洁;逯长明
地址: 518129广东省*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 编码 方法 多点 信号 音控 相应 设备
【说明书】:

技术领域

发明涉及语音音频信号处理技术领域,具体涉及一种语音音频信号的传输编码方法、对多点语音音频信号进行混音控制的方法、语音音频信号编码器以及多点音频处理设备。

背景技术

随着通讯技术的不断发展,通讯服务的应用日益增长,基于多点音频互动的集中式会议技术具有重要的应用价值。

在集中式会议中,通常各个终端与作为交互核心的多点音频处理设备基于单播(unicast)方式进行连接,如图1所示,其中多点音频处理设备一般采用多点控制单元(MCU:Multi-point Controlling Unit)来充当。MCU实时接收各路终端的语音数据包,按照合成策略进行适当的混音处理后再实时传输给各个终端。

显然,MCU对n个终端的音频数据进行混音的效果对输出语音音频信号的质量有很大的影响,目前MCU通常所采用的混音方式包括如下两种。

一、简单加和。

参考图2,MCU对各路音频数据进行解码,然后对多路解码信号进行混音,图2中的混音处理为简单将除本路外的各路解码数据加和,然后将加和后的数据再通过编码器编码,最终传送至各个终端。

这种方式下,由于数字语音音频信号存在量化上限和下限,叠加运算将会造成结果溢出。而若通过溢出检测进行饱和运算重置上下限值,会破坏语音信号原有的时域特征,导致引入噪声,造成出现爆破声和语音不连续等现象。同时,随着参与混音的终端路数增加,溢出的频率也不断上升,因此这种方式存在终端路数的上限。实验证明,一般情况下,有4路终端参与混音时其结果就有很多噪声和断续,无法分辨语流了。

二、加权混音。

参考图3,MCU对各路音频数据进行解码后,还进行混音计算,获得各路语音音频信号的权重,然后根据权重对各路信号进行混音和编码。混音计算获得权重依据可以是各路信号的能量等信息,具体处理策略可依实际情况而定。例如,可以选择能量大的几路信号进行混音输出。

这种方式需要在MCU中对各路音频数据进行复杂的计算,以获得权重依据,无疑会增加MCU的运算负担,尤其是当终端数目增多时,计算复杂度会很大,无法很好的满足会议通讯实时高效的要求。

发明内容

本发明实施例在于提供语音音频信号的传输编码方法、对多点语音音频信号进行混音控制的方法、语音音频信号编码器以及多点音频处理设备,用于在尽量降低多点音频处理设备计算复杂度的前提下提高其混音控制能力。

一种语音音频信号的传输编码方法,包括:根据语音音频信号生成核心码流;计算所述语音音频信号的边信息;生成携带有所述核心码流和边信息的数据包,在所述数据包中将所述边信息标识为混音边信息,使得所述数据包的接收端能够根据所述混音边信息对所述核心码流进行相应的混音处理。

一种对多点语音音频信号进行混音控制的方法,包括:获取一路以上的数据包,至少一路所述数据包携带有核心码流和混音边信息;解析所述携带有核心码流和混音边信息的数据包获取核心码流和混音边信息;根据所述混音边信息选择相应的混音处理方式对所述核心码流进行混音处理。

一种语音音频信号编码器,包括:编码单元,用于根据语音音频信号生成核心码流;计算单元,用于计算所述语音音频信号的边信息;封装单元,用于生成携带有所述核心码流和边信息的数据包,在所述数据包中将所述边信息标识为混音边信息,使得所述数据包的接收端能够根据所述混音边信息对所述核心码流进行相应的混音处理。

一种多点音频处理设备,包括:包处理单元,用于获取一路以上的数据包,至少一路所述数据包携带有核心码流和混音边信息;解析各路数据包获取核心码流,解析所述携带有核心码流和混音边信息的数据包获取核心码流和混音边信息;混音处理单元,用于根据所述混音边信息为对应的核心码流选择相应的混音处理方式,与其它路的核心码流进行混音处理;输出混音处理后的与各路输入对应的语音音频信号;编码输出单元,用于对所述混音处理单元输出的各路语音音频信号进行编码输出。

本发明实施例的技术方案中,通过在终端进行混音边信息的计算并在数据包中标识后传输给多点音频处理设备,使得多点音频处理设备能够直接根据混音边信息对该路信号的混音方式进行控制,既降低了多点音频处理设备的计算复杂度,同时丰富了其混音控制能力,使其能够灵活的根据终端数据包中的混音边信息配置来实现多样化的混音控制策略。

附图说明

图1是现有集中式会议架构示意图;

图2是现有一种混音方式示意图;

图3是现有另一种混音方式示意图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710180316.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top