[发明专利]语音音频混合分级编码中核心层残差提取系统及方法有效

申请号：	201010606009.9	申请日：	2010-12-27
公开（公告）号：	CN102074242A	公开（公告）日：	2011-05-25
发明（设计）人：	胡瑞敏;杨玉红;高丽;杨裕才;曾琦;陈先念;王国英	申请（专利权）人：	武汉大学
主分类号：	G10L19/14	分类号：	G10L19/14;G10L19/02
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙) 42222	代理人：	张火春
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音音频混合分级编码核心层残差提取系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频编码技术领域，尤其涉及一种语音音频混合分级编码中核心层残差提取系统及方法。

背景技术

可分级增强层编码方法中，编码端通过计算原始信号与核心层合成信号的残差，同时接收核心层的输出参数，对残差域信号做分级编码。解码端解码出残差域信号，与核心层信号相加，得到恢复的合成信号。各个增强层的残差域信号逐级加到核心层信号上，从而渐次改善重建质量。残差域信号的准确提取与增强层编码所能提供的音质增益有直接关系，解码端解码得到的残差信号越接近编码端计算的残差信号，则合成信号越接近原始信号，解码音质越高。

由于语音编码和音频编码的技术和方法存在差异，现有的语音音频的混合编码器，采用不同的模式分别对语音/音频进行编码。系统会根据当前声音信号的类型选择采用何种模式，或者分别采用两种模式进行编码，然后根据编码生成的合成信号选出编码效果好的作为最终的编码模式。由于该合成信号的生成只是用于模式选择，并不等同于解码端生成合成信号的所有操作，再加上两种编码模式的交叠，往往会导致编、解码端得到的合成信号不一致，因而编码端得到的原始信号与合成信号的残差信号并非准确的残差信号。对于语音音频混合编码模式下核心层编码残差的准确提取，成为提高语音音频混合编码器分级编码质量的关键。

发明内容

针对上述存在的技术问题，本发明的目的是提供一种语音音频混合分级编码中核心层残差提取系统及方法，以解决语音音频混合分级编码的需求。

为达到上述目的，本发明采用如下的技术方案：

一种语音音频混合分级编码框架中核心层残差提取系统，包括：

预处理模块：来自音频输入设备的单声道或多声道的输入信号进行预处理，得到当前帧的音频信号，并将所获得的当前帧的音频信号做三路输出：一路输出给语音编码模块，一路输出给音频编码模块，一路输出给残差生成模块；

语音编码模块：采用通用的语音编码算法对输入的当前帧的音频信号进行编码，编码后作两路输出，其中一路输出为语音解码合成码流，用于模式判决，另一路输出为编码提取的各类编码参数，传递给语音解码合成模块；

音频编码模块：采用通用的音频编码算法对输入的当前帧的音频信号进行编码，编码后作两路输出，其中一路输出为音频解码合成码流，用于模式判决，另一路输出为编码提取的各类编码参数，传递给音频解码合成模块；

模式选取模块：选取最优的编码模式，得到模式位标识分两路输出，一路进入语音解码合成模块，一路进入音频解码合成模块；

语音解码合成模块：如果模式选取模块的输出是语音编码模式，则进入语音解码合成模块，利用语音编码模块输出的各类编码参数作为输入，输出最终的核心层语音解码合成信号；

音频解码合成模块：如果模式选取模块的输出是音频编码模式，则进入音频解码合成模块，利用音频编码模块输出的各类编码参数作为输入，输出最终的核心层音频解码合成信号；

残差生成模块：预处理模块输出的预处理后的当前帧的音频信号和语音/音频解码合成模块输出的解码后合成信号为本模块的两路输入，根据模式位不同，选择语音解码合成信号或音频解码合成信号，计算得到残差信号，本模块的输出为残差信号。

一种语音音频混合分级编码中核心层残差提取方法，包括：