[发明专利]编码和解码语音与音频统合信号的方法在审
申请号: | 201310487746.5 | 申请日: | 2009-07-14 |
公开(公告)号: | CN103531203A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 李泰辰;白承权;金珉第;张大永;徐廷一;姜京玉;洪镇佑;朴浩综;朴荣喆 | 申请(专利权)人: | 韩国电子通信研究院;光云大学校产学协力团 |
主分类号: | G10L19/20 | 分类号: | G10L19/20;G10L19/008 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王怀章 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 解码 语音 音频 统合 信号 方法 | ||
本专利申请是下列专利申请的分案申请:
申请号:200980135678.8
申请日:2009年07月14日
发明名称:编码和解码语音与音频统合信号的设备
技术领域
本发明涉及一种用于统合地编码和解码语音信号与音频信号的设备,更特别是,涉及一种方法和设备,其可包括针对语音信号和音频信号以不同的结构操作的编码模块和解码模块,并可根据输入信号的特征有效地选择内部模块,从而有效地编码语音信号和音频信号。
背景技术
语音信号和音频信号有不同的特征。因此,以往使用语音信号和音频信号的独特特征来独立研究语音信号的语音编解码器和音频信号的音频编解码器。近来广泛使用中的语音编解码器,如自适应多速率宽带加AMR-WB+(Adaptive Multi-Rate Wideband Plus)编解码器,具有代码激励线性预测CELP(Code Excitation Linear Prediction)结构,并可根据语音的语音模型基于线性预测编码LPC(Linear Predictive Code)提取和量化语音参数。广泛使用中的音频编解码器,如高效高级编码版本2HE-AAC V2(High-Efficiency Advanced Coding version2)编解码器,可考虑人类在频域的声学特征在心理声学方面最佳量化频率系数。
因此,需要一种编解码器,其可统合音频信号编码器和语音信号的编码器,并可根据信号特征和比特率选择合适的编码体系,从而更有效地执行编码和解码。
发明内容
技术目的
本发明的一个方面,提供一种用于统合地编码和解码语音信号与音频信号的设备与方法,其可根据输入信号的特征有效地选择内部模块,从而在不同的比特率针对语音信号和音频信号提供完美的声音质量。
本发明的另一个方面,还提供一种统合地编码和解码语音信号和音频信号的设备和方法,其可在转换采样率之前扩展频带,从而将频带扩展为更宽的带。
技术方案
跟据本发明的一个方面,提供了一种用于统合地编码语音信号和音频信号的编码设备,所述编码设备包括:输入信号分析器,其分析输入信号的特征;立体声编码器,当所述输入信号是立体声信号时,其将所述输入信号降混频(down mix降混频)为单声道信号(mono单声道signal),并从所述输入信号中提取立体声声音图像信息;频带扩展器,其扩展所述输入信号的频带;采样率转换器,其针对频带扩展器的输出信号来转换采样率;语音信号编码器,当所述输入信号是语音特征信号时,其使用语音编码模块将输入信号进行编码;音频信号编码器,当所述输入信号是音频特征信号时,其使用音频编码模块将输入信号进行编码;比特流生成器,其使用语音信号编码器的输出信号和音频信号编码器的输出信号,来生成比特流。
在这种情况下,所述输入信号分析器,可使用输入信号的过零率ZCR(Zero Crossing Rate)、相关性、帧单位的能量中的至少一个来分析输入信号。
此外,所述立体声声音图像信息可包括:左声道和右声道间的相关性与左声道和右声道间的级别差异中的至少一个。
此外,所述频带扩展器,可在采样率的转换之前将输入信号扩展至高频带信号。
此外,所述采样率转换器,可将输入信号的采样率转换为语音信号编码器或音频信号编码器所要求的采样率。
此外,所述采样率转换器可包括:第一降采样器(down sampler),其将输入信号降采样(down sample)1/2;和第二降采样器,其将第一降采样器的输出信号降采样1/2。
此外,当输入信号在语音特征信号和音频特征信号之间变化时,比特流生成器可在比特流中存储与用于帧单位改变的补偿相关的信息。
此外,所述与用于帧单位改变的补偿相关的信息可包括:时间/频率转换体系与时间/频率转换大小中的至少一个。
根据本发明的另一个方面,提供了一种用于统合地解码语音信号和音频信号的解码设备,所述解码设备包括:比特流分析器,其分析输入比特流信号;语音信号解码器,当所述比特流信号与语音特征信号相关时,其使用语音解码模块将比特流信号进行解码;音频信号解码器,当所述比特流信号与音频特征信号相关时,其使用音频解码模块将比特流信号进行解码;信号补偿单元,当语音特征信号与音频特征信号之间的转换被执行时,其补偿输入比特流信号;采样率转换器,其转换比特流信号的采样率;频带扩展器,其使用解码的低频带信号生成高频带信号;立体声解码器,其使用立体声扩展参数生成立体声信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院;光云大学校产学协力团,未经韩国电子通信研究院;光云大学校产学协力团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310487746.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含胡麻添加剂的汽油
- 下一篇:一种棉杆生物质真空热解液化制备生物油的工艺