[发明专利]变换编码装置和变换编码方法无效
申请号: | 201210061662.0 | 申请日: | 2006-10-13 |
公开(公告)号: | CN102623014A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 押切正浩;山梨智史 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L19/02 | 分类号: | G10L19/02 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 变换 编码 装置 方法 | ||
本申请是申请日为2006年10月13日、申请号为200680037544.9、发明名称为“变换编码装置和变换编码方法”的发明专利申请的分案申请。
技术领域
本发明涉及在频域中对输入信号进行编码的变换编码装置和变换编码方法。
背景技术
为了有效地利用移动通信系统中的电波资源等,要求以低比特率对语音信号进行压缩。另一方面,用户期望提高通话语音的质量以及实现富有现场感的通话业务。为了实现上述要求,不仅期望语音信号质量的提高,而且期望对频带更宽的音频信号等语音之外的信号也能够进行高质量的编码。为此,分层地综合多个编码技术的研究备受关注。
例如,有分层地组合下述的第一层和第二层的技术,所述第一层,以适合于语音信号的模式,对输入信号以低比特率进行编码,所述第二层,以也适合于语音信号以外的信号的模式,对输入信号与第一层解码信号之间的差分信号进行编码(例如,参照非专利文献1)。其中,提出了使用在MPEG-4(Moving Picture Experts Group phase-4:动态图像专家组阶段4)标准化了的技术进行可扩展编码的例子。具体来说,将适合于语音信号的CELP(Code Excited Linear Prediction:码激励线性预测)用于第一层,并对从原信号减去第一层解码信号后的残差信号,使用AAC(Advanced Audio Coder:高级音频编码)和TwinVQ(Transform Domain Weighted Interleave Vector Quantization:变换域加权交织矢量量化)那样的变换编码作为第二层。
另外,所谓TwinVQ的变换编码是,对输入信号进行MDCT(Modified Discrete Cosine Transform:改进离散余弦变换),并对获得的MDCT系数用谱包络和每个Bark尺度的平均振幅进行归一化的技术(例如,参照非专利文献2)。其中,将表示谱包络的LPC(Linear Predictive Coding:线性预测编码)系数,以及每个Bark尺度(Bark scale)的平均振幅值分别单独编码,对归一化后的MDCT系数进行交织,将其分割为子矢量,并进行矢量量化。特别是,在将谱包络和每个Bark尺度的平均振幅称为标度因子(scale factor),并将归一化后的MDCT系数称为频谱的微细结构(以下称为“微细频谱”)时,TwinVQ可以理解为,将MDCT系数分离为标度因子和微细频谱而进行编码的技术。
在以TwinVQ为代表的变换编码中,标度因子用于控制微细频谱的功率。因此,标度因子对主观质量(人的听觉质量)造成的影响较大,在标度因子的编码失真较大时,使主观质量极大地劣化。所以,标度因子的高性能编码是很重要的。
(非专利文献1)三木弼一编著,“MPEG-4の全て(初版)”(株)工业调查会,1998年9月30日,p.126-127
(非专利文献2)岩上直樹、守谷健弘、三樹聡、池田和永、神明夫著、「周波数領域重み付けインタリ一ブベクトル量子化(TwinVQ)による楽音符号化」信学論(A),1997年5月,vol.J80-A,no.5,p.830-837
发明内容
本发明需要解决的问题
在TwinVQ中,用谱包络及每个Bark尺度的平均振幅来表示相当于标度因子的信息。例如,着眼于每个Bark尺度的平均振幅时,在非专利文献2所公开的技术中,决定了使由下述的算式所表示的加权平方误差d为最小的、每个Bark尺度的平均振幅矢量。
...式(1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210061662.0/2.html,转载请声明来源钻瓜专利网。