[发明专利]语音音响编码装置、语音音响解码装置、语音音响编码方法和语音音响解码方法在审

专利信息
申请号: 201380050272.6 申请日: 2013-11-01
公开(公告)号: CN104737227A 公开(公告)日: 2015-06-24
发明(设计)人: 河岛拓也;押切正浩 申请(专利权)人: 松下电器(美国)知识产权公司
主分类号: G10L19/032 分类号: G10L19/032;G10L19/035
代理公司: 北京市柳沈律师事务所 11105 代理人: 邸万奎
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 音响 编码 装置 解码 方法
【说明书】:

技术领域

本发明涉及使用了变换编码方式的语音音响编码装置、语音音响解码装置、语音音响编码方法及语音音响解码方法。

背景技术

作为能够高效率地编码0.05-14kHz频带的超宽频带(SWB:Super-Wide-Band)的语音信号或音乐信号的方式,有按ITU-T(International Telecommunication Union Telecommunication Standardization Sector;国际电信联盟电信标准化部门)标准化的非专利文献1及非专利文献2中记载的技术。在这些技术中,将7kHz为止的频带在核心编码单元中编码,将7kHz以上的频带(以下,称为“扩展频带”)在扩展编码单元中编码。

在核心编码单元中,使用码激励线性预测(CELP:Code Excited Linear Prediction)进行编码,在将CELP中不能编码的剩余信号用MDCT(Modified Discrete Cosine Transform;改进离散余弦变换)变换到频域后,以称为FPC(Factorial Pulse Coding;阶乘脉冲编码)或AVQ(Algebraic Vector Quantization;代数矢量量化)的变换编码进行编码。在扩展编码单元中,在7kHz以上的扩展频带中,搜索与7kHz为止的低频的频谱之间相关较高的频带,将相关最高的频带使用在扩展频带的编码中利用的方法等进行编码。再有,在非专利文献1及非专利文献2中,在7kHz为止的低频侧和7kHz以上的高频侧,分别被预先确定编码比特数,以分别确定的编码比特数编码低频侧和高频侧。

此外,在非专利文献3中,也公开了将SWB编码的方式已被ITU-T标准化。在非专利文献3中记载的编码装置中,将输入信号通过MDCT变换到频域,分割为子带,对每个子带进行编码。具体地说,该编码装置首先计算各子带能量,并进行编码。接着,为了编码频率精细结构,基于子带能量,对各子带分配用于编码频率精细结构的编码比特。频率精细结构使用格型矢量量化(Lattice Vector Quantization)来编码。与FPC或AVQ同样,格型矢量量化也是适合频谱的编码的一种变换编码。在格型矢量量化中,由于编码比特未被充分地分配,所以有时解码过的频谱的能量和子带能量的误差较大。这种情况下,通过进行将子带能量和解码频谱的能量的误差用噪声矢量填补的处理,进行编码。

此外,在非专利文献4中,论述了基于AAC(Advanced Audio Coding;高级音频编码)的编码技术。在AAC中,基于听觉模型计算掩蔽阈值,通过将掩蔽阈值以下的MDCT系数从编码对象中除去,高效率地进行编码。

现有技术文献

非专利文献

非专利文献1:ITU-T Standard G.718AnnexB,2010年

非专利文献2:ITU-T Standard G.729.1AnnexE,2010年

非专利文献3:ITU-T Standard G.719,2008年

非专利文献4:MP3AND AAC explained,AES 17th International Conference on High Quality Audio Coding,1999年

发明内容

发明要解决的问题

在非专利文献1及非专利文献2中,对核心编码单元编码的低频侧和扩展编码单元编码的高频侧以固定方式分配比特,不能对低频和高频按照信号的特性适当地分配编码比特。因此,存在因输入信号的特性而不能发挥充分的性能的课题。

另一方面,在非专利文献3中,有按照子带能量从低频到高频自适应地分配比特的机制,但着眼于高频越高,相对频谱的误差的灵敏度越低这样的听觉特性,存在对高频容易分配需要以上的比特的课题。有关该课题在以下说明。

在编码过程中,首先,计算各子带中需要的比特量,以使对每个子带计算出的子带能量越大,分配越多的比特。但是,在变换编码中,在算法的性质上,即使将编码比特分配增加1比特,编码能力也不会提高,有时如果不分配一定程度汇集的比特数,编码结果就不改变。因此,如果不是以比特单位,而是以这样汇集的比特数的单位进行比特的分配,则是便利的。将这样的编码上需要的比特数的单位在这里称为单元。分配的单元(unit)数越多,能够越正确地表现频谱的形状及振幅。再有,考虑到听觉特性,高频的子带与低频的子带相比,一般来说其带宽取得宽,但带宽越宽,1单元所需要的比特量就越多,所以1单元的比特数随着带宽而改变。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器(美国)知识产权公司;,未经松下电器(美国)知识产权公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201380050272.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top