[发明专利]语音声响编码装置和解码装置、语音声响编码和解码方法有效
| 申请号: | 201710759624.5 | 申请日: | 2013-11-26 | 
| 公开(公告)号: | CN107516531B | 公开(公告)日: | 2020-10-13 | 
| 发明(设计)人: | 刘宗宪;S.纳吉塞蒂;押切正浩 | 申请(专利权)人: | 弗朗霍弗应用研究促进协会 | 
| 主分类号: | G10L19/035 | 分类号: | G10L19/035;G10L19/002;G10L19/02 | 
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 | 
| 地址: | 德国*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 语音 声响 编码 装置 解码 方法 | ||
1.语音或声响编码装置,包括:
转换单元,将语音或声响信号从时域转换到频域;
估计单元,对于将所述语音或声响信号的频谱分割所得的多个子带,分别估计表示能级的能量包络线;
量化单元,将所述能量包络线进行量化;
群组确定单元(302-1,302-N,303),将量化的所述能量包络线分组为多个群组;
第一比特分配单元,对所述多个群组分配比特;
第二比特分配单元,将对所述多个群组分配的比特按每个群组分配给子带;以及
编码单元,使用对所述子带分配的比特,编码所述频谱,
所述多个群组的每一个由多个子带构成,
其中,所述群组确定单元(302-1,302-N,303)将能量包络线具有极大值的子带即优势频带、以及与所述优势频带两侧相邻并形成所述能量包络线的下降梯度的子带确定为优势群组,将所述优势群组以外的连续的子带确定为非优势群组。
2.如权利要求1所述的语音或声响编码装置,还包括:
能量计算单元,计算每个群组的能量;以及
方差计算单元,计算每个群组的能量包络线方差,
其中,所述第一比特分配单元基于计算出的每个群组的能量及所述每个群组的能量包络线方差,能量及能量包络线方差中的至少一者越大,将越多的比特分配给群组,能量及能量包络线方差中的至少一者越小,将越少的比特分配给群组。
3.如权利要求1所述的语音或声响编码装置,其中,所述优势群组的群组宽度是以优势频带为中心的且两侧的直到范数系数值的下降梯度截止的子带的宽度。
4.如权利要求1所述的语音或声响编码装置,其中,当所述优势频带为最高频率的频带或最低频率的频带时,只有形成所述优势频带的单侧的能量包络线的下降梯度的频带包含于优势群组。
5.如权利要求1所述的语音或声响编码装置,其中,所述第二比特分配单元(309)将更多的比特分配给感觉上更重要的子带,并且将更少的比特分配给感觉上较不重要的子带。
6.如权利要求1所述的语音或声响编码装置,其中,所述第二比特分配单元(309)将更多的比特分配给具有较高能量方差的群组中的子带,并且将更少的比特分配给具有较低能量方差的群组中的子带。
7.如权利要求1所述的语音或声响编码装置,其中,所述第二比特分配单元(309)将更多的比特分配给在频谱中具有峰值的群组中的子带,并且将更少的比特分配给在频谱中具有谷值的群组中的子带。
8.如权利要求1所述的语音或声响编码装置,其中,所述第二比特分配单元(309)基于以下等式进行操作:
其中,BitsG(k)sb(i)表示对群组k的子带i分配的比特,i表示群组k的子带索引,Bits(G(k))表示对群组k分配的比特,Energy(G(k))表示群组k的能量,并且Norm(i)表示群组k的子带i的子带能量值。
9.如权利要求1所述的语音或声响编码装置,其中,所述第一比特分配单元(308)将更多的比特分配给优势群组,并且将更少的比特分配给非优势群组。
10.如权利要求1所述的语音或声响编码装置,其中,所述第一比特分配单元(308)基于每个群组的能量、所有群组的总能量、每个群组的能量方差和所有群组的总能量方差,按每个群组分配比特。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗朗霍弗应用研究促进协会,未经弗朗霍弗应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710759624.5/1.html,转载请声明来源钻瓜专利网。





