[发明专利]解码装置和解码方法有效
申请号: | 201580002275.1 | 申请日: | 2015-02-06 |
公开(公告)号: | CN105659321B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 河岛拓也;江原宏幸 | 申请(专利权)人: | 弗朗霍弗应用研究促进协会 |
主分类号: | G10L19/028 | 分类号: | G10L19/028;G10L19/02;G10L21/038 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邸万奎 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 装置 方法 | ||
本发明的解码装置包括:分离单元,分离核心编码数据和第二编码数据;第一解码单元,解码核心编码数据并生成第一解码频谱;振幅归一化单元,将第一解码频谱的振幅分割为多个子带,将各子带的频谱归一化并生成归一化频谱;噪声生成单元,生成噪声频谱;噪声振幅归一化单元,归一化噪声频谱并输出归一化噪声频谱;阈值计算单元,计算频谱强度的阈值;噪声频谱振幅调整单元,调整归一化噪声频谱的振幅,使得归一化噪声频谱的最大值等于或低于阈值;加法单元,将振幅调整的归一化噪声频谱添加到归一化频谱并生成添加噪声的归一化频谱;第二解码单元,解码第二编码数据并生成第二频谱;以及转换器,执行关于耦合的频谱的时域转换。
技术领域
本发明涉及将语音信号等解码或编码以降低语音信号和音乐信号(以下,假定为语音信号等)的音乐噪声的技术。
背景技术
将语音信号等以低比特率进行压缩的语音编码技术,是实现移动通信中的电波等的有效利用的重要技术。而且,近年来对通话语音的质量提高的期待不断增长,期望实现现场感强的通话服务。为了实现这一目标,将频带宽的语音信号等以高比特率编码即可。可是,这种手段(approach)与电波和频带的有效利用相反。
作为将频带宽的信号以低比特率高质量地编码的方法,有将输入信号的频谱分割为低频部分和高频部分的2个频谱,高频频谱置换为复制的低频频谱,即通过将高频频谱以低频频谱替代,使整体的比特率降低的技术(专利文献1)。
基于这样的技术,鉴于高频频谱相对于低频频谱来说能量的偏差小的特性,有对每子带将低频频谱进行归一化(平坦化)后取与高频频谱之间的相关的技术。根据该技术,能够防止直接复制峰值性高的低频频谱造成的音质劣化。可是,在这种技术中,起因于低频频谱以离散的脉冲序列来表现,在估计离散的脉冲序列的包络的方法中有与本来的输入信号的包络偏离这样的缺点。因此,提出取代该归一化方法,对每个子带以离散的脉冲的最大振幅值进行归一化的方法(专利文献2)。
图11是专利文献2记载的编码装置。在这样的编码装置中,输入信号在时间-频率转换单元1010被转换为频域的信号,被作为输入信号频谱输出,同时输入信号频谱的低频部分在核心编码单元1020编码后被作为核心编码数据输出。然后,将核心编码数据解码,生成核心编码低频频谱,将该频谱在子带振幅归一化单元1030中以样本的振幅的最大值进行归一化,生成归一化低频频谱。然后,求与归一化低频频谱之间的相关值为最大的输入信号频谱的高频部分的频带、这样的频带中的归一化低频频谱和输入信号频谱的高频部分之间的增益,将它们在扩展频带编码单元1060中编码,作为扩展频带编码数据输出。
图12是与上述对应的解码装置。编码数据在分离单元2010中被分离为核心编码数据和扩展频带编码数据,核心编码数据在核心解码单元2020中被解码,生成核心编码低频频谱。核心编码低频频谱在子带振幅归一化单元2030 中,进行与编码装置侧同样的处理、即用样本的振幅的最大值进行归一化,生成归一化低频频谱。然后,使用归一化低频频谱,在扩展频带解码单元2040 中将扩展频带编码数据解码,生成扩展频带频谱。
此外,如图13那样,还公开了按照峰值性的强度,将用样本的最大值进行归一化的子带振幅归一化单元1030和用样本的频谱功率的包络进行归一化的频谱包络归一化单元7020切换来进行归一化的技术。
专利文献2中记载的用样本的最大值进行归一化的技术,在低频频谱稀疏的情况下,即在仅一部分的样本的振幅值较大、其他的样本的振幅值大致为零的情况下特别有效。即,根据专利文献2的技术。即使是稀疏的频谱,也抑制振幅过大的频谱的发生(均匀化),能够得到特性平坦的归一化低频频谱(平滑化)。
现有技术文献
专利文献
专利文献1:日本特表2001-521648号公报
专利文献2:国际公开第2013/035257号
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗朗霍弗应用研究促进协会,未经弗朗霍弗应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580002275.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 对音频信号的频谱执行噪声填充的装置-201910420349.3
- 萨沙·迪施;马克·伽依尔;克里斯蒂安·赫尔姆里希;戈兰·马尔科维奇;玛丽亚·路易斯瓦莱罗 - 弗劳恩霍夫应用研究促进协会
- 2014-01-28 - 2023-09-15 - G10L19/028
- 本申请公开了一种对音频信号的频谱执行噪声填充的装置,藉由以相依于一音频信号的一音调的一方式来执行该音频信号的一频谱的噪声填充,关于该噪声填充式频谱而在质量上改良该噪声填充,使得该噪声填充式音频信号的重现较不烦人。
- 对音频信号的频谱执行噪声填充的装置-201910419610.8
- 萨沙·迪施;马克·伽依尔;克里斯蒂安·赫尔姆里希;戈兰·马尔科维奇;玛丽亚·路易斯瓦莱罗 - 弗劳恩霍夫应用研究促进协会
- 2014-01-28 - 2023-09-12 - G10L19/028
- 本申请公开了一种对音频信号的频谱执行噪声填充的装置,藉由以相依于一音频信号的一音调的一方式来执行该音频信号的一频谱的噪声填充,关于该噪声填充式频谱而在质量上改良该噪声填充,使得该噪声填充式音频信号的重现较不烦人。
- 对音频信号的频谱执行噪声填充的装置-201910419597.6
- 萨沙·迪施;马克·伽依尔;克里斯蒂安·赫尔姆里希;戈兰·马尔科维奇;玛丽亚·路易斯瓦莱罗 - 弗劳恩霍夫应用研究促进协会
- 2014-01-28 - 2023-06-30 - G10L19/028
- 本申请公开了一种对音频信号的频谱执行噪声填充的装置,藉由以相依于一音频信号的一音调的一方式来执行该音频信号的一频谱的噪声填充,关于该噪声填充式频谱而在质量上改良该噪声填充,使得该噪声填充式音频信号的重现较不烦人。
- 一种语音活性检测的方法及设备-202210940185.9
- 陈庭威;黄景标;林聚财;方瑞东;刘克柱;毛亚朋;黄威震;殷俊 - 浙江大华技术股份有限公司
- 2022-08-05 - 2022-12-02 - G10L19/028
- 本发明公开了一种语音活性检测的方法及设备,用于结合历史音频帧信息确定当前音频帧的差熵信息,根据当前音频帧的差熵信息判断语音活性,提高语音活性检测的精度。该方法包括:获取待检测音频数据,将所述待检测音频数据划分成N个音频帧;根据所述N个音频帧中第n个音频帧以及参考音频帧的信息,确定所述第n个音频帧的差熵信息,其中所述差熵信息表征所述第n个音频帧的能量信息,所述参考音频帧为所述N个音频中所述第n个音频帧之前的音频帧;根据所述第n个音频帧的差熵信息,确定所述第n个音频帧是否是语音。
- 用于使用独立噪声填充生成增强信号的装置和方法-202110182756.2
- 萨沙·迪施;拉尔夫·盖格;安德烈·尼德迈尔;马蒂亚斯·诺伊辛格;康斯坦丁·施密特;斯蒂芬·王尔德;本杰明·舒伯特;克里斯蒂安·诺伊卡姆 - 弗劳恩霍夫应用研究促进协会
- 2015-07-24 - 2021-07-23 - G10L19/028
- 用于从输入信号(600)生成增强信号的装置,其中增强信号具有用于增强谱区域的谱值,用于增强谱区域的谱值不包含在输入信号(600)中,该装置包括映射器(602),用于映射输入信号的源谱区域至增强谱区域中的目标区域,对于所述目标区域,存在源区域标识,映射器(602)用于使用所述源区域标识选择所述源谱区域以及用于将所选择的源谱区域映射至所述目标区域;以及噪声填充器(604),用于生成用于所述增强谱区域中的目标区域中的噪声区域的第二噪声值,其中所述第二噪声值与所述输入信号(600)的源谱区域中的第一噪声值解相关。
- 用于使用独立噪声填充生成增强信号的装置和方法-201580050417.1
- 萨沙·迪施;拉尔夫·盖格;安德烈·尼德迈尔;马蒂亚斯·诺伊辛格;康斯坦丁·施密特;斯蒂芬·王尔德;本杰明·舒伯特;克里斯蒂安·诺伊卡姆 - 弗劳恩霍夫应用研究促进协会
- 2015-07-24 - 2021-03-05 - G10L19/028
- 用于从输入信号(600)生成增强信号的装置,其中增强信号具有用于增强谱区域的谱值,用于增强谱区域的谱值不包含在输入信号(600)中,该装置包括映射器(602),用于映射输入信号的源谱区域至增强谱区域中的目标区域,源谱区域包括噪声填充区域(302);以及噪声填充器(604),用于生成用于输入信号的源谱区域中的噪声填充区域(302)的第一噪声值,并用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与第一噪声值解相关,或用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与在源区域中的第一噪声值解相关。
- 解码装置和解码方法-201580002275.1
- 河岛拓也;江原宏幸 - 弗朗霍弗应用研究促进协会
- 2015-02-06 - 2020-07-28 - G10L19/028
- 本发明的解码装置包括:分离单元,分离核心编码数据和第二编码数据;第一解码单元,解码核心编码数据并生成第一解码频谱;振幅归一化单元,将第一解码频谱的振幅分割为多个子带,将各子带的频谱归一化并生成归一化频谱;噪声生成单元,生成噪声频谱;噪声振幅归一化单元,归一化噪声频谱并输出归一化噪声频谱;阈值计算单元,计算频谱强度的阈值;噪声频谱振幅调整单元,调整归一化噪声频谱的振幅,使得归一化噪声频谱的最大值等于或低于阈值;加法单元,将振幅调整的归一化噪声频谱添加到归一化频谱并生成添加噪声的归一化频谱;第二解码单元,解码第二编码数据并生成第二频谱;以及转换器,执行关于耦合的频谱的时域转换。
- 解码装置、编码装置、解码方法、编码方法、终端装置、以及基站装置-202010080563.1
- 河岛拓也;江原宏幸 - 弗朗霍弗应用研究促进协会
- 2015-02-06 - 2020-07-03 - G10L19/028
- 本发明的解码装置是,将对规定的频率以下的低频频谱编码后的核心编码数据和对规定的频率以上的高频频谱基于核心编码数据编码后的扩展频带编码数据进行解码的解码装置(100),包括:将核心编码数据解码后的核心解码频谱的振幅以核心解码频谱的振幅的最大值进行归一化并生成归一化频谱的振幅归一化单元(103);生成噪声频谱的噪声生成单元(104);对归一化频谱进行与噪声频谱的加法运算而生成噪声加法运算归一化频谱的第1加法运算单元(105);以及使用噪声加法运算归一化频谱,将所述扩展频带编码数据解码,并生成噪声加法运算扩展频带频谱的扩展频带解码单元(106)。
- 用于使用独立噪声填充生成增强信号的装置和方法-202010071139.0
- 萨沙·迪施;拉尔夫·盖格;安德烈·尼德迈尔;马蒂亚斯·诺伊辛格;康斯坦丁·施密特;史蒂芬·威尔德;本杰明·舒伯特;克里斯蒂安·诺伊卡姆 - 弗劳恩霍夫应用研究促进协会
- 2015-07-24 - 2020-06-09 - G10L19/028
- 用于从输入信号(600)生成增强信号的装置,其中增强信号具有用于增强谱区域的谱值,用于增强谱区域的谱值不包含在输入信号(600)中,该装置包括映射器(602),用于映射输入信号的源谱区域至增强谱区域中的目标区域,源谱区域包括噪声填充区域(302);以及噪声填充器(604),用于生成用于输入信号的源谱区域中的噪声填充区域(302)的第一噪声值,并用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与第一噪声值解相关,或用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与在源区域中的第一噪声值解相关。
- 音频解码器-201910950848.3
- 纪尧姆·福奇斯;克里斯蒂安·赫尔姆里希;曼努埃尔·扬德尔;本杰明·苏伯特;横谷嘉一 - 弗劳恩霍夫应用研究促进协会
- 2014-01-28 - 2020-02-21 - G10L19/028
- 本公开涉及音频解码器。该音频解码器包含:倾斜调整器,其被配置为使用当前帧的线性预测系数来调整噪声的倾斜以获得倾斜信息;以及噪声插入器,其被配置为根据由倾斜计算器获得的倾斜信息来将噪声添加至当前帧。根据本发明的另一音频解码器包含:噪声水平估计器,其被配置为使用至少一个先前帧的线性预测系数来估计当前帧的噪声水平以获得噪声水平信息;以及噪声插入器,其被配置为根据由噪声水平估计器提供的噪声水平信息来将噪声添加至当前帧。因此,可省略位流中的关于背景噪声的边信息。
- 用于使用独立噪声填充生成增强信号的装置和方法-201580040119.4
- 萨沙·迪施;拉尔夫·盖格;安德烈·尼德迈尔;马蒂亚斯·诺伊辛格;康斯坦丁·施密特;史蒂芬·威尔德;本杰明·舒伯特;克里斯蒂安·诺伊卡姆 - 弗劳恩霍夫应用研究促进协会
- 2015-07-24 - 2020-02-21 - G10L19/028
- 用于从输入信号(600)生成增强信号的装置,其中增强信号具有用于增强谱区域的谱值,用于增强谱区域的谱值不包含在输入信号(600)中,该装置包括映射器(602),用于映射输入信号的源谱区域至增强谱区域中的目标区域,源谱区域包括噪声填充区域(302);以及噪声填充器(604),用于生成用于输入信号的源谱区域中的噪声填充区域(302)的第一噪声值,并用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与第一噪声值解相关,或用于生成用于目标区域中的噪声区域的第二噪声值,其中第二噪声值与在源区域中的第一噪声值解相关。
- 填充变换编码音频信号中的非编码子向量-201510993969.8
- 沃洛佳·格兰恰诺夫;塞巴斯蒂安·内斯隆德;西德格尔·思维里森 - 瑞典爱立信有限公司
- 2011-09-14 - 2019-05-14 - G10L19/028
- 一种用于填充变换编码音频信号的非编码残差子向量的频谱滤波器,包括子向量压缩器(42),被配置为压缩实际编码的残差子向量。子向量拒绝器(44)被配置为拒绝不满足预定的稀疏标准的压缩残差子向量。子向量收集器(46)被配置为级联剩余的压缩残差子向量以形成第一虚拟码本(VC1)。系数组合器(48)被配置为组合第一虚拟码本(VC1)的系数对以形成第二虚拟码本(VC2)。子向量填充器(50)被配置为使用来自第一虚拟码本(VC1)的系数填充低于预定频率的非编码残差子向量,并且使用来自第二虚拟码本(VC2)的系数填充高于预定频率的非编码残差子向量。
- 音频编码方法、音频解码方法、编码端、解码端和系统-201310364530.X
- 陈国明;彭远疆;欧文军;刘洪 - 腾讯科技(深圳)有限公司
- 2013-08-20 - 2013-11-27 - G10L19/028
- 本发明公开了一种音频编码方法、音频解码方法、编码端、解码端和系统,属于网络技术领域。所述方法包括:根据音频参数确定音频信号是否为指定信号类型;对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记;其中,标记过程可以在编码端或者解码端进行,用于在解码时对指定信号类型的音频信号进行增强处理。本发明通过音频参数确定音频信号是否为指定信号类型,只对指定信号类型进行增强,解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强的同时也被增强而影响音频信号的感知的问题;达到了保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。
- 专利分类