[发明专利]用于对音频信号进行译码的译码器和方法有效
申请号: | 201910452024.3 | 申请日: | 2014-02-20 |
公开(公告)号: | CN110232929B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 克里斯蒂安·黑尔姆里希;热雷米·勒孔特;戈兰·马尔科维奇;马库斯·施内尔;贝恩德·埃德勒;斯特凡·罗伊施尔 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/022;G10L19/025 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;唐明英 |
地址: | 德国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 音频 信号 进行 译码 译码器 方法 | ||
1.一种用于对音频信号进行译码的译码器,所述音频信号包括转换后的窗口化样本的块的序列及窗口信息(160,603),所述窗口信息(160,603)从至少三个不同的窗口中识别用于块的特定窗口,所述译码器包括:
处理器(156),用于提供频谱值的块的序列;
可控转换器(158),用于通过使用重叠-相加处理将所述频谱值的块的序列转换成时域表示,
其中所述可控转换器(158)由所述窗口信息(160,603)控制,以将由所述窗口信息(160,603)表示的窗口应用至对应的块以计算译码后的音频信号,
其中所述窗口选自包括至少三个窗口的组,所述三个窗口包括具有第一重叠长度(203)的第一窗口(201)、具有第二重叠长度(218)的第二窗口(215)、以及具有第三重叠长度(229)或不具有重叠的第三窗口(224),其中所述第一重叠长度(203)大于所述第二重叠长度(218),并且其中所述第二重叠长度(218)大于所述第三重叠长度(229)或大于零重叠,
其中,所述译码器还包括用于对音频信号进行编码的设备,所述用于对音频信号进行编码的设备包括:
可控窗口化装置(102),用于将所述音频信号窗口化,以提供窗口化样本的块的序列;
转换器(104),用于将所述窗口化样本的块的序列转换成频谱表示,所述频谱表示包括频谱值的帧的序列;
瞬态位置检测器(106),用于识别在帧的瞬态预看区域内的瞬态的位置;以及
控制器(108),用于响应于所识别出的所述瞬态的位置(210-213),控制所述可控窗口化装置(102),以将具有特定重叠长度的特定窗口应用至所述音频信号,
其中,所述控制器(108)被配置成从包括至少三个窗口的组中选择所述特定窗口,所述三个窗口包括具有第一重叠长度(203)的第一窗口(201)、具有第二重叠长度(218)的第二窗口(215)、以及具有第三重叠长度(229)或不具有重叠的第三窗口(224),
其中所述第一重叠长度(203)大于所述第二重叠长度(218),并且其中所述第二重叠长度(218)大于所述第三重叠长度(229)或大于零重叠,
其中,基于所述所识别出的所述瞬态的位置(210-213)选择所述特定窗口,以使得两个时间相邻的重叠窗口中的一个具有所识别出的所述瞬态的位置(210-213)的第一窗口系数,而所述两个时间相邻的重叠窗口中的另一个具有所识别出的所述瞬态的位置(210-213)的第二窗口系数,其中所述第二窗口系数是所述第一窗口系数的至少九倍大。
2.如权利要求1所述的译码器,其中所述可控转换器(158)包括:
频率-时间转换器(170),用于将所述频谱值的块转换成时间表示;
合成窗口化装置(172),用于将合成窗口应用至所述频谱值的块的时间表示;以及
重叠-加法器(174),用于重叠及添加时间相邻的窗口时间表示,以获得所述译码后的音频信号,
其中所述合成窗口化装置(172)、所述重叠-加法器(174)或所述频率-时间转换器(170)由所述窗口信息(160,603)控制,以应用由所述窗口信息(160,603)表示的重叠及所述合成窗口。
3.如权利要求1所述的译码器,
其中所述窗口信息(160,603)包括先前重叠信息(606),所述先前重叠信息(606)指示先前窗口的较后部分的重叠,并且其中所述窗口信息(160,603)包括当前重叠信息(607),所述当前重叠信息(607)指示所述较后部分的重叠,其中所述控制器(108)被配置成用于依据所述先前窗口的所述较后部分的所述重叠信息,确定紧接在所述先前窗口之后的窗口的较早部分。
4.如权利要求1所述的译码器,
其中所述第一窗口、所述第二窗口与所述第三窗口具有限定帧的、相关的相同变换尺寸;以及
其中所述第一重叠长度为所述第一窗口的长度的四分之一或三分之一或一半,其中所述第二重叠长度为所述第一重叠长度的一半或三分之一,并且其中所述第三重叠长度为所述第二重叠长度的一半或四分之一或八分之一或小于或等于1.25毫秒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910452024.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本无关说话人验证方法和装置
- 下一篇:一种应用于地空通信的实时话音降噪系统