[发明专利]操纵具有瞬变事件的音频信号的方法和设备有效
申请号: | 201210262760.0 | 申请日: | 2009-02-17 |
公开(公告)号: | CN102789785A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | 萨沙·迪施;弗雷德里克·纳格尔;尼古拉斯·里特尔博谢;马库斯·马特拉斯;纪尧姆·福克斯 | 申请(专利权)人: | 弗劳恩霍夫应用研究促进协会 |
主分类号: | G10L21/04 | 分类号: | G10L21/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王玮 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 操纵 具有 事件 音频 信号 方法 设备 | ||
本申请是2010年9月8日提交的、申请号为200980108175.1、发明名称为“操纵具有瞬变事件的音频信号的方法和设备”的专利申请的分案申请。
技术领域
本发明涉及音频信号处理,具体涉及在向包含瞬变事件的信号应用音频效果的情况下的音频信号操纵。
背景技术
已知操纵音频信号使得改变再现速度,同时保持音高(pitch)不变。针对这样的过程的已知方法是利用相位声码器(vocoder)或方法来实现的,如(音高同步的)叠加(overlap-add)、(P)SOLA,如在J.L.Flanagan和R.M.Golden,The Bell System Technical Journal,November 1966,pp.1349 to 1590;美国专利6549884 Laroche,J.&Dolson,M.:Phase-vocoder pitch-shifting;Jean Laroche和Mark Dolson,New Phase-Vocoder Techniques for Pitch-Shifting,Harmonizing And Other Exotic Effects”,Proc.1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,New Paltz,New York,Oct.17-20,1999;以及U:DAFX:Digital Audio Effects;Wiley & Sons;Edition:1(February 26,2002);pp.201-298中所描述的。
此外,可以使用这样的方法(即,相位声码器或(P)SOLA)对音频信号进行转换(transposition),其中这种转换的具体问题是:转换后的音频信号与转换之前的原始音频信号具有相同的再现/重放长度,而音高发生改变。这是通过加速再现拉伸信号(stretched signal)而得到的,其中执行加速再现的加速因子依赖于在时间上拉伸原始音频信号的拉伸因子。在采用时间离散的信号表示时,该过程对应于:利用等于拉伸因子的因子对拉伸信号的下采样(down-sampling)或对拉伸信号的抽取(decimation),其中采样频率保持不变。
在这样的音频信号操纵方面的具体挑战是瞬变事件。瞬变事件是:在整个频带中或特定频率范围内信号的能量快速改变(即,快速增大或快速减小)的信号中的事件。具体瞬变(瞬变事件)的特有特征(characteristic feature)是信号能量在频谱中的分布。典型地,在瞬变事件期间音频信号的能量分布在整个频率上,而在非瞬变信号部分中,能量通常集中在音频信号的低频部分或特定频带中。这意味着,还称作稳定或音调(tonal)信号部分的非瞬变信号部分具有非平坦的(non-flat)频谱。换言之,信号的能量包含在很少数目的谱线/谱带中,这些谱线/谱带明显高于音频信号的噪声基底(noise floor)。然而在瞬变部分,音频信号的能量将分布在许多不同频带上,具体地,将分布在高频部分,使得音频信号的瞬变部分的频谱会比较平坦,并且在任何事件下都会比音频信号的音调部分的频谱更为平坦。典型地,瞬变事件是时间上的强烈变化,这意味着当执行傅里叶分解时信号将包括高次谐波(higher harmonic)。这些高次谐波的重要特征是,这些高次谐波的相位有非常特殊的相互关系,使得所有这些正弦波的叠加(superposition)将导致信号能量的快速改变。换言之,在频谱上存在强相关(strong correlation)。
所有谐波之间的具体相位情况还可以称作“垂直相干性(vertical coherence)”。该“垂直相干性”与信号的时间/频率谱图表示有关,在所述信号的时间/频率谱图表示中,水平方向对应于信号在时间上的演进,垂直尺度在频率上描述了一个短时谱中谱分量的频率(转换频率点(transform frequency bins))的相互依赖。
为了时间拉伸或缩短音频信号而执行的典型处理步骤使得这种垂直相干性被破坏,这意味着当例如由相位声码器或任何其他方法对瞬变执行时间拉伸或缩短操作时,瞬变随时间而“模糊(smear)”,所述相位声码器或任何其他方法执行基于频率的处理,向音频信号引入随不同频率系数而不同的相移。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于弗劳恩霍夫应用研究促进协会,未经弗劳恩霍夫应用研究促进协会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210262760.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可更换加热头的塑料管头部处理机
- 下一篇:自动调节注塑件剪切装置