[发明专利]信号复杂度和编码速率选择的映射实现方法有效
申请号: | 201210100679.2 | 申请日: | 2012-04-09 |
公开(公告)号: | CN102610234A | 公开(公告)日: | 2012-07-25 |
发明(设计)人: | 严勤;周云春 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L19/08 | 分类号: | G10L19/08;G10L19/10;G10L15/06 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 艾中兰 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 复杂度 编码 速率 选择 映射 实现 方法 | ||
技术领域
本发明属于声信号分析处理技术领域,具体涉及到按音乐信号的信号复杂度对音乐信号进行分级,为编码速率选择提供依据,提高编码传输效率。
背景技术
随着通信技术的发展,数字化通信越来越受到人们的重视,现代通信的一个重要标志就是通信的数字化。数字信号最突出的优点是受信道噪声干扰小,易于再生与存储,易于误码保护和加密以及易于多路复用、分组和组合。但音频信号若是经过A/D转换后直接编码,将产生大量的数据,这不利于传输或存储,因此为了提高效率,必须对音频信号进行压缩处理;而原始的音频信号在时间和空间上存在着大量的冗余度可供压缩,并且可以在解码环节加以恢复。音频编码属于信源编码,由于音频信号的最终使用者是用户,所以只要音频信号解码后在人耳可接受的或是不能察觉的范围内,就允许对数字音频信号进行压缩以换取较高的编码速率。
现代卫星通信、数字移动通信和个人通信网的迅猛发展,日益增加的客户需求量与现有通信信道容量之间的矛盾日益突出。如何提高信道的传输效率、有效地利用现有带宽是目前亟待解决的问题之一。对于音乐信号来说,如何在现有的信道资源条件下,选择适当的编码速率而又不影响信号质量,提高传输效率,即利用信源信号的特征来指导编码速率的选择并提高传输效率是近几年比较需要的。但此类研究还刚起步,成果并不多。本发明研究的正是基于音频本身性质来选择编码速率的模型机制,提出按音乐信号的信号复杂度对音乐信号进行分类,区别于传统音乐信号分类,能为编码速率选择提供依据,提高编码传输效率。
在学术上,基于信号复杂度的分类和传统意义上的音乐类型分类(music genre classification)[1]和音乐情绪分类(music mode/emotion classification)是有本质区别的。后者是从音乐信号的内容(例如:主题,韵律,旋律,类别,乐器,情绪等)出发,多用于数字音乐库的整理和检索;而前者是从应用和声音信号传输速率和质量出发。初步实验表明,传统音乐信号分类对音乐信号的复杂度有一定的指导作用,但不意味着同一类的音乐信号在同样传输速率下所达到的传输质量是一致的,并不是所有的复杂有用声音信号都需要同样高的码率来传输。
参考文献:
[1] George Tzanetakis, Perry Cook, “Musical Genre Classification of Audio Signals” IEEE Transactions On Speech And Audio Processing, VOL. 10, NO. 5, July 2002.
[2] Steve Young, Dan Kershaw, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland,“The HTK Book ” .
[3] Olivier Lartillot,Petri Toiviainen,Tuomas Eerola.”MIRtoolbox”.
[4] Qin Yan,Saeed Vasegi.”Modelling and Synthesis of Formants of British,American and Australian Accents.”Proc.IEEE Conference on Acoustics Speech and Signal Processing(ICASSP),2003.pp.712-755.
[5] Qin Yan,Saeed Vaseghi,Dimitrios Rentzos,Ching-Hsiang Ho.”Analysis by Synthesis of Acoustic Correlates of British,Australian and American Accents.Proc(ICASSP).pp.621-624(2004).
[6] 韩纪庆,冯涛,郑贵滨,马翼平.“音频信息处理技术”.北京:清华大学出版社.2007.
发明内容
本发明研究的是复杂有用声音信号复杂度和编码速率之间的映射关系。目的是提出一组能表征音乐信号复杂度的特征参数集,并以此为分类依据,为传输速率选择提供依据。
本发明的信号复杂度和编码速率选择的映射实现方法包含如下五个过程:
A. 特征提取:提取音频输入信号的特征参数集,基于该特征参数集为输入音频信号导出特征矢量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210100679.2/2.html,转载请声明来源钻瓜专利网。