[发明专利]音频数据的编码方法及解码方法有效
申请号: | 201210487489.0 | 申请日: | 2012-11-27 |
公开(公告)号: | CN103035238A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | 陶建华;刘斌;潘诗锋 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L19/24 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 曹玲柱 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 数据 编码 方法 解码 | ||
技术领域
本发明涉及智能信息处理领域,尤其涉及一种音频数据的编码方法及解码方法。
背景技术
语音作为人类交流信息的主要手段之一,语音编码一直在通信系统中占据重要的地位。语音的数据量非常庞大,不便于直接进行传输和存储处理,同时很多领域对语音的压缩传输率要求很高,因此必须对语音进行合理有效的处理,以减少语音信号的传输速率和存储量,即进行语音压缩编码,因此极低速率语音编码已经越来越受到关注,语音信号中有很大的信息冗余,压缩的每一个比特都意味着节省开支,低速率数字语音传输具有重大的实用价值,高质量的低速率语音编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到了普遍应用。
目前已有的极低速率语音编码方法是在现有的参数语音编码方法的基础上进行进一步压缩,实现极低速率下的语音编码。将相邻帧联合编码和多级矢量量化等技术引入到经典的参数编码方法后,可以使语音在600bps速率下传输,接收端生成的语音仍具有可懂性。如果进一步降低语音传输速率(低于300bps),语音的音质将大大降低,这种方法将难以适用。通过传统的语音识别系统识别出对应的文本信息后进行传输,可以将传输速率降至200bps以下,但是采用这种方法识别出的文本难以保证较高的准确率,尤其在噪声环境下这一问题更加突显。
发明内容
(一)要解决的技术问题
为解决上述的一个或多个问题,本发明提供了一种音频数据的编码方法及解码方法,以在低编码速率的情况下,保持较高的语音音质。
(二)技术方案
根据本发明的一个方面,提供了一种音频数据的编码方法。该编码方法包括:获取原始音频,通过短时能量和短时过零率进行端点检测,剔除原始音频中的非音频数据,获得语音段数据;从语音段数据提取特征参数,通过已训练的隐马尔科夫模型和Viterbi算法,对每帧语音段数据进行状态识别,确定状态序列和状态时长;以及对状态序列和状态时长进行编码,生成音频数据包。
根据本发明的另一个方面,还提供了一种音频数据的解码方法。该解码方法包括:对接收到的音频数据包进行解码,提取状态序列以及各状态时长参数;以及对状态序列和状态时长通过训练好的隐马尔科夫模型和动态参数生成算法确定每帧数据的谱参数和基频,通过声码器生成音频数据。
(三)有益效果
从上述技术方案可以看出,本发明音频数据的编码方法及解码方法具有以下有益效果:
(1)采用基于状态传输的方法进行语音编码,发送端仅需要对识别出的状态序列和每个状态的时长进行编码传输。通过定量的分析可以确定其编码速率低于300bps,编码速率低于传统的基于参数的语音编码方法。
(2)接收端是对状态序列和各状态的时长利用隐马尔科夫模型确定语音参数,通过声码方法生成语音,去除了噪声的干扰。因此,输出的语音比传统的基于参数的语音编码方法更加清晰、可懂。
(3)传输的音频数据不受说话人、文本内容、声音采集环境的限制,因此系统具有高鲁棒性,便于实际应用。
附图说明
图1为根据本发明实施例的音频数据的编码方法及解码方法的整体结构示意图;
图2为图1所示音频数据的编码方法中剔除非语音帧的结构示意图;
图3为图1所示音频数据的编码方法中滤除背景噪声的结构示意图;
图4为图1所示音频数据的编码方法中对预处理后的音频数据提取特征参数并识别状态序列的结构示意图;
图5为图1所示音频数据的编码方法中对状态序列和各状态时长进行压缩传输的结构示意图;
图6为图1所示音频数据解码方法中接收数据并对数据包进行解码的结构示意图;
图7为图1所示音频数据解码方法中通过状态序列、状态时长和隐马尔科夫模型生成音频数据的结构示意图;
图8为本发明实施例的音频数据的编码/解码方法系统中隐马尔科夫模型的离线训练过程的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,在附图或说明书描述中,相似或相同的部分都使用相同的图号。附图中未绘示或描述的实现方式,为所属技术领域中普通技术人员所知的形式。另外,虽然本文可提供包含特定值的参数的示范,但应了解,参数无需确切等于相应的值,而是可在可接受的误差容限或设计约束内近似于相应的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210487489.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双线圈磁保持继电器
- 下一篇:电镀连接件
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置