[发明专利]一种基于人耳听觉频率尺度信号分解的音频编解码方法有效

申请号：	201911034162.6	申请日：	2019-10-29
公开（公告）号：	CN110534119B	公开（公告）日：	2020-07-03
发明（设计）人：	林志斌;刘晓峻;狄敏;吴宝佳	申请（专利权）人：	南京南大电子智慧型服务机器人研究院有限公司;江苏南大电子信息技术股份有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/02;G10L19/032;G10L25/27
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	彭雄
地址：	210019 江苏省南京市建***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于人耳听觉频率尺度信号分解的音频编解码方法，为了较好的使用心理声学模型，将线性频域的处理结果折算到对应的人耳听觉频率尺度(Bark)上，用以控制线性频域参数的量化误差。直接在人耳听觉频率尺度上进行信号分解，实现时域信号在Bark尺度的投影计算，本发明采用基于人耳听觉频率尺度进行音频信号的非均匀子带分解，有效的利用人耳听觉的心理声学模型，提升了心理声学模型计算精度和编解码的效率，本发明的量化对象为子带时域信号，在满足音频编解码码率的前提下将编解码量化失真控制在心理声学模型的参数允许范围内，量化方式新颖且效率高。
搜索关键词：	一种基于听觉频率尺度信号分解音频解码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于人耳听觉频率尺度信号分解的音频编解码方法，其特征在于，包括以下步骤：/n步骤1，获取输入音频信号；将线性频域的音频信号折算到对应的人耳听觉频率尺度上，线性频率和人耳听觉频率尺度变换关系如下：/n /n其中，b为人耳听觉频率尺度，z为变换函数，f为线性频率；/n在人耳听觉频率尺度上进行音频信号分解，实现时域信号在人耳听觉频率尺度的投影计算：/n /n其中，X(b)为投影后系数，x(n)为采样点n处的采样值，z^-1(b)为人耳听觉频率尺度域逆变换函数，j为复数符号；根据投影后系数得到心理声学感知模型参数，进而确定心理声学感知模型；/n步骤2，在人耳听觉频率尺度上进行音频信号短时正交变换分解；/n步骤3，人耳听觉频率尺度心理声学模型参数计算：在人耳听觉频率尺度上计算心理声学模型中，使频谱在不同频段内具有不同的频率分辨率，使频谱分布直接和临界频带相匹配，将计算获取的心理声学感知模型变换回时域，在时域进行分割并利用切比雪夫正交变换得到短时感知域系数，根据短时感知域系数获取用于控制量化、码率和失真的心理声学感知模型参数；/n步骤4，根据量化、码率和失真的心理声学感知模型参数对投影后系数进行量化，将量化的结果进行熵编码，得到熵编码后的编码量化参数；/n步骤5，将心理声学感知模型参数和熵编码后的编码量化参数进行码流打包，形成编码数据流；/n步骤6，解码过程为编码过程的逆过程，首先获取数据码流，进行数据反量化，反量化后数据进行听觉频率尺度逆变化合成音频信号，多帧信号组合还原形成解码音频数据流。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京南大电子智慧型服务机器人研究院有限公司;江苏南大电子信息技术股份有限公司，未经南京南大电子智慧型服务机器人研究院有限公司;江苏南大电子信息技术股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911034162.6/，转载请声明来源钻瓜专利网。

上一篇：基于声纹识别和神经网络的变压器/电抗器故障诊断方法
下一篇：一种移动网络环境下的环绕声误码修复方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于人耳听觉频率尺度信号分解的音频编解码方法有效

专利文献下载