[发明专利]一种基于正态分布规律的矢量量化方法有效

申请号：	201710083683.5	申请日：	2017-02-16
公开（公告）号：	CN106898357B	公开（公告）日：	2019-10-18
发明（设计）人：	贺前华;蔡梓文;王亚楼	申请（专利权）人：	华南理工大学
主分类号：	G10L19/012	分类号：	G10L19/012;G10L19/032;G10L25/18;G10L25/51
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	郑浦娟
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于正态分布规律的矢量量化方法，在码本生成中，首先将训练样本集的特征中心作为初始码字，然后再对初始码字进行码字分裂，当码字为非首次分裂时，将各码字的码字宽度和隶属于各码字中的训练样本数作乘积，将上述乘积最大的L个码字选取出来作为待分裂码字，得到新的码字均值，实现码字分裂，在码字每完成一次分裂后，进入数据划分阶段；数据划分时将各码字描述为正态分布，计算每个训练样本对各个码字隶属度，划分胞腔更新码字；判断量化失真度是否收敛，若否，继续数据划分；若是，则判断码字总量是否达到一定值，若否，则继续码字分裂，若是，则输出最终码本。本发明方法能够提高码字分裂准确性，降低了矢量量化的误差。
搜索关键词：	一种基于正态分布规律矢量量化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于正态分布规律的矢量量化方法，包括码本生成过程、码本搜索过程和码本索引分配过程，其特征在于，所述码本生成过程具体如下：S1、预处理：对获取到的音频信号进行静音检测，提取出非静音音频信号，并且对非静音音频信号进行分帧处理，将分帧处理得到的每帧非静音音频信作为训练样本，组成训练样本集；S2、提取训练样本集中每个训练样本的频谱特征，计算出训练样本集的特征中心，并且将训练样本集的特征中心作为初始码字；然后进入步骤S3；S3、码字分裂：判断当前码字分裂是否为初次分裂；若是，则对初始码字进行随机分裂，在随机分裂后进入步骤S5；若否，则进入步骤S4；S4、确定分裂的码字及其分裂方向和尺度，分裂得到新的码字，具体过程如下：S41、定义各码字c_i的码字宽度δ_i为各码字c_i中所有维度归一化后的方差乘积；取定值L，判断当前存在的码字总量是否大于L；若否，则将当前存在的所有码字选取出来作为待分裂码字；若是，将各码字c_i的码字宽度δ_i和隶属于各码字中c_i的训练样本数N_i作乘积，然后将上述乘积以从大到小的顺序排名前L的对应L个码字选取出来作为待分裂码字；S42、计算训练样本集中各训练样本与上述选取出的各待分裂码字之间的距离，将计算出的最大距离对应的训练样本和待分裂的码字所构成的直线方向作为码字的分类方向，并将其归一化矢量记为w；S43、根据当前存在的码字总量I、选取出的各待分裂码字的均值以及步骤S42中获取到的归一化矢量w确定新的码字的均值，从而得到分裂后的码字：其中X_h为选取出的待分裂码字c_h的均值矢量，δ_h为选取出的待分裂码字c_h的码字宽度，X_h′为计算得到的新的码字的均值矢量；S44、进入步骤S5；S5、数据划分，具体如下：S51、首先采用最近邻原则对训练样本集进行首次量化分类，划分胞腔，根据得到的胞腔更新码字，然后进入步骤S52；S52、接着用正态分布描述各码字，然后根据正态分布描述的码字计算训练样本集中每个训练样本对各个码字的隶属度，根据每个训练样本对各个码字的隶属度划分胞腔，根据得到的胞腔更新码字，然后进入步骤S53；S53、计算量化失真度，判断量化失真度是否收敛；若是，则停止数据划分，然后进入步骤S6；若否，则返回步骤S52；具体操作如下：S6、判断当前存在的码字总量I是否大于等于定值M；若否，当前存在的码字总量I小于定值M，则回到步骤S3；若是，则输出最终的码本；所述码本搜索过程，对于获取到的需要进行矢量量化的音频信号，首先进行静音检测，提取出非静音的各段音频信号，然后对上述各段音音频信号进行分帧处理，并且提取出上述各段音音频信号中各帧音频信号的频谱特征；其中对于非静音的各段音音频信号中各帧音频信号，考虑语音的准平稳特性，将当前帧音频信号的量化结果受制约于上一帧音频信号的量化结果，具体操作如下：S71、对于s段音频信号中的第一帧音频信号的特征参数值f＝1，采用K邻近准则量化，量化码字对应为S72、对于s段音频信号中的第f帧音频信号的特征参数值f＞1，计算其隶属于码本中各个码字的隶属度，将得到的最大的K各隶属度对应的码字选取出来，其中选取出来的码字分别为对于s段音频信号中的第f帧音频信号的量化结果码字根据下述原则确定其总量化失真度量及来源：其中表示s段音频信号中的第f帧音频信号对应量化结果为码字时的量化误差；其中表示s段音频信号中的第f‑1帧音频信号对应量化结果为码字时的量化误差，码字表示s段音频信号中的第f‑1帧音频信号其中一个量化结果；T_s为s段音频信号的总帧数；其中其中表示码字和码字之间的距离度量，为码字和码字之间的距离度量，其中p＝1,2,...K，表示s段音频信号中的第f‑1帧音频信号其中一个量化结果；ε_lk为一修正常数，该值与s段音频信号中的第f帧音频信号对应量化结果码字和s段音频信号中的第f‑1帧音频信号对应量化结果码字之间的距离度量成正相关；表示s段音频信号中的第f帧音频信号与码字之间的距离度量；其中其中为码字的均值矢量，为码字的方差矢量；S73、对于s段音频信号中的各帧音频信号的各个量化结果码字通过步骤S72依次求取s段音频信号中的各帧音频信号的总量化失真度量及来源S74、k取1,2,...,K，然后从中选取最小的一个作为s段音频信号中最后一帧音频信号的特征参数值的量化失真度；最后根据该最小的量化失真度，通过步骤S72中的总量化失真度量及来源公式依次反索确定s段音频信号中各帧音频信号的特征参数值对应的最小的量化失真度，从而根据各最小的量化失真度确定s段音频信号各帧音频信号的量化结果；所述码本索引分配过程具体如下：S81、对量化后的每段音频信号，分别作为样本，定义第g段样本的关联码字为该段样本中每一帧音频信号关联码字的并集，用集合表示；其中，定义为第g段样本第f帧音频信号的量化结果，包括K个隶属码字及相应的隶属度值；L_g表示第g段样本的帧数；用集合A＝{A₁,A₂...A_G}表示所有量化后数据的关联码字信息，G为量化后的音频信号的总段数；S82、首先统计当前各码字的隶属度之和，即集合A中，与各码字关联的各样本的音频信号帧对各码字的隶属度之和；选择隶属度最大的码字并且存入最大码字集合C_max中，即此时最大码字集合S83、根据码字对集合A进行第一次筛选，得到集合A⁽¹⁾，使得集合A⁽¹⁾中量化结果对应的样本至少有一帧是隶属于的最大码字S84、统计集合A^(b)，b≥1中量化结果对应的样本隶属于除当前最大码字集合C_max中的码字之外的其他码字，并且从这些码字中选择隶属度之和最大的一个码字b≥1，然后存入最大码字集合C_max中，即此时最大码字集合根据码字对集合A^(b)进行筛选，得到集合A′^(b)，使得集合A′^(b)中量化结果对应的样本至少有一帧是隶属于码字的；S85、判断步骤S84当前获取到的集合A′^(b)量化结果所对应的样本数是否小于预设值F(F为常数)；若否，则b加1后返回大步骤S84；若是，则将集合A′^(b)量化结果对应的样本作为目标样本，即索引样本，此时集合A′^(b)量化结果对应的样本同时隶属于当前最大码字集合中的各个最大码字。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710083683.5/，转载请声明来源钻瓜专利网。

同类专利

一种基于正态分布规律的矢量量化方法-201710083683.5
发明人：贺前华;蔡梓文;王亚楼 -专利权人：华南理工大学
申请日： 2017-02-16 - 公布日： 2019-10-18 - 主分类号： G10L19/012
摘要：本发明公开了一种基于正态分布规律的矢量量化方法，在码本生成中，首先将训练样本集的特征中心作为初始码字，然后再对初始码字进行码字分裂，当码字为非首次分裂时，将各码字的码字宽度和隶属于各码字中的训练样本数作乘积，将上述乘积最大的L个码字选取出来作为待分裂码字，得到新的码字均值，实现码字分裂，在码字每完成一次分裂后，进入数据划分阶段；数据划分时将各码字描述为正态分布，计算每个训练样本对各个码字隶属度，划分胞腔更新码字；判断量化失真度是否收敛，若否，继续数据划分；若是，则判断码字总量是否达到一定值，若否，则继续码字分裂，若是，则输出最终码本。本发明方法能够提高码字分裂准确性，降低了矢量量化的误差。

一种网络话机柔和噪声产生的方法-201610996520.1
发明人：丁海忠;何延伟;叶成竞 -专利权人：南京汉隆科技有限公司
申请日： 2016-11-13 - 公布日： 2019-09-03 - 主分类号： G10L19/012
摘要：本发明公开一种网络话机柔和噪声产生的方法，在不改变标准协议的情下，采用在白噪声中加入了随机自适应码本和随机固定码本，通过检测负载包信号源是否为活性语音或非活性语音，在经过噪声解码和线性预测编码计算后产生语音信号模型，再经过线性预测滤波器产生柔和的噪声，本技术方案的效果能较好的反映实际环境的背景噪声，使听觉上感觉具有连续性和稳定性。

用于音频编码中的DTX拖尾的方法和装置-201811579562.0
发明人：斯蒂芬·布鲁恩;托马斯·詹森托夫特戈德;马丁·绍尔斯戴德 -专利权人：瑞典爱立信有限公司
申请日： 2013-12-12 - 公布日： 2019-07-12 - 主分类号： G10L19/012
摘要：提供了用于音频编码的发送节点和接收节点及其中的方法。所述节点可操作以对话音进行编码/解码并且在话音非活动期间应用不连续传输(DTX)方案，该DTX方案包括发送/接收静音插入描述符(SID)帧。发送节点中的方法包括：从多个(N个)拖尾帧中确定代表背景噪声的帧集合Y，以及还向接收节点发送N个拖尾帧，所述N个拖尾帧至少包括所述帧集合Y。该方法还包括：与发送N个拖尾帧相关联地向接收节点发送第一SID帧，其中，第一SID帧包括向接收节点指示所确定的拖尾帧集合Y的信息。该方法使接收节点能够基于最适合于该目的的拖尾帧生成舒适噪声。

信号编码方法及设备-201610819333.6
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2013-05-30 - 公布日： 2019-04-19 - 主分类号： G10L19/012
摘要：本发明实施例提供了信号编码方法及设备。该方法包括：在当前输入帧的前一帧的编码方式为连续编码方式的情况下，预测在当前输入帧被编码为SID帧的情况下解码器根据当前输入帧生成的舒适噪声，并确定实际静音信号，其中当前输入帧为静音帧；确定舒适噪声与实际静音信号的偏离程度；根据偏离程度，确定当前输入帧的编码方式，当前输入帧的编码方式包括拖尾帧编码方式或SID帧编码方式；根据当前输入帧的编码方式，对当前输入帧进行编码。本发明实施例中，通过根据舒适噪声与实际静音信号的偏离程度确定当前输入帧的编码方式为拖尾帧编码方式或SID帧编码方式，能够节省通信带宽。

使用对齐的前瞻部分将音频信号编码及解码的装置与方法-201510490977.0
发明人：埃曼努埃尔·拉维利;拉尔夫·盖尔;马库斯·施内尔;纪尧姆·福奇斯;韦莎·罗皮拉;汤姆·贝克斯特伦;伯恩哈德·格里;克里斯蒂安·赫尔姆里希 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2012-02-14 - 公布日： 2019-04-09 - 主分类号： G10L19/012
摘要：本发明公开了使用对齐的前瞻部分将音频信号编码及解码的装置与方法。一种编码音频信号的装置，包括：窗口器，对音频样本流应用预测编码分析窗口以获得用于预测分析的窗口化数据，以及对音频样本流应用转换编码分析窗口以获得用于转换分析的窗口化数据，其中，转换编码前瞻部分和预测编码前瞻部分彼此相同或者彼此不同之处小于20％的预测编码前瞻部分或小于20％的转换编码前瞻部分；以及编码处理器，使用用于预测分析的窗口化数据来产生用于当前帧的预测编码数据，或者用于使用用于转换分析的窗口化数据来产生用于当前帧的转换编码数据。

非激活音信号参数估计方法及舒适噪声产生方法及系统-201210037152.X
发明人：江东平;袁浩 -专利权人：南京中兴软件有限责任公司
申请日： 2012-02-17 - 公布日： 2017-06-06 - 主分类号： G10L19/012
摘要：本发明公开了非激活音信号参数估计方法及舒适噪声产生方法及系统，针对非激活音信号帧，将包含所述非激活音信号帧的时域信号的序列进行时频变换，得到频谱序列，根据此频谱序列计算频谱系数，对所述频谱系数进行平滑处理，根据所述经过平滑处理后的频谱系数计算得到平滑处理后的频谱序列，对此平滑处理后的频谱序列进行时频反变换得到重构的时域信号，根据所述重构的时域信号进行非激活音信号参数估计，得到频谱参数和能量参数。本方案可以在非稳态背景噪声情况下提供平稳的背景噪声参数，尤其是在激活音检测判断准确的情况下，可以在舒适噪声产生系统中较好的消除解码端合成的舒适噪声中的人工杂音。

信号编码方法及设备-201510662031.8
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2013-05-30 - 公布日： 2017-05-10 - 主分类号： G10L19/012
摘要：本发明实施例提供了信号编码方法及设备。该方法包括在当前输入帧的前一帧的编码方式为连续编码方式的情况下，预测在当前输入帧被编码为SID帧的情况下解码器根据当前输入帧生成的舒适噪声，并确定实际静音信号，其中当前输入帧为静音帧；确定舒适噪声与实际静音信号的偏离程度；根据偏离程度，确定当前输入帧的编码方式，当前输入帧的编码方式包括拖尾帧编码方式或SID帧编码方式；根据当前输入帧的编码方式，对当前输入帧进行编码。本发明实施例中，通过根据舒适噪声与实际静音信号的偏离程度确定当前输入帧的编码方式为拖尾帧编码方式或SID帧编码方式，能够节省通信带宽。

一种多分辨率音频信号处理方法及装置-201511030282.0
发明人：凌永权;肖均;邝伟潮;张小志;苏静;李志光 -专利权人：广东工业大学;李志光
申请日： 2015-12-30 - 公布日： 2016-11-16 - 主分类号： G10L19/012
摘要：本发明公开了一种多分辨率音频信号处理方法及装置，所述方法，包括：对子信号进行离散傅里叶变换，得到第一级序列；在所述第一级序列中插入零点；对所述插入零点后的第一级序列进行离散傅里叶反变换；对所述离散傅立叶反变换后的第一级序列进行分解，得到多个第二级的本征模特函数；对每个第二级的本征模特函数进行离散傅立叶变换，得到第二级的本征模特函数的序列；移除第二级的本征模特函数在零点插入处的系数，得到变短的第二级本征模特函数的序列；对每个变短的第二级本征模特函数的序列进行离散傅立叶反变换，得到最终的第二级的本征模特函数。本发明的多分辨率音频信号处理方法及装置，能够减少分解次数及能量损失。

一种基于数字信号处理器芯片和现场可编程门阵列芯片的语音基带处理系统-201410472568.3
发明人：苏振宇;于飞;李前 -专利权人：浪潮电子信息产业股份有限公司
申请日： 2014-09-10 - 公布日： 2015-01-21 - 主分类号： G10L19/012
摘要：本发明涉及一种语音基带处理系统，特别涉及一种基于数字信号处理器芯片和现场可编程门阵列芯片的语音基带处理系统，其结构包括：DSP芯片、FPGA芯片、语音编码模块、语音译码模块、Flash芯片、总线驱动器、SRAM芯片、FPGA配置芯片、电源芯片、键盘/显示模块。本发明应用于数字通信领域，可以把语音基带处理系统中待传输的模拟语音信号转换为数字基带信号，从而使用固定的频率在信道上传输。

空间舒适噪声-201310081933.3
发明人：格伦·N·迪金斯;孙学京;许元良;海科·普尔哈根 -专利权人：杜比实验室特许公司
申请日： 2013-03-14 - 公布日： 2014-09-17 - 主分类号： G10L19/012
摘要：本发明涉及空间舒适噪声。本发明涉及一种方法、设备、逻辑（例如，在非临时性计算机可读介质中编码的以用于执行方法的可执行指令）、以及配置有这种指令的非临时性计算机可读介质。该方法用于在会议系统的接收终端处生成空间舒适噪声并在空间上渲染空间舒适噪声，使得舒适噪声具有舒适噪声的典型目标谱特征以及与至少一个目标空间属性至少基本上匹配的至少一个空间属性。一个版本包括接收来自其他终端的一个或更多个音频信号，将所接收到的音频信号与空间舒适噪声信号组合，以及将所接收到的音频信号和空间舒适噪声信号的组合渲染成用于扬声器的一组信号，使得除了来自接收到的音频信号的输出之外，空间舒适噪声信号也持续地存在于输出信号中。

比特分配、音频编码和解码-201280034734.0
发明人：金美英;安顿·普波沃;吴殷美 -专利权人：三星电子株式会社
申请日： 2012-05-14 - 公布日： 2014-03-19 - 主分类号： G10L19/012
摘要：提供一种比特分配方法，所述方法包括：基于每个频带按照小数点为单位确定分配的比特的数量以使得在给定帧的可容许的比特的数量的范围内使存在于预定频带中的频谱的信噪比(SNR)最大化；以及基于每个频带调整分配的比特的数量。

支持时域及频域编码模式的音频编解码器-201280018224.4
发明人：拉尔夫·热日尔;康斯坦丁·施密特;伯恩哈德·格里尔;曼弗雷德·卢茨基;米夏埃尔·维尔纳;马克·盖尔;约翰内斯·希尔珀特;玛丽亚·路易斯瓦莱罗;沃尔夫冈·耶格斯 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-14 - 公布日： 2014-01-29 - 主分类号： G10L19/012
摘要：在速率/失真比方面具有低延迟及增高的编码效率的支持时域及频域两种编码模式的音频编解码器通过如下得到：配置音频编码器使得音频编码器以不同操作模式操作，使得如果活动的操作模式为第一操作模式，则可用帧编码模式的模式相关集合与时域编码模式的第一子集不相交，并且与频域编码模式的第二子集重叠；而如果活动的操作模式为第二操作模式，则可用帧编码模式的模式相关集合与两个子集即时域编码模式的子集以及频域编码模式的子集都重叠。

在不活动阶段期间利用噪声合成的音频编解码器-201280015995.8
发明人：帕尼·塞蒂亚万;康斯坦丁·施密特;斯特凡·维尔登 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-14 - 公布日： 2014-01-22 - 主分类号： G10L19/012
摘要：在活动阶段或非无声阶段期间参数背景噪声估计被连续地更新，使得当在活动阶段后进入不活动阶段时即刻开始噪声生成。根据另一方面，非常有效地使用频谱域以参数化该背景噪声，由此获得更为真实的背景噪声合成，并且由此导致更加透明的活动阶段至不活动阶段切换。

在一频谱域中用以处理已解码音频信号的装置及方法-201280015997.7
发明人：纪尧姆·福奇斯;拉尔夫·盖尔;马库斯·施内尔;埃曼努埃尔·拉维利;斯特凡·多赫拉 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-10 - 公布日： 2014-01-08 - 主分类号： G10L19/012
摘要：用以处理已解码音频信号（100）的设备包含用以滤波该已解码音频信号来获得已滤波音频信号（104）的滤波器（102），用以将该已解码音频信号及该已滤波音频信号转换成相对应的频谱表示型态的时间频谱转换器级（106），各个频谱表示型态具有多个子带信号，用以通过将子带信号乘以各个加权系数执行该已滤波音频信号的频率选择性加权来获得已加权已滤波音频信号的加权器（108），用以执行该已加权已滤波音频信号与该已解码音频信号的该频谱表示型态之间的逐一子带减法的减法器（112），及用以将结果音频信号或从该结果音频信号获得的一信号转换成时域表示型态来获得已处理已解码音频信号（116）的频谱时间转换器（114）。

用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法-201280018282.7
发明人：埃曼努埃尔·拉维利;拉尔夫·盖尔;马库斯·施内尔;纪尧姆·福奇斯;韦莎·罗皮拉;汤姆·贝克斯特伦;伯恩哈德·格里;克里斯蒂安·赫尔姆里希 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-14 - 公布日： 2014-01-08 - 主分类号： G10L19/012
摘要：一种用于编码具有音频样本流（100）的音频信号的装置，包括：窗口器（102），用于对音频样本流应用预测编码分析窗口（200）以获得用于预测分析的窗口化数据，以及用于对音频样本流应用转换编码分析窗口（204）以获得用于转换分析的窗口化数据，其中，转换编码分析窗口与音频样本的当前帧内的音频样本以及与作为转换编码前瞻部分（206）的音频样本的未来帧的预定部分的音频样本相关联，其中，预测编码分析窗口与当前帧的音频样本的至少一部分以及与作为预测编码前瞻部分（208）的未来帧的预定部分的音频样本相关联，其中，转换编码前瞻部分（206）和预测编码前瞻部分（208）彼此相同或者彼此不同之处小于20%的预测编码前瞻部分（208）或小于20%的转换编码前瞻部分（206）；以及编码处理器（104），用于使用用于预测分析的窗口化数据来产生用于当前帧的预测编码数据，或者用于使用用于转换分析的窗口化数据来产生用于当前帧的转换编码数据。

用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法-201280014994.1
发明人：克里斯蒂安·黑尔姆里希;纪尧姆·富克斯;戈兰·马尔科维奇 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-13 - 公布日： 2014-01-01 - 主分类号： G10L19/012
摘要：一种用于编码音频信号的部分（10）以获得该音频信号的部分的编码音频信号（26）的装置，其包含：瞬态检测器（12），其检测瞬态信号是否位于音频信号的部分中，以获得瞬态检测结果（14）；编码器级（16），其针对音频信号执行第一编码算法、以及针对音频信号执行第二编码算法，第一编码算法具有第一特性，第二编码算法具有不同于第一特性的第二特性；处理器（18），其确定何种编码算法相对于另一编码算法使得编码音频信号更近似于音频信号的部分，以获得质量结果（20）；以及控制器（22），其基于瞬态检测结果（14）和质量结果（20），确定要由第一编码算法或要由第二编码算法来产生音频信号的部分的编码音频信号。

音频编解码器中的噪声产生-201280018251.1
发明人：潘基·塞蒂亚万;斯特凡·维尔德;安东尼·隆巴尔多;马丁·迪茨 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-14 - 公布日： 2013-12-25 - 主分类号： G10L19/012
摘要：频谱域被有效使用以参数化背景噪声，从而获得背景噪声合成，该背景噪声合成更真实因而导致更透明的活动阶段至非活动阶段切换。

使用频谱域噪声整形的基于线性预测的编码方案-201280018265.3
发明人：戈兰·马尔科维奇;纪尧姆·福奇斯;尼古劳斯·雷特尔巴赫;克里斯蒂安·赫尔姆里希;本杰明·苏伯特 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-14 - 公布日： 2013-12-25 - 主分类号： G10L19/012
摘要：一种基于线性预测并使用频谱域噪声整形的编码概念，通过利用将音频输入信号分解成包括频谱序列的谱图的频谱分解，来用于线性预测系数计算以及基于线性预测系数的频谱域整形两者，得以在例如就比率/失真比而言的相近编码效率下具有较低的复杂性。即使导致混叠并需要时间混叠消除的重叠变换，诸如临界取样的重叠变换（例如MDCT）被用于频谱分解，编码效率也可保持不变。

音频信号音轨脉冲位置的编码与译码-201280016442.4
发明人：汤姆·贝克斯特伦;纪尧姆·福奇斯 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2012-02-10 - 公布日： 2013-12-18 - 主分类号： G10L19/012
摘要：提出一种用以译码一编码音频信号的装置，其中，一或多个音轨是与该编码音频信号相关联，这些音轨中的每一者具有多个音轨位置及多个脉冲。该装置包含一脉冲信息译码器（110）及一信号译码器（120）。该脉冲信息译码器（110）是适用以译码多个脉冲位置，其中这些脉冲位置中的每一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置，及其中该脉冲信息译码器是经配置来藉由使用指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、指示这些音轨中的至少一者的脉冲总数的一总脉冲数目、及一个状态数目而译码这些多个脉冲位置。该信号译码器（120）是适用于藉由使用这些多个脉冲位置及与该编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码该编码音频信号。

音频数据的处理方法、装置和系统-201110455836.7
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2011-12-30 - 公布日： 2013-07-03 - 主分类号： G10L19/012
摘要：本发明公开了一种音频数据的处理方法、装置和系统，属于通信技术领域。所述方法包括：获取音频信号的噪声帧，并将所述当前噪声帧分解为噪声低带信号和噪声高带信号；以第一非连续传输机制编码传输所述噪声低带信号；以第二非连续传输机制编码传输所述噪声高带信号。本发明通过对高带信号和低带信号不同的处理方式，可以在不降低编解码器主观质量的前提下节省计算复杂度和编码比特，节省下的比特可达到降低传输带宽或用于提高整体编码质量的目的。

舒适噪声生成方法及舒适噪声生成器-201110338950.1
发明人：谢单辉;许云峰;曹一鸣 -专利权人：联芯科技有限公司
申请日： 2011-11-01 - 公布日： 2013-05-08 - 主分类号： G10L19/012
摘要：本发明涉及通信领域，公开了一种舒适噪声生成方法及舒适噪声生成器。本发明中，不再对增益因子和LPC系数分别进行估计，而且结合LPC系数及目标能量，共同估计该增益因子，从而尽可能保证背景噪声和生成的舒适噪声的能量接近，解决了舒适噪声生成器所生成的噪声与实际背景噪声之间的能量不匹配问题，进而使得生成的舒适噪声能量更加贴近背景噪声，提高了主观感受。

一种进行语音自适应非连续传输的方法及装置-201110216374.3
发明人：顾彩霞;袁浩;江东平;黎家力 -专利权人：中兴通讯股份有限公司
申请日： 2011-07-29 - 公布日： 2013-01-30 - 主分类号： G10L19/012
摘要：本发明公开了一种进行语音自适应非连续传输的方法及装置，此方法包括：在进行语音自适应非连续传输中，根据当前的语音信号帧和上一静音插入描述帧的频谱信息决定是否发送静音插入描述帧。本方案可以克服现有技术中的采用固定间隔方式不能灵活跟踪信号变化，采用可变间隔方式又必须有线性预测等多参数的计算导致计算复杂度高的缺点。本方案直接在频域进行，能很好地跟踪信号的变化，在保持较低平均码率的同时保证音质。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于正态分布规律的矢量量化方法有效

专利文献下载