[发明专利]用于编码音频信号的方法及装置有效

申请号：	201880037632.1	申请日：	2018-05-24
公开（公告）号：	CN110709928B	公开（公告）日：	2023-05-16
发明（设计）人：	A·瓦西拉凯;A·拉莫	申请（专利权）人：	诺基亚技术有限公司
主分类号：	G10L19/038	分类号：	G10L19/038;H03M7/30
代理公司：	北京市中咨律师事务所 11247	代理人：	杨晓光
地址：	芬兰***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	尤其公开了一种装置，其包括：包括多个子向量的表，其中，所述表的每个条目是子向量，并且每个子向量具有与一个或多个基本码向量的向量分量相同的向量分量；以及另一个表，其中，所述另一个表的条目包括指向所述表中的子向量的第一指针和指向所述表中的子向量的第二指针，其中，第一指针和第二指针被布置在所述另一个表中，以使得当第一指针所指向的子向量的向量分量与第二指针所指向的子向量的向量分量组合时，构成基本码向量。
搜索关键词：	用于编码音频信号方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种装置，包括：/n包括多个子向量的表，其中，所述表的每个条目是子向量，并且每个子向量具有与一个或多个基本码向量的向量分量相同的向量分量；以及/n另一个表，其中，所述另一个表的条目包括指向所述表中的子向量的第一指针和指向所述表中的子向量的第二指针，其中，所述第一指针和所述第二指针被布置在所述另一个表中，以使得当所述第一指针所指向的子向量的向量分量与所述第二指针所指向的子向量的向量分量组合时，构成基本码向量。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于诺基亚技术有限公司，未经诺基亚技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201880037632.1/，转载请声明来源钻瓜专利网。

同类专利

说话人验证模型的量化方法、电子设备和存储介质-202310675288.1
发明人：俞凯;刘贝;王浩宇;钱彦旻 -专利权人：思必驰科技股份有限公司
申请日： 2023-06-08 - 公布日： 2023-09-05 - 主分类号： G10L19/038
摘要：本发明公开说话人验证模型的量化方法、电子设备和存储介质，其中，一种说话人验证模型的量化方法，包括：获取说话人验证模型所有层的实值权重；将所述所有层的实值权重映射到固定整数集；或动态确定每一层的实值权重对应的二值权重，以更好地匹配实值权重分布。本申请实施例的方法提出了两种全新的量化策略，即静态量化和自适应量化。进一步的，对于静态量化，本申请实施例提出了权重正则化技术，以保持最大的信息熵，减少信息的损失。进一步地，本申请实施例还提出了一种自适应量化方案，可以动态确定每一层的最佳二值，以实现与实值权重分布更好的对齐。

用于处理包络表示系数的方法、编码器和解码器-202211569599.1
发明人：乔纳斯·斯韦德贝里;马丁·绍尔斯戴德;斯蒂芬·布鲁恩 -专利权人：瑞典爱立信有限公司
申请日： 2017-12-15 - 公布日： 2023-06-27 - 主分类号： G10L19/038
摘要：提出了用于处理包络表示系数的方法、编码器和解码器。该方法包括量化输入包络表示系数；通过从所述输入包络表示系数中减去量化的包络表示系数来确定残差系数；变换所述残差系数，以获得变换的残差系数；对所述变换的残差系数应用多个增益形状编码方案中的至少一个，以获得增益形状编码的残差系数，其中所述多个增益形状编码方案对于所述变换的残差系数中的一个或多个在增益分辨率和形状分辨率中的一个或多个方面具有互不相同的折中；以及提供对下述项的表示以便发送给音频解码器：所述量化的包络表示系数、所述增益形状编码的残差系数、以及关于所应用的所述至少一个增益形状编码方案的信息。

椎体矢量量化器形状搜索-201910135157.8
发明人：乔纳斯·斯韦德贝里 -专利权人：瑞典爱立信有限公司
申请日： 2015-06-25 - 公布日： 2023-06-20 - 主分类号： G10L19/038
摘要：一种用于椎体矢量量化器PVQ形状搜索的编码器及其方法，所述PVQ采用目标矢量x作为输入，并通过在内部维度搜索循环中迭代地添加单位脉冲来获得矢量y。所述方法包括：在进入用于单位脉冲添加的下一个内部维度搜索循环之前：基于当前矢量y的最大脉冲幅度maxampy，确定是否需要多于当前比特字长来在即将到来的内部维度循环中以无损方式表示变量enloopy。变量enloopy与y的累加能量相关。该方法的执行使编码器能够将搜索的复杂度保持在合理水平。例如，其通过分析即将到来的内循环中的“最坏情况场景”是否需要比当前使用的精度更高精度的内循环，而使编码器能够仅在需要的时候应用精度增加的循环。

用于编码音频信号的方法及装置-201880037632.1
发明人： A·瓦西拉凯;A·拉莫 -专利权人：诺基亚技术有限公司
申请日： 2018-05-24 - 公布日： 2023-05-16 - 主分类号： G10L19/038
摘要：尤其公开了一种装置，其包括：包括多个子向量的表，其中，所述表的每个条目是子向量，并且每个子向量具有与一个或多个基本码向量的向量分量相同的向量分量；以及另一个表，其中，所述另一个表的条目包括指向所述表中的子向量的第一指针和指向所述表中的子向量的第二指针，其中，第一指针和第二指针被布置在所述另一个表中，以使得当第一指针所指向的子向量的向量分量与第二指针所指向的子向量的向量分量组合时，构成基本码向量。

用于编码的矢量分段的方法和设备-202010106531.4
发明人：托马斯·詹森托夫特戈德;乔纳斯·斯韦德贝里;沃洛佳·格兰恰诺夫 -专利权人：瑞典爱立信有限公司
申请日： 2014-11-06 - 公布日： 2023-05-12 - 主分类号： G10L19/038
摘要：呈现了一种用于对输入矢量进行分区以用于编码的方法。方法包括：获得(210)输入矢量。用非递归的方式将输入矢量分段(220)为整数NSEG个输入矢量分段。用递归的方式确定(230)在输入矢量分段之间的每个边界的每一侧处输入矢量的各部分之间的相应相对能量差的表示。提供(250)输入矢量分段和相对能量差的表示，以用于单独编码。呈现了用于对输入矢量进行分区以用于编码的分区单元和计算机程序，以及位置编码器。

用于编码的矢量分段的方法和设备-202010107055.8
发明人：托马斯·詹森托夫特戈德;乔纳斯·斯韦德贝里;沃洛佳·格兰恰诺夫 -专利权人：瑞典爱立信有限公司
申请日： 2014-11-06 - 公布日： 2023-05-02 - 主分类号： G10L19/038
摘要：呈现了一种用于对输入矢量进行分区以用于编码的方法。方法包括：获得(210)输入矢量。用非递归的方式将输入矢量分段(220)为整数NSEG个输入矢量分段。用递归的方式确定(230)在输入矢量分段之间的每个边界的每一侧处输入矢量的各部分之间的相应相对能量差的表示。提供(250)输入矢量分段和相对能量差的表示，以用于单独编码。呈现了用于对输入矢量进行分区以用于编码的分区单元和计算机程序，以及位置编码器。

音频数据编解码方法和相关装置及计算机可读存储介质-202110596023.3
发明人：夏丙寅;李佳蔚;王喆 -专利权人：华为技术有限公司
申请日： 2021-05-29 - 公布日： 2022-11-29 - 主分类号： G10L19/038
摘要：本申请实施例提供音频数据编解码方法和相关装置及计算机可读存储介质。一种音频数据编码方法，可包括：获取待编码的音频数据；利用编码神经网络对待编码的音频数据进行处理以生成第一潜在变量；对所述第一潜在变量进行量化处理以得到第二潜在变量；根据所述第一潜在变量和所述第二潜在变量得到潜在变量补偿参数；将所述潜在变量补偿参数进行编码，并将所述潜在变量补偿参数的编码结果写入码流；将第二潜在变量进行编码，将所述第二潜在变量的编码结果写入码流。本申请实施例方案有利于降低解码神经网络的相关输入失真，从而提升最终解码信号的质量。

一种北斗短报文语音传输方法和装置-202210320220.7
发明人：马民;王宇翔;刘中昌;张帅毅;肖继群 -专利权人：航天宏图信息技术股份有限公司
申请日： 2022-03-29 - 公布日： 2022-06-24 - 主分类号： G10L19/038
摘要：本发明提供了一种北斗短报文语音传输方法和装置，涉及数据传输的技术领域，包括：获取待传输语音信号，并对待传输语音信号依次进行采样、量化和分帧，得到目标语音信号；对目标语音信号进行LPC滤波，并确定出滤波后的目标语音信号的属性数据和各个语音帧的类型；基于语音帧的相关性和滤波后的目标语音信号，构建超级帧，并基于各个语音帧的类型，对超级帧进行编码，得到超级帧编码；对超级帧编码和超级帧编码包含的语音帧的属性数据进行向量量化，得到语音压缩编码，并对语音压缩编码进行压缩，得到压缩信号；以北斗短报文传输方式，将压缩信号发送给接收设备，解决了现有的北斗短报文语音传输的效率较低的技术问题。

一种用于音频信号的矢量量化编解码方法及装置-201310728959.2
发明人：潘兴德;吴超刚;李靓 -专利权人：北京天籁传音数字技术有限公司
申请日： 2013-12-25 - 公布日： 2021-04-02 - 主分类号： G10L19/038
摘要：本发明涉及一种用于音频信号的矢量量化编解码方法及装置，所述编码方法包括：对音频信号的变换域谱进行音频感知分析，根据分析结果对音频信号的变换域谱进行幅度调整，得到待量化的加权谱；对所述待量化的加权谱进行组织，得到多个待量化的矢量；以及对所述多个待量化的矢量进行量化编码，得到矢量量化编码数据。本发明提出了一种用于音频信号的矢量量化编解码方案，该方案参考音频感知特性对变换域信号进行幅度调整，可消除感知冗余，提高编码效率；通过信号特性分析，对音频的时频平面进行合理的划分，并将其组织成待量化矢量；可选择使得编码增益最大的时频平面划分和矢量组织方式，有利于对信号进行高效的量化编码。

信号编码和解码方法以及设备-201711387694.9
发明人：刘泽新;苗磊;胡晨 -专利权人：华为技术有限公司
申请日： 2013-07-01 - 公布日： 2021-02-26 - 主分类号： G10L19/038
摘要：本发明实施例提供了信号编码和解码方法以及设备。该方法包括：根据可用比特数和第一饱和阈值i，确定将要编码的子带数目k，其中i为正数，k为正整数；根据各个子带量化的包络从各个子带中选择k个子带，或者根据心理声学模型从各个子带中选择k个子带；对k个子带的频谱系数进行一次编码操作。本发明实施例中，通过根据可用比特数和第一饱和阈值确定将要编码的子带数目k，并从各个子带中选择k个子带来进行编码，而非对整个频带进行编码，能够减少解码信号的频谱空洞，从而能够提升输出信号的听觉质量。

频域包络的矢量量化方法和装置-201710370044.7
发明人：胡晨;苗磊;刘泽新 -专利权人：超清编解码有限公司
申请日： 2013-07-04 - 公布日： 2021-02-09 - 主分类号： G10L19/038
摘要：本发明实施例提出了频域包络的矢量量化方法和装置。其中，所述方法包括：将一帧中的N个频域包络划分为N1个矢量，其中N1个矢量中的每一个矢量包括M个频域包络；采用第一码本对N1个矢量中的第一矢量进行量化，以获得第一矢量量化的码字，其中第一码本被划分为2B1个部分；根据第一矢量量化的码字，确定量化后的第一矢量与第一码本的2B1个部分中的第i个部分相关联；根据第i个部分的码本确定第二码本；基于第二码本，对N1个矢量中第二矢量进行量化。本发明实施例通过将频域包络划分为多个具有更少维数的矢量，能够使用较少比特数的码本对频域包络矢量进行矢量量化，不但能够降低矢量量化的复杂度，并且能够保证矢量量化的效果。

矢量量化-201710072586.6
发明人： A·瓦西拉凯;A·S·拉莫;L·J·拉克索宁 -专利权人：诺基亚技术有限公司
申请日： 2012-07-12 - 公布日： 2021-01-22 - 主分类号： G10L19/038
摘要：尤其是公开了确定输入矢量的第一量化表示，以及基于取决于所述第一量化表示的码书来确定所述输入矢量的第二量化表示。

语音压缩方法、语音解压方法及音频编码器、音频解码器-201610260757.3
发明人：杨洋;姚嘉;任金平;高永泽 -专利权人：杭州微纳科技股份有限公司
申请日： 2016-04-22 - 公布日： 2020-11-10 - 主分类号： G10L19/038
摘要：本发明公开了一种语音压缩方法、语音解压方法及音频编码器、音频解码器，通过MLT变换时域信号转换成频域信号，采用RMS权重分析法细化频域信号量化分级，矢量量化和哈弗曼编码等方法分别对量化参数（量化权重、比特分配数）和频域数据进行压缩，以期在保证近似无损的频谱特性最大限度提高压缩比。

矢量量化器-201710451005.X
发明人：沃洛佳·格兰恰诺夫;托马斯·詹森·托夫特戈德 -专利权人：瑞典爱立信有限公司
申请日： 2012-12-12 - 公布日： 2020-08-04 - 主分类号： G10L19/038
摘要：公开了例如变换音频编解码中用于高效矢量量化的矢量量化器和其中的方法。所述方法包括：将输入目标矢量s与多个质心进行比较，每个质心表示码本中码矢量的相应类别。此外，基于比较结果确定码本中与输入目标矢量相关的搜索的起点。根据反映每个码矢量与类别的质心之间的距离的失真测量对码本中的码矢量排序。所述矢量量化器和方法使得能够首先搜索包括关于输入矢量s的最可能候选码矢量的码矢量类别。

椎体矢量量化器形状搜索-201580001475.5
发明人：乔纳斯·斯韦德贝里 -专利权人：瑞典爱立信有限公司
申请日： 2015-06-25 - 公布日： 2019-03-19 - 主分类号： G10L19/038
摘要：一种用于椎体矢量量化器PVQ形状搜索的编码器及其方法，所述PVQ采用目标矢量x作为输入，并通过在内部维度搜索循环中迭代地添加单位脉冲来获得矢量y。所述方法包括：在进入用于单位脉冲添加的下一个内部维度搜索循环之前：基于当前矢量y的最大脉冲幅度maxamp_y，确定是否需要多于当前比特字长来在即将到来的内部维度循环中以无损方式表示变量enloop_y。变量enloop_y与y的累加能量相关。该方法的执行使编码器能够将搜索的复杂度保持在合理水平。例如，其通过分析即将到来的内循环中的“最坏情况场景”是否需要比当前使用的精度更高精度的内循环，而使编码器能够仅在需要的时候应用精度增加的循环。

多模式多级码本联合优化方法-201510121820.0
发明人：徐敬德;崔慧娟;唐昆 -专利权人：清华大学;信瑞递（北京）科技有限公司
申请日： 2015-03-19 - 公布日： 2019-01-04 - 主分类号： G10L19/038
摘要：本发明公开了一种多模式多级码本联合优化方法，属于低速率语音编码矢量量化技术领域，解决了现有的多模式多级码本训练中，误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括：输出待量化矢量；对所述待量化矢量进行训练，获得各模式各级初始化码本；对所述各模式各级初始化码本进行码本索引的重排，获得新的码本；对所述待量化矢量，利用新的码本，寻找使得系统失真最小的最优胞腔和量化索引；利用输入残差矢量和对应的量化索引，更新各级各模式最优码字，并迭代至预设次数；获取最后一次迭代得出的码本。

语音编码装置、语音解码装置、语音编码方法以及语音解码方法-201410119876.8
发明人：押切正浩;森井利幸;山梨智史 -专利权人：松下电器（美国）知识产权公司
申请日： 2008-02-29 - 公布日： 2018-06-22 - 主分类号： G10L19/038
摘要：公开了编码装置、解码装置、编码方法以及解码方法。所述编码装置包括：第一层编码单元；第一层解码单元；加权滤波单元；第一层误差变换系数计算单元；以及第二层编码单元，所述第二层编码单元包括：第一形状向量编码单元；目标增益计算单元；增益向量构成单元；以及增益向量编码单元。

信号编码和解码方法以及设备-201310271015.7
发明人：刘泽新;苗磊;胡晨 -专利权人：华为技术有限公司
申请日： 2013-07-01 - 公布日： 2018-02-23 - 主分类号： G10L19/038
摘要：本发明实施例提供了信号编码和解码方法以及设备。该方法包括根据可用比特数和第一饱和阈值i，确定将要编码的子带数目k，其中i为正数，k为正整数；根据各个子带量化的包络从各个子带中选择k个子带，或者根据心理声学模型从各个子带中选择k个子带；对k个子带的频谱系数进行一次编码操作。本发明实施例中，通过根据可用比特数和第一饱和阈值确定将要编码的子带数目k，并从各个子带中选择k个子带来进行编码，而非对整个频带进行编码，能够减少解码信号的频谱空洞，从而能够提升输出信号的听觉质量。

处理音频信号的方法和设备-201410539250.2
发明人：李昌宪;丁奎赫;金洛榕;田惠晶;李炳锡;姜仁圭 -专利权人： LG电子株式会社
申请日： 2011-08-23 - 公布日： 2017-11-28 - 主分类号： G10L19/038
摘要：本发明提供一种处理音频信号的方法和设备，所述方法包括步骤接收对应于多个谱系数的输入音频信号；基于所述输入信号的能量来获得位置信息，所述位置信息指示所述谱系数中的特定谱系数的位置；利用所述位置信息以及所述谱系数产生形状矢量；通过搜索对应于所述形状矢量的码本来确定码本索引；以及传输所述码本索引和所述位置信息，其中通过利用从所述谱系数选择的部分来产生所述形状矢量，以及基于所述位置信息来选择所述选择的部分。

一种基于MELP的低比特数字语音矢量量化方法和系统-201511005800.3
发明人：王国文;罗世新;何丽;张盼 -专利权人：航天信息股份有限公司
申请日： 2015-12-29 - 公布日： 2017-07-07 - 主分类号： G10L19/038
摘要：本发明实施例提供了一种基于MELP的低比特数字语音矢量量化方法和系统。本发明采用混合激励线性预测MELP算法对调整后的基音信号进行线性预测系数矢量量化，包括对LSF参数采用两级分裂矢量量化，先获取第一级矢量量化的LSF参数，基于所述第一级矢量量化的LSF参数获取第二级矢量量化的LSF参数；采用第二级矢量量化后的LSF参数进行数字语音矢量量化。本发明在MELP算法的基础上，采用LSF两级级矢量量化方案，降低码率，减少了码本的存储量与计算复杂度。

用于信号的低复杂度组合代码化和解码的装置和方法-201280021516.3
发明人：乌达·米塔尔;詹姆斯·P·阿什利 -专利权人：谷歌技术控股有限责任公司
申请日： 2012-04-20 - 公布日： 2016-10-19 - 主分类号： G10L19/038
摘要：在本文中公开了一种用于信号的低复杂度组合代码化和解码的方法和装置。在操作期间，当所述函数的尺寸是小的时，编码器(100)和解码器(300)将在确定码字或向量中利用第一函数。当所述函数的尺寸是大的时，所述编码器和所述解码器还将在确定所述码字或向量中利用第二函数。

一种3D音频空间参数全方位非均匀量化编码系统及方法-201410855935.8
发明人：胡瑞敏;高丽;杨玉红;王晓晨;涂卫平;武庭照;柯善发;张茂胜;李登实;王松;姜林;杨乘 -专利权人：武汉大学
申请日： 2014-12-31 - 公布日： 2015-03-25 - 主分类号： G10L19/038
摘要：本发明提供一种3D音频空间参数全方位非均匀量化编码系统及方法，包括基于双声道输入信号进行预处理、声道信号下混、下混信号量化编码；按子带提取空间参数，所述空间参数为声道间强度差异参数ICLD；根据全方位角度JND得到全方位角度量化表；根据输入的扬声器的空间位置信息，建立在两扬声器所夹区域之间所形成虚拟声像的方位角与空间参数的映射表，从全方位角度量化表映射得到空间参数量化表；进行空间参数全方位的非均匀量化压缩编码，对输入的扬声器空间位置信息进行熵编码。本发明基于人耳对全方位的角度感知差异特性自适应地根据扬声器方位信息生成全方位空间参数非均匀量化表，相比现有方法，本发明明显提高了编码效率和质量。

一种基于M码字分裂的矢量量化码本生成方法-201410036779.2
发明人：贺前华;何伟俊;李嘉安娜 -专利权人：华南理工大学
申请日： 2014-01-24 - 公布日： 2014-05-14 - 主分类号： G10L19/038
摘要：本发明公开了一种基于M码字分裂的矢量量化码本生成方法，该方法是在每次迭代前的码本初始化阶段，根据目标码本大小，自适应地选取分裂码字数为2、4或5，在一个码字分裂为4个或5个码字时，其中两对码字的增量部分具有正交特性，在一个码字分裂为5个码字时，原码字将保留在新码字中；在最后一次码字分裂前，若需要生成的新码字数量不足，则选取码本中的若干个码字使用二分法进行码字补偿，使最后一次分裂得到的总码字数达到目标码本大小。本发明在不改变码本量化性能的同时缩短了码本生成时间，适用于图像压缩、模式识别、视频编码等领域，特别适用于语音编码领域。

量化装置及量化方法-201180042309.1
发明人：森井利幸 -专利权人：松下电器产业株式会社
申请日： 2011-09-16 - 公布日： 2013-05-01 - 主分类号： G10L19/038
摘要：提供以较少的计算量减小编码失真，并获得充分的编码性能的量化装置及量化方法。多级矢量量化单元(102)在第1级矢量量化单元(201-1)中设为预先指定的候选数N，在第2级以后的矢量量化单元(201-2～201-J)中，每前进一级，将候选数逐次减1，当候选数减到3以下时，每次都评估量化失真，若量化失真大于规定的阈值，则将下一级的候选数设为预定的数值P，若量化失真为规定的阈值以下，则将下一级的候选数设为比预定的P小的数值Q。

用于噪声注入的系统、方法、设备和计算机可读媒体-201180039077.4
发明人：维韦克·拉金德朗;伊桑·罗伯特·杜尼;文卡特什·克里希南 -专利权人：高通股份有限公司
申请日： 2011-08-17 - 公布日： 2013-04-24 - 主分类号： G10L19/038
摘要：根据原始频谱的能量在频谱的未译码元素的位置之间的分布的测量值来控制在所述未译码元素处注入噪声的方案。

用于动态位分配的系统、方法、设备和计算机可读媒体-201180037521.9
发明人：伊桑·R·杜尼;文卡特什·克里希南;维韦克·拉金德朗 -专利权人：高通股份有限公司
申请日： 2011-07-29 - 公布日： 2013-04-17 - 主分类号： G10L19/038
摘要：动态位分配操作基于对应的多个增益因子而确定用于多个向量中的每一者的位分配，且将每一分配与基于所述向量的维度的阈值进行比较。

用于多级形状向量量化的系统、方法、设备和计算机可读媒体-201180037495.X
发明人：伊桑·R·杜尼;文卡特什·克里希南;维韦克·拉金德朗 -专利权人：高通股份有限公司
申请日： 2011-07-29 - 公布日： 2013-04-10 - 主分类号： G10L19/038
摘要：一种多级形状向量量化器架构使用来自选定的第一级码簿向量的信息来产生旋转矩阵。使用所述旋转矩阵来旋转输入向量的方向以支持第一级量化误差的形状量化。

用于音频信号的相依模式译码的系统、方法、设备和计算机可读媒体-201180037191.3
发明人：文卡特什·克里希南;维韦克·拉金德朗;伊桑·R·杜尼 -专利权人：高通股份有限公司
申请日： 2011-07-29 - 公布日： 2013-04-10 - 主分类号： G10L19/038
摘要：一种用于对表示信号的音频-频率范围的一组变换系数进行译码的方案使用来自描述所述信号的先前帧的参考帧的信息来确定所述信号的目标帧中的显著能量区的频域位置。

用于对语音信号LPC系数进行多级矢量量化的方法和系统-201210246780.9
发明人：张勇;闫建新 -专利权人：深圳广晟信源技术有限公司
申请日： 2012-07-17 - 公布日： 2013-03-20 - 主分类号： G10L19/038
摘要：本发明提供了用于对语音信号LPC系数进行多级矢量量化的方法和系统，以及解码语音信号LPC系数的方法和系统。其中该对语音信号LPC系数进行多级矢量量化的方法包括：通过等效变换，将LPC系数转换为一等价表达，并对该等价表达进行第一级矢量量化，得到相应的第一级量化索引和第一级量化残差；基于GMM模型，对第一级量化残差进行模型聚类分割，得到相应的GMM聚类索引；基于GMM聚类索引，对第一级量化残差进行第二级矢量量化，得到相应的第二级矢量索引；以及将经历进一步编码处理的第一级量化索引、GMM聚类索引、及第二级矢量索引传到解码端。实施本发明的方法和系统，可实现较高的量化性能和较低的运算复杂度。

处理音频信号的方法和装置-201180026076.6
发明人：丁奎赫;田惠晶;李炳锡;李昌宪 -专利权人： LG电子株式会社
申请日： 2011-04-08 - 公布日： 2013-01-30 - 主分类号： G10L19/038
摘要：本发明涉及一种用于处理音频信号的方法，包括以下的步骤：基于多个线性预测变换系数对音频信号的当前帧执行线性预测分析以产生第一目标矢量，第一目标矢量是第一阶的目标矢量；对第一目标矢量执行矢量量化以获取第一阶的预先确定的数目的第一临时候选码矢量；计算第一临时候选误差，第一临时候选误差是在第一临时候选码矢量和第一目标矢量之间的误差；和基于第一临时候选误差确定第一数，第一数是第一候选码矢量的数目，以及获取以与第一数具有相同数量的第一最终候选码矢量。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于编码音频信号的方法及装置有效

专利文献下载