[发明专利]用于编码音频信号的方法及装置有效

专利信息
申请号: 201880037632.1 申请日: 2018-05-24
公开(公告)号: CN110709928B 公开(公告)日: 2023-05-16
发明(设计)人: A·瓦西拉凯;A·拉莫 申请(专利权)人: 诺基亚技术有限公司
主分类号: G10L19/038 分类号: G10L19/038;H03M7/30
代理公司: 北京市中咨律师事务所 11247 代理人: 杨晓光
地址: 芬兰*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 尤其公开了一种装置,其包括:包括多个子向量的表,其中,所述表的每个条目是子向量,并且每个子向量具有与一个或多个基本码向量的向量分量相同的向量分量;以及另一个表,其中,所述另一个表的条目包括指向所述表中的子向量的第一指针和指向所述表中的子向量的第二指针,其中,第一指针和第二指针被布置在所述另一个表中,以使得当第一指针所指向的子向量的向量分量与第二指针所指向的子向量的向量分量组合时,构成基本码向量。
搜索关键词: 用于 编码 音频 信号 方法 装置
【主权项】:
1.一种装置,包括:/n包括多个子向量的表,其中,所述表的每个条目是子向量,并且每个子向量具有与一个或多个基本码向量的向量分量相同的向量分量;以及/n另一个表,其中,所述另一个表的条目包括指向所述表中的子向量的第一指针和指向所述表中的子向量的第二指针,其中,所述第一指针和所述第二指针被布置在所述另一个表中,以使得当所述第一指针所指向的子向量的向量分量与所述第二指针所指向的子向量的向量分量组合时,构成基本码向量。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚技术有限公司,未经诺基亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201880037632.1/,转载请声明来源钻瓜专利网。

同类专利
  • 说话人验证模型的量化方法、电子设备和存储介质-202310675288.1
  • 俞凯;刘贝;王浩宇;钱彦旻 - 思必驰科技股份有限公司
  • 2023-06-08 - 2023-09-05 - G10L19/038
  • 本发明公开说话人验证模型的量化方法、电子设备和存储介质,其中,一种说话人验证模型的量化方法,包括:获取说话人验证模型所有层的实值权重;将所述所有层的实值权重映射到固定整数集;或动态确定每一层的实值权重对应的二值权重,以更好地匹配实值权重分布。本申请实施例的方法提出了两种全新的量化策略,即静态量化和自适应量化。进一步的,对于静态量化,本申请实施例提出了权重正则化技术,以保持最大的信息熵,减少信息的损失。进一步地,本申请实施例还提出了一种自适应量化方案,可以动态确定每一层的最佳二值,以实现与实值权重分布更好的对齐。
  • 用于处理包络表示系数的方法、编码器和解码器-202211569599.1
  • 乔纳斯·斯韦德贝里;马丁·绍尔斯戴德;斯蒂芬·布鲁恩 - 瑞典爱立信有限公司
  • 2017-12-15 - 2023-06-27 - G10L19/038
  • 提出了用于处理包络表示系数的方法、编码器和解码器。该方法包括量化输入包络表示系数;通过从所述输入包络表示系数中减去量化的包络表示系数来确定残差系数;变换所述残差系数,以获得变换的残差系数;对所述变换的残差系数应用多个增益形状编码方案中的至少一个,以获得增益形状编码的残差系数,其中所述多个增益形状编码方案对于所述变换的残差系数中的一个或多个在增益分辨率和形状分辨率中的一个或多个方面具有互不相同的折中;以及提供对下述项的表示以便发送给音频解码器:所述量化的包络表示系数、所述增益形状编码的残差系数、以及关于所应用的所述至少一个增益形状编码方案的信息。
  • 椎体矢量量化器形状搜索-201910135157.8
  • 乔纳斯·斯韦德贝里 - 瑞典爱立信有限公司
  • 2015-06-25 - 2023-06-20 - G10L19/038
  • 一种用于椎体矢量量化器PVQ形状搜索的编码器及其方法,所述PVQ采用目标矢量x作为输入,并通过在内部维度搜索循环中迭代地添加单位脉冲来获得矢量y。所述方法包括:在进入用于单位脉冲添加的下一个内部维度搜索循环之前:基于当前矢量y的最大脉冲幅度maxampy,确定是否需要多于当前比特字长来在即将到来的内部维度循环中以无损方式表示变量enloopy。变量enloopy与y的累加能量相关。该方法的执行使编码器能够将搜索的复杂度保持在合理水平。例如,其通过分析即将到来的内循环中的“最坏情况场景”是否需要比当前使用的精度更高精度的内循环,而使编码器能够仅在需要的时候应用精度增加的循环。
  • 用于编码音频信号的方法及装置-201880037632.1
  • A·瓦西拉凯;A·拉莫 - 诺基亚技术有限公司
  • 2018-05-24 - 2023-05-16 - G10L19/038
  • 尤其公开了一种装置,其包括:包括多个子向量的表,其中,所述表的每个条目是子向量,并且每个子向量具有与一个或多个基本码向量的向量分量相同的向量分量;以及另一个表,其中,所述另一个表的条目包括指向所述表中的子向量的第一指针和指向所述表中的子向量的第二指针,其中,第一指针和第二指针被布置在所述另一个表中,以使得当第一指针所指向的子向量的向量分量与第二指针所指向的子向量的向量分量组合时,构成基本码向量。
  • 音频数据编解码方法和相关装置及计算机可读存储介质-202110596023.3
  • 夏丙寅;李佳蔚;王喆 - 华为技术有限公司
  • 2021-05-29 - 2022-11-29 - G10L19/038
  • 本申请实施例提供音频数据编解码方法和相关装置及计算机可读存储介质。一种音频数据编码方法,可包括:获取待编码的音频数据;利用编码神经网络对待编码的音频数据进行处理以生成第一潜在变量;对所述第一潜在变量进行量化处理以得到第二潜在变量;根据所述第一潜在变量和所述第二潜在变量得到潜在变量补偿参数;将所述潜在变量补偿参数进行编码,并将所述潜在变量补偿参数的编码结果写入码流;将第二潜在变量进行编码,将所述第二潜在变量的编码结果写入码流。本申请实施例方案有利于降低解码神经网络的相关输入失真,从而提升最终解码信号的质量。
  • 一种北斗短报文语音传输方法和装置-202210320220.7
  • 马民;王宇翔;刘中昌;张帅毅;肖继群 - 航天宏图信息技术股份有限公司
  • 2022-03-29 - 2022-06-24 - G10L19/038
  • 本发明提供了一种北斗短报文语音传输方法和装置,涉及数据传输的技术领域,包括:获取待传输语音信号,并对待传输语音信号依次进行采样、量化和分帧,得到目标语音信号;对目标语音信号进行LPC滤波,并确定出滤波后的目标语音信号的属性数据和各个语音帧的类型;基于语音帧的相关性和滤波后的目标语音信号,构建超级帧,并基于各个语音帧的类型,对超级帧进行编码,得到超级帧编码;对超级帧编码和超级帧编码包含的语音帧的属性数据进行向量量化,得到语音压缩编码,并对语音压缩编码进行压缩,得到压缩信号;以北斗短报文传输方式,将压缩信号发送给接收设备,解决了现有的北斗短报文语音传输的效率较低的技术问题。
  • 一种用于音频信号的矢量量化编解码方法及装置-201310728959.2
  • 潘兴德;吴超刚;李靓 - 北京天籁传音数字技术有限公司
  • 2013-12-25 - 2021-04-02 - G10L19/038
  • 本发明涉及一种用于音频信号的矢量量化编解码方法及装置,所述编码方法包括:对音频信号的变换域谱进行音频感知分析,根据分析结果对音频信号的变换域谱进行幅度调整,得到待量化的加权谱;对所述待量化的加权谱进行组织,得到多个待量化的矢量;以及对所述多个待量化的矢量进行量化编码,得到矢量量化编码数据。本发明提出了一种用于音频信号的矢量量化编解码方案,该方案参考音频感知特性对变换域信号进行幅度调整,可消除感知冗余,提高编码效率;通过信号特性分析,对音频的时频平面进行合理的划分,并将其组织成待量化矢量;可选择使得编码增益最大的时频平面划分和矢量组织方式,有利于对信号进行高效的量化编码。
  • 信号编码和解码方法以及设备-201711387694.9
  • 刘泽新;苗磊;胡晨 - 华为技术有限公司
  • 2013-07-01 - 2021-02-26 - G10L19/038
  • 本发明实施例提供了信号编码和解码方法以及设备。该方法包括:根据可用比特数和第一饱和阈值i,确定将要编码的子带数目k,其中i为正数,k为正整数;根据各个子带量化的包络从各个子带中选择k个子带,或者根据心理声学模型从各个子带中选择k个子带;对k个子带的频谱系数进行一次编码操作。本发明实施例中,通过根据可用比特数和第一饱和阈值确定将要编码的子带数目k,并从各个子带中选择k个子带来进行编码,而非对整个频带进行编码,能够减少解码信号的频谱空洞,从而能够提升输出信号的听觉质量。
  • 频域包络的矢量量化方法和装置-201710370044.7
  • 胡晨;苗磊;刘泽新 - 超清编解码有限公司
  • 2013-07-04 - 2021-02-09 - G10L19/038
  • 本发明实施例提出了频域包络的矢量量化方法和装置。其中,所述方法包括:将一帧中的N个频域包络划分为N1个矢量,其中N1个矢量中的每一个矢量包括M个频域包络;采用第一码本对N1个矢量中的第一矢量进行量化,以获得第一矢量量化的码字,其中第一码本被划分为2B1个部分;根据第一矢量量化的码字,确定量化后的第一矢量与第一码本的2B1个部分中的第i个部分相关联;根据第i个部分的码本确定第二码本;基于第二码本,对N1个矢量中第二矢量进行量化。本发明实施例通过将频域包络划分为多个具有更少维数的矢量,能够使用较少比特数的码本对频域包络矢量进行矢量量化,不但能够降低矢量量化的复杂度,并且能够保证矢量量化的效果。
  • 矢量量化器-201710451005.X
  • 沃洛佳·格兰恰诺夫;托马斯·詹森·托夫特戈德 - 瑞典爱立信有限公司
  • 2012-12-12 - 2020-08-04 - G10L19/038
  • 公开了例如变换音频编解码中用于高效矢量量化的矢量量化器和其中的方法。所述方法包括:将输入目标矢量s与多个质心进行比较,每个质心表示码本中码矢量的相应类别。此外,基于比较结果确定码本中与输入目标矢量相关的搜索的起点。根据反映每个码矢量与类别的质心之间的距离的失真测量对码本中的码矢量排序。所述矢量量化器和方法使得能够首先搜索包括关于输入矢量s的最可能候选码矢量的码矢量类别。
  • 椎体矢量量化器形状搜索-201580001475.5
  • 乔纳斯·斯韦德贝里 - 瑞典爱立信有限公司
  • 2015-06-25 - 2019-03-19 - G10L19/038
  • 一种用于椎体矢量量化器PVQ形状搜索的编码器及其方法,所述PVQ采用目标矢量x作为输入,并通过在内部维度搜索循环中迭代地添加单位脉冲来获得矢量y。所述方法包括:在进入用于单位脉冲添加的下一个内部维度搜索循环之前:基于当前矢量y的最大脉冲幅度maxampy,确定是否需要多于当前比特字长来在即将到来的内部维度循环中以无损方式表示变量enloopy。变量enloopy与y的累加能量相关。该方法的执行使编码器能够将搜索的复杂度保持在合理水平。例如,其通过分析即将到来的内循环中的“最坏情况场景”是否需要比当前使用的精度更高精度的内循环,而使编码器能够仅在需要的时候应用精度增加的循环。
  • 多模式多级码本联合优化方法-201510121820.0
  • 徐敬德;崔慧娟;唐昆 - 清华大学;信瑞递(北京)科技有限公司
  • 2015-03-19 - 2019-01-04 - G10L19/038
  • 本发明公开了一种多模式多级码本联合优化方法,属于低速率语音编码矢量量化技术领域,解决了现有的多模式多级码本训练中,误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括:输出待量化矢量;对所述待量化矢量进行训练,获得各模式各级初始化码本;对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;利用输入残差矢量和对应的量化索引,更新各级各模式最优码字,并迭代至预设次数;获取最后一次迭代得出的码本。
  • 信号编码和解码方法以及设备-201310271015.7
  • 刘泽新;苗磊;胡晨 - 华为技术有限公司
  • 2013-07-01 - 2018-02-23 - G10L19/038
  • 本发明实施例提供了信号编码和解码方法以及设备。该方法包括根据可用比特数和第一饱和阈值i,确定将要编码的子带数目k,其中i为正数,k为正整数;根据各个子带量化的包络从各个子带中选择k个子带,或者根据心理声学模型从各个子带中选择k个子带;对k个子带的频谱系数进行一次编码操作。本发明实施例中,通过根据可用比特数和第一饱和阈值确定将要编码的子带数目k,并从各个子带中选择k个子带来进行编码,而非对整个频带进行编码,能够减少解码信号的频谱空洞,从而能够提升输出信号的听觉质量。
  • 处理音频信号的方法和设备-201410539250.2
  • 李昌宪;丁奎赫;金洛榕;田惠晶;李炳锡;姜仁圭 - LG电子株式会社
  • 2011-08-23 - 2017-11-28 - G10L19/038
  • 本发明提供一种处理音频信号的方法和设备,所述方法包括步骤接收对应于多个谱系数的输入音频信号;基于所述输入信号的能量来获得位置信息,所述位置信息指示所述谱系数中的特定谱系数的位置;利用所述位置信息以及所述谱系数产生形状矢量;通过搜索对应于所述形状矢量的码本来确定码本索引;以及传输所述码本索引和所述位置信息,其中通过利用从所述谱系数选择的部分来产生所述形状矢量,以及基于所述位置信息来选择所述选择的部分。
  • 一种基于MELP的低比特数字语音矢量量化方法和系统-201511005800.3
  • 王国文;罗世新;何丽;张盼 - 航天信息股份有限公司
  • 2015-12-29 - 2017-07-07 - G10L19/038
  • 本发明实施例提供了一种基于MELP的低比特数字语音矢量量化方法和系统。本发明采用混合激励线性预测MELP算法对调整后的基音信号进行线性预测系数矢量量化,包括对LSF参数采用两级分裂矢量量化,先获取第一级矢量量化的LSF参数,基于所述第一级矢量量化的LSF参数获取第二级矢量量化的LSF参数;采用第二级矢量量化后的LSF参数进行数字语音矢量量化。本发明在MELP算法的基础上,采用LSF两级级矢量量化方案,降低码率,减少了码本的存储量与计算复杂度。
  • 一种3D音频空间参数全方位非均匀量化编码系统及方法-201410855935.8
  • 胡瑞敏;高丽;杨玉红;王晓晨;涂卫平;武庭照;柯善发;张茂胜;李登实;王松;姜林;杨乘 - 武汉大学
  • 2014-12-31 - 2015-03-25 - G10L19/038
  • 本发明提供一种3D音频空间参数全方位非均匀量化编码系统及方法,包括基于双声道输入信号进行预处理、声道信号下混、下混信号量化编码;按子带提取空间参数,所述空间参数为声道间强度差异参数ICLD;根据全方位角度JND得到全方位角度量化表;根据输入的扬声器的空间位置信息,建立在两扬声器所夹区域之间所形成虚拟声像的方位角与空间参数的映射表,从全方位角度量化表映射得到空间参数量化表;进行空间参数全方位的非均匀量化压缩编码,对输入的扬声器空间位置信息进行熵编码。本发明基于人耳对全方位的角度感知差异特性自适应地根据扬声器方位信息生成全方位空间参数非均匀量化表,相比现有方法,本发明明显提高了编码效率和质量。
  • 一种基于M码字分裂的矢量量化码本生成方法-201410036779.2
  • 贺前华;何伟俊;李嘉安娜 - 华南理工大学
  • 2014-01-24 - 2014-05-14 - G10L19/038
  • 本发明公开了一种基于M码字分裂的矢量量化码本生成方法,该方法是在每次迭代前的码本初始化阶段,根据目标码本大小,自适应地选取分裂码字数为2、4或5,在一个码字分裂为4个或5个码字时,其中两对码字的增量部分具有正交特性,在一个码字分裂为5个码字时,原码字将保留在新码字中;在最后一次码字分裂前,若需要生成的新码字数量不足,则选取码本中的若干个码字使用二分法进行码字补偿,使最后一次分裂得到的总码字数达到目标码本大小。本发明在不改变码本量化性能的同时缩短了码本生成时间,适用于图像压缩、模式识别、视频编码等领域,特别适用于语音编码领域。
  • 量化装置及量化方法-201180042309.1
  • 森井利幸 - 松下电器产业株式会社
  • 2011-09-16 - 2013-05-01 - G10L19/038
  • 提供以较少的计算量减小编码失真,并获得充分的编码性能的量化装置及量化方法。多级矢量量化单元(102)在第1级矢量量化单元(201-1)中设为预先指定的候选数N,在第2级以后的矢量量化单元(201-2~201-J)中,每前进一级,将候选数逐次减1,当候选数减到3以下时,每次都评估量化失真,若量化失真大于规定的阈值,则将下一级的候选数设为预定的数值P,若量化失真为规定的阈值以下,则将下一级的候选数设为比预定的P小的数值Q。
  • 用于对语音信号LPC系数进行多级矢量量化的方法和系统-201210246780.9
  • 张勇;闫建新 - 深圳广晟信源技术有限公司
  • 2012-07-17 - 2013-03-20 - G10L19/038
  • 本发明提供了用于对语音信号LPC系数进行多级矢量量化的方法和系统,以及解码语音信号LPC系数的方法和系统。其中该对语音信号LPC系数进行多级矢量量化的方法包括:通过等效变换,将LPC系数转换为一等价表达,并对该等价表达进行第一级矢量量化,得到相应的第一级量化索引和第一级量化残差;基于GMM模型,对第一级量化残差进行模型聚类分割,得到相应的GMM聚类索引;基于GMM聚类索引,对第一级量化残差进行第二级矢量量化,得到相应的第二级矢量索引;以及将经历进一步编码处理的第一级量化索引、GMM聚类索引、及第二级矢量索引传到解码端。实施本发明的方法和系统,可实现较高的量化性能和较低的运算复杂度。
  • 处理音频信号的方法和装置-201180026076.6
  • 丁奎赫;田惠晶;李炳锡;李昌宪 - LG电子株式会社
  • 2011-04-08 - 2013-01-30 - G10L19/038
  • 本发明涉及一种用于处理音频信号的方法,包括以下的步骤:基于多个线性预测变换系数对音频信号的当前帧执行线性预测分析以产生第一目标矢量,第一目标矢量是第一阶的目标矢量;对第一目标矢量执行矢量量化以获取第一阶的预先确定的数目的第一临时候选码矢量;计算第一临时候选误差,第一临时候选误差是在第一临时候选码矢量和第一目标矢量之间的误差;和基于第一临时候选误差确定第一数,第一数是第一候选码矢量的数目,以及获取以与第一数具有相同数量的第一最终候选码矢量。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top