[发明专利]对线性预测系数量化的方法和装置及解量化的方法和装置在审

专利信息
申请号: 202110189314.0 申请日: 2015-05-07
公开(公告)号: CN112927702A 公开(公告)日: 2021-06-08
发明(设计)人: 成昊相;姜尚远;金钟铉;吴殷美 申请(专利权)人: 三星电子株式会社;汉阳大学校艾丽卡产学协力团
主分类号: G10L19/022 分类号: G10L19/022;G10L19/038;G10L19/04;G10L19/06
代理公司: 北京英赛嘉华知识产权代理有限责任公司 11204 代理人: 王达佐;杨莘
地址: 韩国京畿道水*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 线性 预测 系数 量化 方法 装置
【权利要求书】:

1.一种量化设备,包括:

帧间预测器,配置成从前一帧的量化的输入矢量生成当前帧的第一预测矢量;

帧内预测器,配置成基于所述当前帧的量化的第一误差矢量的前一级子矢量和当前级的预测矩阵估计所述当前帧的第二预测矢量的当前级子矢量来生成所述当前帧的所述第二预测矢量,其中,所述当前帧的所述量化的第一误差矢量基于所述当前帧的所述第二预测矢量和所述当前帧的量化的第二误差矢量来获得;以及

格栅结构化矢量量化器,配置成对所述当前帧的与所述当前帧的第一误差矢量和所述当前帧的所述第二预测矢量之间的差值对应的第二误差矢量进行量化,以生成所述当前帧的所述量化的第二误差矢量,其中,所述当前帧的所述第一误差矢量与所述当前帧的所述第一预测矢量和所述当前帧的输入矢量之间的差值对应。

2.根据权利要求1所述的设备,其中,所述帧内预测器配置成通过使用N×N预测矩阵和所述量化的第一误差矢量的N维子矢量来估计所述第二预测矢量的N维子矢量,N是大于或等于2的自然数。

3.根据权利要求1所述的设备,其中,所述格栅结构化矢量量化器配置成将所述第二误差矢量划分成N维子矢量,并将所述N维子矢量分配给多个级。

4.根据权利要求1所述的设备,其中,所述预测矩阵通过所述码本训练来预先定义。

5.根据权利要求1所述的设备,其中,还包括矢量量化器,所述矢量量化器配置成与所述第一误差矢量和所述量化的第一误差矢量之间的差值对应的第三误差矢量进行量化。

6.根据权利要求1所述的设备,其中,所述格栅结构化矢量量化器配置成基于加权函数来搜索最佳指标。

7.根据权利要求5所述的设备,其中,所述矢量量化器配置成基于加权函数来搜索最佳指标。

8.一种量化设备,包括:

第一量化模块,用于在没有帧间预测的情况下执行量化;以及

第二量化模块,用于利用帧间预测来执行量化;

其中,所述第一量化模块包括:

第一帧内预测器,配置成通过基于当前级的第一预测矩阵和量化的输入矢量的前一级子矢量估计预测矢量的当前级子矢量来生成所述预测矢量,其中,所述量化的输入矢量基于所述预测矢量和量化的预测误差矢量来获得;以及

第一格栅结构化矢量量化器,配置成对与所述预测矢量和输入矢量之间的差值对应的预测误差矢量进行量化,以生成所述量化的预测误差矢量。

9.根据权利要求8所述的设备,其中,所述第二量化模块包括:

帧间预测器,配置成从前一帧的量化的输入矢量生成当前帧的第一预测矢量;

第二帧内预测器,配置成通过基于所述当前帧的量化的第一误差矢量的前一级子矢量和当前级的第二预测矩阵估计所述当前帧的第二预测矢量的当前级子矢量来生成所述当前帧的所述第二预测矢量,其中,所述当前帧的所述量化的第一误差矢量基于所述当前帧的所述第二预测矢量和所述当前帧的量化的第二误差矢量来获得;以及

第二格栅结构化矢量量化器,配置成对所述当前帧的与所述当前帧的第一误差矢量和所述当前帧的所述第二预测矢量之间的差值对应的第二误差矢量进行量化,以生成所述当前帧的所述量化的第二误差矢量,其中,所述当前帧的所述第一误差矢量与所述当前帧的所述第一预测矢量和所述当前帧的输入矢量之间的差值对应。

10.根据权利要求8所述的设备,还包括选择器,所述选择器配置成以开环方式选择所述第一量化模块和所述第二量化模块中的一个。

11.根据权利要求9所述的设备,其中:

所述第一量化模块还包括第一矢量量化器,所述第一矢量量化器配置成对与所述输入矢量和所述量化的输入矢量之间的差值对应的量化误差矢量进行量化;以及

所述第二量化模块还包括第二矢量量化器,所述第二矢量量化器配置成对与所述第一误差矢量和所述量化的第一误差矢量之间的差值对应的第三误差矢量进行量化。

12.根据权利要求11所述的设备,其中,所述第一矢量量化器和所述第二矢量量化器配置成共享码本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;汉阳大学校艾丽卡产学协力团,未经三星电子株式会社;汉阳大学校艾丽卡产学协力团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110189314.0/1.html,转载请声明来源钻瓜专利网。

同类专利
  • 对音频信号进行编码的方法以及音频编码器-201880042163.2
  • M·M·古德文;A·考克;A·周 - DTS公司
  • 2018-04-28 - 2023-09-22 - G10L19/022
  • 提供了一种对音频信号进行编码的方法,该方法包括:将多个不同的时频变换应用于音频信号帧;针对多个时频分辨率在多个频带上计算编码效率的量度;至少部分地基于所计算的编码效率的量度,选择时频分辨率的组合以表示在多个频带中的每个频带处的帧;确定窗口大小和对应的变换大小;确定修正变换;使用确定的窗口大小对帧进行加窗;使用确定的变换大小来变换被加窗帧;使用确定的修正变换来修正被加窗帧的变换的频带内的时频分辨率。
  • 音频输入信号的处理-201680091323.3
  • M.阿尔布兰特 - 迪拉克研究公司
  • 2016-12-02 - 2023-05-23 - G10L19/022
  • 提供了一种用于处理音频输入信号的方法和对应音频滤波器系统。该方法包括对输入信号应用(S1)非线性时域处理以生成输入信号的处理的副本,将输入信号和输入信号的处理的副本变换(S2)到频域,以及基于变换的输入信号和输入信号的变换的处理的副本在频域中执行(S3)比较。该方法还包括基于比较确定(S4)至少一个控制参数,基于(一个或多个)控制参数执行(S5)变换的输入信号的频域处理,以及通过将频域处理的信号变换到时域来生成(S6)输出信号。
  • 自动确定音频流中语音字幕的定时窗口-202310074852.4
  • 苏里什·乔杜里;内博伊沙·齐里奇;谦·范 - 谷歌有限责任公司
  • 2016-12-29 - 2023-05-05 - G10L19/022
  • 本发明涉及自动确定音频流中语音字幕的定时窗口。内容系统将音频流的分段输入到用于分类的语音分类器中,语音分类器针对音频流的分段生成表示音频流的相应分段包括语音声音出现的可能性的原始分值。内容系统基于该组原始分值生成音频流的二进制分值,每个二进制分值基于来自音频流的连续系列分段的原始分值的聚合而生成。内容系统基于二进制分值为音频流中的语音声音生成一个或多个定时窗口,每个定时窗口指示音频流中的一个或多个语音声音的开始和结束时间戳的估计。
  • 用于音频变换编码中重叠率的信号自适应切换的编码器、解码器以及方法-201680067262.7
  • 克里斯蒂安·赫尔姆里希;贝恩德·埃德勒;托拜厄斯·施维格勒;弗洛里安·舒赫 - 弗劳恩霍夫应用研究促进协会
  • 2016-09-23 - 2023-04-04 - G10L19/022
  • 提供了用于解码多个频谱域音频样本的解码器。该解码器包括用于从频谱域音频样本生成第一组时域中间音频样本和第二组时域中间音频样本的第一解码模块(110)。而且,该解码器包括重叠加法器(130),用于以多于5%且至多50%的重叠将第一组时域中间音频样本和第二组时域中间音频样本重叠相加。此外,该解码器包括用于从频谱域音频样本生成第三组时域中间音频样本和第四组时域中间音频样本的第二解码模块(120)。而且,该解码器包括输出接口(140)。重叠加法器(130)被配置为以多于60%且少于100%的重叠将至少第三组时域中间音频样本和第四组时域中间音频样本重叠相加。而且,重叠加法器(130)被配置为将至少第二组时域中间音频样本和第三组时域中间音频样本重叠相加,或者将至少第四组时域中间音频样本和第一组时域中间音频样本重叠相加。
  • 一种音频信号的编解码方法和装置-202110865328.X
  • 夏丙寅;李佳蔚;王喆 - 华为技术有限公司
  • 2021-07-29 - 2023-02-03 - G10L19/022
  • 本申请实施例公开了一种音频信号的编解码方法和装置,用于提高编码质量以及音频信号的重建效果。本申请实施例提供一种音频信号的编码方法,包括:根据待编码音频信号的当前帧的M个块的频谱获得所述M个块的M个暂态标识;所述M个块包括第一块,所述第一块的暂态标识用于指示所述第一块为暂态块,或者指示所述第一块为非暂态块;根据所述M个块的M个暂态标识获得所述M个块的分组信息;根据所述M个块的分组信息对所述M个块的频谱进行分组排列,以获得所述当前帧的待编码频谱;利用编码神经网络对所述待编码频谱进行编码,以获得频谱编码结果;将所述频谱编码结果写入码流。
  • 一种音频带宽扩展方法、装置、编码方法及介质-202211199395.3
  • 李强;叶东翔;朱勇 - 北京百瑞互联技术股份有限公司
  • 2022-09-29 - 2022-12-27 - G10L19/022
  • 本申请公开了一种音频带宽扩展方法、装置、编码方法、介质及设备,属于音频编解码技术领域。该方法包括:在编码过程中,对输入的音频数据进行分帧,得到多个音频帧;确定当前音频帧的窗口长度,根据窗口长度判定当前音频帧的音频帧类型;根据音频帧类型,对当前音频帧进行块切换和滤波器组处理,得到谱系数;根据谱系数计算当前音频帧的有效带宽,在有效带宽小于对应的奈奎斯特带宽的条件下,将当前帧音频数据输入到音频帧类型相应的带宽扩展模型中,进行带宽扩展。本申请的音频带宽扩展方法通过预训练的带宽扩展模型对不同音频帧类型的窄带音频分别进行带宽扩展,得到全带宽音频,从而在编码过程中提升音质,保证用户体验。
  • 音频信号处理方法、装置、电子设备及可读存储介质-202211104870.4
  • 彭江 - 维沃移动通信有限公司
  • 2022-09-09 - 2022-12-20 - G10L19/022
  • 本申请公开了一种音频信号处理方法、装置、电子设备及可读存储介质,属于通信技术领域。该方法包括:获取第一音频信号对应的第一音频信号帧序列,上述第一音频信号帧序列包括n个音频信号帧,n为大于1的整数;基于上述第一音频信号帧序列对应的第一重叠比例,和第一音频信号的播放速率参数,得到第二重叠比例;根据上述第二重叠比例,对第一音频信号帧序列进行合成处理,得到第二音频信号;其中,上述第一重叠比例为:上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。
  • 具有使用子带合并和时域混叠消减的自适应非均匀时间/频率平铺的感知音频编码-201980087032.0
  • 尼尔斯·沃纳;伯恩德·埃德勒;萨沙·迪什 - 弗劳恩霍夫应用研究促进协会
  • 2019-10-16 - 2021-08-31 - G10L19/022
  • 实施例提供用于处理音频信号以获得音频信号的子带表示的音频处理器。音频处理器被配置为对音频信号的样本的至少两个部分重叠的块执行级联的重叠临界采样变换,以音频信号的第一样本块为基础获得子带样本集合,以及以音频信号的第二样本块为基础获得对应的子带样本集合。此外,音频处理器被配置为执行两个对应的子带样本集合的加权组合,一个子带样本集合以音频信号的第一样本块为基础获得,且一个子带样本集合是以音频信号的第二样本块为基础获得的,以获得音频信号的经混叠消减的子带表示;其中执行级联的重叠临界采样变换包括使用至少两个窗函数对以第一样本块为基础获得的二进制位的集合进行分段,并且基于经分段的对应于第一样本块的二进制位的集合获得至少两个经分段的二进制位的集合;其中执行级联的重叠临界采样变换包括使用至少两个窗函数对以第二样本块为基础获得的二进制位的集合进行分段,并且基于经分段的对应于第二样本块的二进制位的集合获得至少两个二进制位的集合;并且其中使用级联的重叠临界采样变换的第二重叠临界采样变换来处理二进制位的集合,其中第二重叠临界采样变换包括对至少一个二进制位的集合执行具有相同帧长度的重叠临界采样变换。
  • 基于深度学习注意力机制的频带扩展方法及装置-202010933415.X
  • 方泽煌;康元勋 - 厦门亿联网络技术股份有限公司
  • 2020-09-08 - 2021-01-15 - G10L19/022
  • 本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置,所述方法包括:基于窄带语音信号生成伪高频信号;计算所述伪高频信号的功率谱能量;通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。本发明实施例既保证了扩频效果,保证语音质量,还可应用部署于要求时延低,内存小、计算能力较弱的通信设备。
  • 一种音频信号的时域包络处理方法及装置、编码器-201610992299.2
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2014-06-12 - 2020-08-25 - G10L19/022
  • 本发明实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括:根据接收到的当前帧音频信号,得到所述当前帧音频信号的高带信号;根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明实施例提供的音频信号的时域包络处理方法及装置,在求解多个时域包络能够很好的保持信号能量的连续,同时降低了计算时域包络的复杂度。
  • 使用音频对象的时间变化的音频对象聚类-201410078314.3
  • 陈连武;芦烈;J·布里巴特 - 杜比实验室特许公司
  • 2014-02-28 - 2019-10-29 - G10L19/022
  • 本发明的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括:获取与所述音频对象相关联的音轨的至少一个片段,所述至少一个片段包含所述音频对象;基于所述音频对象的至少一个属性,估计所述音频对象在所述至少一个片段的持续时间上的变化;以及至少部分地基于估计的所述变化,调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。
  • 一种音频信息获取的方法及其装置-201510172408.1
  • 陈延 - 广东欧珀移动通信有限公司
  • 2015-04-10 - 2018-07-06 - G10L19/022
  • 本发明实施例公开了一种音频信息获取的方法及其装置。其中的方法包括:当接收到音频采样信号时,获取所述音频采样信号的采样率;根据所述音频采样信号的采样率获取最大采样点个数;采用所述最大采样点个数获得所述音频采样信号的采样位数。本发明实施例还相应地公开了一种音频信息获取的装置。采用本发明,可以实现准确获取音频采样信号的采样位数,提升对音频信息采样的准确度。
  • 音频信号的比特分配的方法和装置-201210243316.4
  • 齐峰岩;苗磊;刘泽新 - 华为技术有限公司
  • 2012-07-13 - 2017-04-12 - G10L19/022
  • 本发明实施例提供了一种音频信号的比特分配的方法和装置。其中,音频信号的比特分配的方法包括将音频信号的频带分为多个子带,量化每个子带的子带归一化因子;将该多个子带划分为多个组,获取每个组的组参数,其中该组参数用于表征对应组的音频信号的信号特点和能量属性;根据每个组的组参数,为至少一个组分配编码比特,其中该至少一个组分配的编码比特数之和为该音频信号的编码比特数;依据至少一个组中的每个组的每个子带的子带归一化因子,将分配到该至少一个组的编码比特分配到该至少一个组中的每个组的每个子带。本发明实施例可以在中低比特率时,通过分组保证前后帧分配比较稳定,减少全局对局部不连续的影响。
  • 一种音频信号的时域包络处理方法及装置、编码器-201410260730.5
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2014-06-12 - 2016-02-17 - G10L19/022
  • 本发明实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括:根据接收到的当前帧音频信号,得到所述当前帧音频信号的高带信号;根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧,其中,M为大于等于2的整数;计算每一个所述子帧的时域包络;采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗;对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明实施例提供的音频信号的时域包络处理方法及装置,在求解多个时域包络能够很好的保持信号能量的连续,同时降低了计算时域包络的复杂度。
  • 基于分层事件检测和上下文模型的多源场景声音摘要方法-201410391254.0
  • 路通;翁炀冰;王公友 - 南京大学
  • 2014-08-08 - 2014-11-26 - G10L19/022
  • 本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法,包括以下步骤:步骤一,输入一段待摘要的目标多源场景音频分割片段;步骤二,基于背景声音对音频场景片段进行分割;步骤三,通过一个谱聚类算法,将目标音频中相似的分割片段聚类起来,利用仿射函数检测背景声音事件,并计算声音事件的评分函数得到关键声音事件;步骤四,通过一个上下文模型计算声音事件之间的相关函数;步骤五,根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。
  • 一种自适应的变采样率音频采样方法-201310562870.3
  • 肖唐良;刘娜;杨青;宫夏 - 中国电子科技集团公司第四十一研究所
  • 2013-11-07 - 2014-04-23 - G10L19/022
  • 本发明提供一种自适应的变采样率音频采样方法,其根据采样数据测量过零点数目,依据过零点数目调整采样频率,具体包括以下步骤:步骤1,通过采样点的电压值估计过零点的时刻:判断前后2个采样值的符号是否相同,若相同,则两个采样值的两个采样点间没有过零点发生;若不同,则两个采样值的两个采样点的电压穿过零点一次,两个采样点的电压符号发生一次变更;步骤2,统计一帧采样数据内变更的次数得出过零点的数目,具体而言,以采样数据的符号位为计数时钟,利用符号位的上升沿和下降沿,在一帧采样数据传输时间内进行计数,得到计数值就是这帧数据的过零点数目;步骤3,根据过零点数目与频率的对应关系,利用分段采样进行采样频率的选择。
  • 使用时间分辨率能选择的低复杂性频谱分析/合成-201310553487.1
  • A.塔莱布 - 爱立信电话股份有限公司
  • 2008-08-25 - 2014-02-19 - G10L19/022
  • 信号处理是基于这样的构思:将时域混叠(12,TDA)帧用作时间分段(14)和频谱分析(16)的基础,基于时域混叠帧来在时间上执行分段并且基于所得到的时间段来执行频谱分析。因此可以通过基于应用哪个频谱分析而简单地适配时间分段以获得合适数目的时间段,从而改变整体“分段的”时间到频率的变换的时间分辨率。为所有段获得的整个频谱系数集提供原始信号帧的能选择的时间-频率平铺。
  • 一种基于软件实现的音乐内容截幅检测方法-201210578700.X
  • 梅林海;刘丹;路雪玲;史峰;张磊;聂小林;江涛 - 安徽科大讯飞信息科技股份有限公司
  • 2012-12-27 - 2013-05-22 - G10L19/022
  • 本发明涉及一种基于软件实现的音乐内容截幅检测方法,用于实现对运营商提供的音乐内容的质量检测,具体为:解析现有的音频文件,将音频文件转化成单通道;对音频数据进行加窗,通常直接使用矩形窗;统计加载的音频信号中超过某一个特定幅度值Fδ的采样点的个数,使用变量sum对个数进行累加统计;计算sum与步骤二中的矩形窗的窗宽M,求出它们的比值ξ,将ξ与选定的阈值α进行比较,判断音频文件是否存在截幅;通过不断的重复加窗、统计频率、计算比值并与阈值比较,最终完成整个音频文件的检测。本发明能够实现快速检测音频截幅问题,检测过程中不需要人工参与,节约人力、提高审核效率,且降低审核出错几率。
  • 音频编码装置和方法、音频解码装置和方法以及程序-201210350062.6
  • 铃木志朗;松村祐树;户栗康裕;前田祐儿;松本淳 - 索尼公司
  • 2012-09-19 - 2013-04-03 - G10L19/022
  • 本发明提供了音频编码装置和音频编码方法、音频解码装置和音频解码方法、以及程序,其中该音频编码装置包括:第一加窗部,将音频信号与第一窗函数相乘;第二加窗部,将音频信号与第二窗函数相乘,第二窗函数的特征不同于第一窗函数的特征;窗选择部,基于经第一加窗部相乘后的音频信号和经第二加窗部相乘后的音频信号,选择第一窗函数或第二窗函数作为最佳窗函数;编码部,对与最佳窗函数相乘后的音频信号的频谱进行编码;以及传送部,传送经编码部编码后的频谱和表示最佳窗函数的窗函数信息。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top