[发明专利]低比特率的编解码器有效

申请号：	02827186.6	申请日：	2002-12-03
公开（公告）号：	CN1615509A	公开（公告）日：	2005-05-11
发明（设计）人：	索伦·V·安德森;罗尔·哈根;巴斯蒂安·克莱杰恩	申请（专利权）人：	环球IP音响欧洲公司;环球IP音响公司
主分类号：	G10L19/04	分类号：	G10L19/04
代理公司：	北京市柳沈律师事务所	代理人：	黄小临;王志森
地址：	瑞典斯***	国省代码：	瑞典;SE
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及预测编码/解码操作的改善，该操作是对在分组交换网络上传输的信号执行的。该信号是以这样的方式逐块编码的：即块A－B是不取决于任何先前块而预测编码的。位于该块的末端边界A和B之间某处的起始状态(715)使用任何适宜的编码方法来编码。然后围绕该起始状态的两块部分基于该起始状态、并在彼此相反的方向上进行预测编码，从而结果得到块A－B的完全编码的显示(745)。在解码端，执行对应的解码操作。
搜索关键词：	比特率编解码器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种对被划分为连续的块的信号进行编码的方法，其中该方法包括应用于块的以下步骤：对该块的第一部分进行编码，该第一部分位于该块的两端边界之间的某处，从而获得该块的编码的起始状态；使用基于所述编码的起始状态的预测编码方法对该块的第二部分进行编码，并朝所述两端边界之一的方向逐步地对所述第二部分进行编码；和确定在所述起始状态和所述两端边界的另一个之间是否存在任何信号取样，如果存在，则使用基于所述编码的起始状态的预测编码方法对包括这些取样的该块的第三部分进行编码，并朝所述两端边界的另一个的方向逐步地对所述第三部分进行编码，从而所述第三部分相对于与该块关联的时间轴，与所述第二部分的编码相比是以相反方向编码的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于环球IP音响欧洲公司;环球IP音响公司，未经环球IP音响欧洲公司;环球IP音响公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/02827186.6/，转载请声明来源钻瓜专利网。

上一篇：大型型钢弯曲成形的加工方法
下一篇：局部长度氮化物SONOS器件及其制造方法

同类专利

音频信号分类和编码-202010186693.3
发明人：艾力克·诺维尔;斯蒂芬·布鲁恩 -专利权人：瑞典爱立信有限公司
申请日： 2015-05-12 - 公布日： 2023-09-22 - 主分类号： G10L19/04
摘要：本发明涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括，针对帧m：基于变换域中帧m的频谱包络的范围和相邻帧m‑1的频谱包络的相应范围之间的差，确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括：基于所述稳定性值D(m)从多个解码模式中选择解码模式；以及应用所选的解码模式。

一种长帧移语音相位谱预测方法及装置-202310737506.X
发明人：艾杨;鲁叶欣;凌震华 -专利权人：中国科学技术大学
申请日： 2023-06-19 - 公布日： 2023-09-05 - 主分类号： G10L19/04
摘要：本发明提供一种长帧移语音相位谱预测方法及装置，涉及语音信号处理技术领域，该方法包括：基于无损插值技术，将长帧移语音对数幅度谱转换为短帧移语音对数幅度谱；使用短帧移语音对数幅度谱进行相位谱预测，得到短帧移语音相位谱；根据短帧移语音相位谱，生成长帧移语音相位谱。本发明能够提高长帧移语音相位谱的预测结果准确度。

语音信号的处理方法、装置、电子设备和存储介质-202310621422.X
发明人：周岭松 -专利权人：小米科技（武汉）有限公司;北京小米移动软件有限公司;北京小米松果电子有限公司
申请日： 2023-05-29 - 公布日： 2023-08-22 - 主分类号： G10L19/04
摘要：本申请提出一种语音信号的处理方法、装置、电子设备和存储介质，其中，方法包括：获取当前环境的第一子帧语音数据和第一子帧语音数据之前的至少一个历史子帧语音数据，根据第一子帧语音数据和/或至少一个历史子帧语音数据预测得到第一子帧语音数据后的第二子帧语音数据，将第一子帧语音数据和第二子帧语音数据拼接，得到第一帧语音数据，将至少一个历史子帧语音数据中的目标历史子帧语音数据与第一子帧语音数据拼接，得到第二帧语音数据，根据第一帧语音数据和第二帧语音数据得到第一子帧语音数据中的目标人声信号，实现了不需要延迟设定时长以等待获取第二子帧语音数据，避免了对帧间重叠数据处理引入的时延，减少了混响感，提高了语音质量。

基于音频量化的自回归音频生成方法及装置、设备及存储介质-202310685839.2
发明人：陶建华 -专利权人：清华大学
申请日： 2023-06-12 - 公布日： 2023-07-14 - 主分类号： G10L19/04
摘要：本公开涉及语音处理技术领域，具体涉及一种基于音频量化的自回归音频生成方法及装置、设备及存储介质，所述方法包括：接收与待预测音频相关的描述信息和风格信息；对所述风格信息进行编码，得到与所述风格信息对应的风格向量；将与待预测音频相关的描述信息和风格向量输入预先训练的token值序列预测模型，得到与待预测音频对应的token值序列；将与待预测音频对应的token值序列输入已知的解码器，得到与token值序列对应的音频信号，能够生成高质量音频和各种文本导向的多种音频。

一种基于序列动态压缩的语音翻译和语音识别方法-202211732994.7
发明人：杜权;杨木润 -专利权人：沈阳雅译网络技术有限公司
申请日： 2022-12-30 - 公布日： 2023-06-02 - 主分类号： G10L19/04
摘要：本发明涉及一种基于动态序列压缩的语音翻译和语音识别方法，属于自然语言处理技术领域；解决了现有技术中语音翻译或语音识别方法无法对语音数据进行有效压缩，导致计算资源过大；或无法对语音数据进行逐步动态压缩，导致对数据过度压缩引起信息丢失的问题；本发明的语音翻译方法包括：获取待翻译的源语言语音数据；通过声学编码器对语音数据的特征序列进行长度预测、动态压缩、特征融合和编码，得到声学编码器隐向量；利用文本编码器对声学编码器隐向量进行文本模态转换并进行特征提取及编码，得到文本编码器隐向量；将声学编码器隐向量和文本编码器隐向量输入解码器进行解码，得到源语言语音数据对应的目标语言翻译文本。

一种语音解码方法、装置和终端设备-201910152119.3
发明人：陈涛;付晓寅;臧启光;吴玉芳;瞿琴 -专利权人：百度在线网络技术（北京）有限公司
申请日： 2019-02-28 - 公布日： 2023-05-23 - 主分类号： G10L19/04
摘要：本发明实施例提供一种语音解码方法、装置和终端设备，该方法包括：基于第一语言模型和声学模型获取语音信号的第一解码结果集，以及基于第二语言模型和所述声学模型获取所述语音信号的第二解码结果集，其中，所述第一解码结果集包括至少一个第一解码结果，所述第二解码结果集包括至少一个第二解码结果；建立包括N个第一解码结果和M个第二解码结果的时间序列；将所述时间序列包括的解码结果按照在所述时间序列的时间顺序输入至LSTM模型进行联合预测，以得到所述时间序列内每个解码结果的第一分数，并输出所述时间序列中第一分数最高的解码结果。本发明实施例可以提高语音信号的解码准确度。

使用预测器模型的信号编码器、解码器和方法-201680081725.5
发明人： G·凡尼斯;B·万达埃勒 -专利权人：奥罗技术公司
申请日： 2016-07-15 - 公布日： 2023-05-02 - 主分类号： G10L19/04
摘要：一种信号编码器，将信号分成片段并使用预测模型来对每个片段的样本进行近似。各自适用于一个片段的每个局部预测模型在片段内应用于其自己的平移轴系统中，并且偏移量由先前片段的最后一个预测值给出。当信号合理地连续时，这减少了对每个局部预测器模型的偏移量进行参数化的需要，因为每个局部预测器模型可以建立在先前片段的最后一个预测的样本值上。因此，即使不发送偏移量，而是代替地使用先前片段的最后一个样本的最后一个预测值，编码器也不会遭受误差累积。为近似样本获得预测误差并将该预测误差与预测器模型参数和种子值一起发送到解码器，以允许解码器准确地重建信号。

一种语音波达方向的估计方法、装置及电子设备-201911174054.9
发明人：冯大航;陈孝良;常乐 -专利权人：北京声智科技有限公司
申请日： 2019-11-26 - 公布日： 2023-03-21 - 主分类号： G10L19/04
摘要：本发明提供了一种语音波达方向的估计方法、装置及电子设备，获取位于不同位置的传声器采集的目标用户的语音信号，对所述语音信号进行滤波操作和组合操作，得到对应预设方向上的滤波语音，依据对应预设方向上的所述滤波语音以及预设波达方向预测模型，确定所述目标用户所在的目标方向。通过本发明，可以预估出目标用户所在的目标方向，即实现了语音波达方向估计。

语音转换基于扩展内核类网格法处理零散数据建模方法及设备-201811131244.8
发明人：徐宁;潘安顺;倪亚南;刘妍妍;刘小峰 -专利权人：河海大学常州校区
申请日： 2018-09-27 - 公布日： 2022-12-02 - 主分类号： G10L19/04
摘要：本发明公开了一种语音转换基于可扩展内核类网格法处理零散数据建模方法,语音数据根据时间间隔经过前期的预处理分帧,语音转换通过取源语音某一音色的多维数据与目标语音的对应一维数据进行映射拟合，源语音的多维数据和一维目标语音数据作为训练数据，经过高斯回归模型进行训练，高斯过程采取可扩展性内核，建立类似网格结构，从中设置合适数量代表点通过局部三次插值和反距离权重插值法来作结构性内核逼近，从而大大加快高斯回归模型快速拟合;本发明通过设置合适数量代表点作精确内核逼近得到近似内核，这样既降低高斯过程计算量，大幅减小数据训练时间，又不会降低回归预测精度，做到同时兼顾。

多声道信号的编解码方法和编解码器-201880022744.X
发明人：刘泽新;苗磊 -专利权人：华为技术有限公司
申请日： 2018-03-01 - 公布日： 2022-05-10 - 主分类号： G10L19/04
摘要：一种多声道信号的编解码方法和编解码器，该编码方法包括：确定多声道信号中的第一声道信号和第二声道信号的下混信号以及第一声道信号和第二声道信号的初始混响增益参数；根据第一声道信号、第二声道信号分别与下混信号的相关性，以及初始混响增益参数，确定第一声道信号和第二声道信号的目标混响增益参数；根据下混信号和目标混响增益参数，对第一声道信号和第二声道信号进行量化，并将量化后的第一声道信号和第二声道信号写入码流。该编解码方法和编解码器能够提高混响处理后得到的声道信号的质量。

说话者预测方法、说话者预测装置以及通信系统-202111170526.0
发明人：鹈饲训史;田中良 -专利权人：雅马哈株式会社
申请日： 2021-10-08 - 公布日： 2022-04-26 - 主分类号： G10L19/04
摘要：本发明提供了一种说话者预测方法、说话者预测装置以及通信系统。能够在当前的说话者正在说话的期间高精度地预测下一个要说话的说话者。说话者预测方法是用于获取多个说话者的语音并记录所述多个说话者的会话历史的说话者预测方法，该说话者预测方法获取语音，确定所获取的所述语音的说话者，基于所述确定的所述说话者和所述会话历史，从所述多个说话者中预测下一个要发声的说话者。

用于语音编码的蓝牙音频的传送方法、系统和电子设备-202111259309.9
发明人：江正红;罗修樟;江建方 -专利权人：深圳市美恩微电子有限公司
申请日： 2021-10-28 - 公布日： 2022-01-28 - 主分类号： G10L19/04
摘要：本申请公开了一种用于语音编码的蓝牙音频的传送方法、系统和电子设备，其通过使用作为基于语义理解模型的预测编码模型的编码器‑掩码器结构，可以通过对发送端的语音数字信号进行编码来得到接收端的语音数字信号，从而通过编码器‑解码器模型来并入通信环境因素，另外，利用上述编码器‑掩码器结构中的语义理解模型的用于掩码预测的变换器机制，可以基于语音数字信号的整体对语音数字信号的模型进行标注，从而体现出音频的模式。这样在编码时，除了考虑到音频模式外，还结合了通信环境的表征，以提高编码的精度。

基于信息熵及时间趋势分析的音频关注度计算方法及系统-201811228386.6
发明人：张聪;刘宇;王松;阳傲傲;朱华东 -专利权人：武汉轻工大学
申请日： 2018-10-19 - 公布日： 2022-01-11 - 主分类号： G10L19/04
摘要：本发明公开了一种基于信息熵及时间趋势分析的音频关注度计算方法及系统。本发明通过对输入音频信号进行听觉外周处理以达到人耳对声音信号的前期处理效果，对音频信号进行分帧处理并求取每帧信息熵值，利用统计学相关计算原理对整体音频信号熵值进行趋势性分析，最终得到关注度值，本发明技术方案通过复杂性低的计算方式实现了对音频信号中人耳较感兴趣事件进行自动检测，满足目前智能音频等领域的需求。

针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法-202111089783.1
发明人：亚历山大·克鲁格;斯文·科尔东 -专利权人：杜比国际公司
申请日： 2015-06-22 - 公布日： 2021-12-17 - 主分类号： G10L19/04
摘要：本发明公开了针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法。当对HOA数据帧表示进行压缩时，在每个通道信号被感知地编码(16)之前对其实施增益控制(15，151)。增益值作为边信息以差分的方式被传输。然而，为了开始对这样的流式压缩HOA数据帧表示进行解码，需要绝对增益值，应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe)，在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号，随后对HOA数据帧表示(C(k))进行归一化。然后，将最小整数比特数设置为(AA)。

针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法-202111089797.3
发明人：亚历山大·克鲁格;斯文·科尔东 -专利权人：杜比国际公司
申请日： 2015-06-22 - 公布日： 2021-12-17 - 主分类号： G10L19/04
摘要：本发明公开了针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法。当对HOA数据帧表示进行压缩时，在每个通道信号被感知地编码(16)之前对其实施增益控制(15，151)。增益值作为边信息以差分的方式被传输。然而，为了开始对这样的流式压缩HOA数据帧表示进行解码，需要绝对增益值，应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe)，在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号，随后对HOA数据帧表示(C(k))进行归一化。然后，将最小整数比特数设置为(AA)。

针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法-202111089841.0
发明人：亚历山大·克鲁格;斯文·科尔东 -专利权人：杜比国际公司
申请日： 2015-06-22 - 公布日： 2021-12-17 - 主分类号： G10L19/04
摘要：本发明公开了针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法。当对HOA数据帧表示进行压缩时，在每个通道信号被感知地编码(16)之前对其实施增益控制(15，151)。增益值作为边信息以差分的方式被传输。然而，为了开始对这样的流式压缩HOA数据帧表示进行解码，需要绝对增益值，应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe)，在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号，随后对HOA数据帧表示(C(k))进行归一化。然后，将最小整数比特数设置为(AA)。

针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法-202111089793.5
发明人：亚历山大·克鲁格;斯文·科尔东 -专利权人：杜比国际公司
申请日： 2015-06-22 - 公布日： 2021-12-14 - 主分类号： G10L19/04
摘要：本发明公开了针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法。当对HOA数据帧表示进行压缩时，在每个通道信号被感知地编码(16)之前对其实施增益控制(15，151)。增益值作为边信息以差分的方式被传输。然而，为了开始对这样的流式压缩HOA数据帧表示进行解码，需要绝对增益值，应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe)，在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号，随后对HOA数据帧表示(C(k))进行归一化。然后，将最小整数比特数设置为(AA)。

针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法-202111089981.8
发明人：亚历山大·克鲁格;斯文·科尔东 -专利权人：杜比国际公司
申请日： 2015-06-22 - 公布日： 2021-12-14 - 主分类号： G10L19/04
摘要：本发明公开了针对HOA数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法。当对HOA数据帧表示进行压缩时，在每个通道信号被感知地编码(16)之前对其实施增益控制(15，151)。增益值作为边信息以差分的方式被传输。然而，为了开始对这样的流式压缩HOA数据帧表示进行解码，需要绝对增益值，应当以最小数量的比特对该绝对增益值进行编码。为了确定这样的最小整数比特量{βe)，在空间域中将HOA数据帧表示(C(k))渲染为位于单位球体上的虚拟扬声器信号，随后对HOA数据帧表示(C(k))进行归一化。然后，将最小整数比特数设置为(AA)。

音频信号编码方法、解码方法、编码设备以及解码设备-202010297340.0
发明人：夏丙寅;李佳蔚;王喆 -专利权人：华为技术有限公司
申请日： 2020-04-15 - 公布日： 2021-11-02 - 主分类号： G10L19/04
摘要：本申请提供一种音频信号编码方法、解码方法、编码设备以及解码设备，用于实现更高质量的音频编解码，提高用户体验。该方法包括：获取音频信号的当前帧，当前帧包括高频带信号和低频带信号；根据高频带信号、低频带信号和频带扩展的配置信息得到当前帧的频带扩展的参数；获取频率区域信息，频率区域信息用于指示高频带信号中需要进行音调成分检测的第一频率范围；在第一频率范围进行音调成分检测以获取高频带信号的音调成分的信息；对频带扩展的参数和音调成分的信息进行码流复用，以得到载荷码流。

音频编码方法及相关装置-201710188290.0
发明人：王喆 -专利权人：华为技术有限公司
申请日： 2014-04-29 - 公布日： 2021-10-26 - 主分类号： G10L19/04
摘要：本发明实施例提供了一种音频编码方法以及相关装置。一种音频编码方法，包括：估计当前音频帧的参考线性预测效率；确定与上述当前音频帧的参考线性预测效率匹配的音频编码方式；按照与上述当前音频帧的参考线性预测效率匹配的音频编码方式对上述当前音频帧进行音频编码。本发明实施例提供的技术方案有利于降低音频编码的开销。

一种调制解调器语音编解码器的选择方法和存储介质-201910809969.6
发明人：彭丁聪 -专利权人：珠海格力电器股份有限公司
申请日： 2019-08-29 - 公布日： 2021-09-14 - 主分类号： G10L19/04
摘要：本发明公开调制解调器语音编解码器的选择方法，系统和存储介质，该方法包括：S1：从BP侧和AP侧选择用于形成训练数据的多个特征参数，并设定每个所述特征参数的取值范围；S2：在所述取值范围内，选取每个所述特征参数的值，并由多个所述特征参数的值形成特征向量Xi；选择与多个所述特征参数的值相匹配的至少一个语音编解码器，并由所述至少一个语音编解码器形成目标向量Yi；获得由所述特征向量Xi和所述目标向量Yi形成的映射关系；S3：重复步骤S2，并获得由多组所述映射关系所形成的所述训练数据；S4：基于所述训练数据，通过训练，获得经过训练的语音编解码分类器；S5：利用经过训练的所述语音编解码分类器，筛选与当前网络相匹配的语音编解码器。

混响语音信号中后混响功率谱的自适应估计方法及装置-201811216983.7
发明人：梁民 -专利权人：电信科学技术研究院有限公司
申请日： 2018-10-18 - 公布日： 2021-09-03 - 主分类号： G10L19/04
摘要：本发明提供了一种混响语音信号中后混响功率谱的自适应估计方法及装置，涉及语音信号处理领域。该混响语音信号中后混响功率谱的自适应估计方法，包括：获取麦克风拾取的混响语音信号的子带自功率谱的估计；获取用于所述混响语音信号中后混响子带自功率谱估计的延时的线性预测DLP预测系数矢量；根据所述混响语音信号的子带自功率谱的估计和DLP预测系数矢量，获取后混响子带自功率谱估计。上述方案，通过利用延时的线性预测DLP预测系数矢量来进行后混响子带自功率谱估计的获取，可以保证语音信号去混响的有效性，降低了去混响的难度，提高了去混响的效率。

对音频信号进行重采样以用于低延迟编码/解码-201710730282.4
发明人： B.科维西;S.拉戈特 -专利权人：皇家飞利浦有限公司
申请日： 2014-09-26 - 公布日： 2021-07-30 - 主分类号： G10L19/04
摘要：本发明涉及一种用于在音频信号编码或解码中对音频信号重采样的方法。该方法针对每个有待重采样的信号块包括以下步骤：‑通过自适应线性预测来确定（E401）未来信号样本的数量，此数量是根据所选择的重采样延迟来限定的；‑至少根据该当前块的多个样本以及所确定的多个未来信号样本而构建（E402）重采样支持向量；‑将重采样滤波器应用（E403）于该重采样支持向量的多个样本。本发明还涉及一种实现所描述的方法的重采样装置、包括至少一个装置的编码器和解码器。

一种基于卡尔曼滤波的去混响方法及系统-201711285885.4
发明人：齐园蕾;杨飞然;杨军 -专利权人：中国科学院声学研究所
申请日： 2017-12-07 - 公布日： 2021-07-30 - 主分类号： G10L19/04
摘要：本发明公开了一种基于卡尔曼滤波的去混响方法及系统，所述方法包括：将各麦克风采集到的原始信号进行预处理得到相应的频域信号，延迟后构成输入信号；利用卡尔曼滤波算法和时变的多通道自回归模型估计混响信号，将当前时刻的各麦克风采集到的原始信号作为参考信号，减去混响信号得到误差信号；利用卡尔曼增益矩阵和误差信号更新卡尔曼滤波器的系数；利用当前时刻各麦克风采集到的原始信号、输入信号和更新后的卡尔曼滤波器系数得到目标信号；最后，利用逆傅里叶变换将频域目标信号转换到时域。本发明的方法通过对角化卡尔曼滤波器状态向量误差协方差矩阵，降低了自适应多通道线性预测去混响算法的复杂度。

语音编码方法、语音解码方法及装置-201811518677.9
发明人：牛坤;姜友海 -专利权人：思必驰科技股份有限公司
申请日： 2018-12-12 - 公布日： 2021-07-20 - 主分类号： G10L19/04
摘要：本发明公开一种语音编码/解码方法及装置，其中，所述语音信号编码方法包括：预先确定用于语音信号编码的固定步进值；计算当前时刻的语音信号与前一时刻的预测语音信号之间的差值；基于所述固定步进值对所述差值进行编码以得到编码结果。本发明实施例中，采用固定步进值，能够减小原始语音信号的非线性变化，从而在后续进行前端信号处理(例如，回声消除、波束成形)时，不会存在放大非线性变化而影响处理结果，从而避免了对后端语音识别的影响。

语音数据处理方法、装置、计算机设备及存储介质-202110387976.9
发明人：梁俊斌 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-04-12 - 公布日： 2021-07-02 - 主分类号： G10L19/04
摘要：本申请实施例公开了一种语音数据处理方法、装置、计算机设备及存储介质，属于计算机技术领域。该方法包括：接收目标数据包，目标数据包是发送设备对第一语音数据和冗余数据进行组包后发送的，第一语音数据是对第二语音数据的多个语音特征进行特征编码得到的，多个语音特征中包括关键语音特征和非关键语音特征，冗余数据是关键语音特征进行特征编码得到的；在目标数据包中未获取到第一语音数据的情况下，对冗余数据进行特征解码，得到关键语音特征；基于关键语音特征，预测非关键语音特征；对关键语音特征和非关键语音特征进行合成滤波，得到第二语音数据。在丢失语音数据的情况下，通过预测非关键语音特征，能够达到抗丢失语音数据的效果。

解码装置、解码方法、解码程序、记录介质-202110081890.3
发明人：守谷健弘;镰本优;原田登 -专利权人：日本电信电话株式会社
申请日： 2015-02-20 - 公布日： 2021-05-18 - 主分类号： G10L19/04
摘要：提供一种能够将在由音响信号的基音周期引起的峰值附近的近似精度高的频域的包络序列以较少的码量再现的解码装置、解码方法、解码程序、记录介质。本发明的解码装置具有周期性综合包络生成部和可变长度解码部。周期性综合包络生成部生成频域的序列的周期性综合包络序列，所述周期性综合包络序列基于与线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期。可变长度解码部对可变长度码进行解码而获得频域的序列。

编码装置、编码方法、编码程序、记录介质-202110083487.4
发明人：守谷健弘;镰本优;原田登 -专利权人：日本电信电话株式会社
申请日： 2015-02-20 - 公布日： 2021-05-18 - 主分类号： G10L19/04
摘要：提供一种能够将在由音响信号的基音周期引起的峰值附近的近似精度高的频域的包络序列以较少的码量再现的编码装置、编码方法、编码程序以及记录介质。本发明的编码装置具有周期性综合包络生成部以及可变长度编码部。周期性综合包络生成部生成基于与从输入音响信号而求得的线性预测系数码对应的频域的序列即谱包络序列、以及频域的周期的、频域的序列即周期性综合包络序列。可变长度编码部，对源于输入音响信号的频域的序列进行编码。

提高语音信道数据传输准确性的方法-201910194081.6
发明人：陈冰雪;庞潼川;杨成功 -专利权人：北京芯盾集团有限公司
申请日： 2019-03-14 - 公布日： 2021-05-11 - 主分类号： G10L19/04
摘要：本发明公开了提高语音信道数据传输准确性的方法，包括以下步骤：构造N个类语音符号波形；从所述N个类语音符号波形中选择Nsym个最优类语音符号波形，N＞＞Nsym，组成码本；发送端将需要传输的数据比特分组，每Nbit个比特为一组，总共有种可能性，每一组选择所述码本中对应的类语音符号波形进行调制，转换成类语音信号，并将类语音信号在语音信道上传输；接收端对接收到的类语音信号进行数据解调。本发明具有提高传输性能，降低误比特率等优点。

获得预测模型的方法、语音波形的预测方法及相关装置-202011627633.7
发明人：伍宏传;胡亚军 -专利权人：科大讯飞股份有限公司
申请日： 2020-12-31 - 公布日： 2021-05-07 - 主分类号： G10L19/04
摘要：本申请公开了一种获得预测模型的方法、语音波形的预测方法、电子设备和计算机可读存储介质，所述获得预测模型的方法首先将样本语音波形划分为若干个样本子序列，并进行时延处理，然后构建初始预测模型，并依据若干个样本子序列和样本语音波形的声学参数训练初始预测模型，获得预测模型。其中，将若干个样本子序列中当前波形点的波形值同时输入上述预测模型，能够同时获得若干个样本子序列中下一波形点的预测波形值。因此，本申请能够减少预测生成语音波形的计算量，提高生成语音波形的效率，从而能够实现实时生成语音波形的目的，且实时生成语音波形时不容易发生卡顿。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]低比特率的编解码器有效

专利文献下载