[发明专利]对线性预测系数量化的方法和装置及解量化的方法和装置在审

申请号：	202110189314.0	申请日：	2015-05-07
公开（公告）号：	CN112927702A	公开（公告）日：	2021-06-08
发明（设计）人：	成昊相;姜尚远;金钟铉;吴殷美	申请（专利权）人：	三星电子株式会社;汉阳大学校艾丽卡产学协力团
主分类号：	G10L19/022	分类号：	G10L19/022;G10L19/038;G10L19/04;G10L19/06
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;杨莘
地址：	韩国京畿道水***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	线性预测系数量化方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种量化设备，包括：

帧间预测器，配置成从前一帧的量化的输入矢量生成当前帧的第一预测矢量；

帧内预测器，配置成基于所述当前帧的量化的第一误差矢量的前一级子矢量和当前级的预测矩阵估计所述当前帧的第二预测矢量的当前级子矢量来生成所述当前帧的所述第二预测矢量，其中，所述当前帧的所述量化的第一误差矢量基于所述当前帧的所述第二预测矢量和所述当前帧的量化的第二误差矢量来获得；以及

格栅结构化矢量量化器，配置成对所述当前帧的与所述当前帧的第一误差矢量和所述当前帧的所述第二预测矢量之间的差值对应的第二误差矢量进行量化，以生成所述当前帧的所述量化的第二误差矢量，其中，所述当前帧的所述第一误差矢量与所述当前帧的所述第一预测矢量和所述当前帧的输入矢量之间的差值对应。

2.根据权利要求1所述的设备，其中，所述帧内预测器配置成通过使用N×N预测矩阵和所述量化的第一误差矢量的N维子矢量来估计所述第二预测矢量的N维子矢量，N是大于或等于2的自然数。

3.根据权利要求1所述的设备，其中，所述格栅结构化矢量量化器配置成将所述第二误差矢量划分成N维子矢量，并将所述N维子矢量分配给多个级。

4.根据权利要求1所述的设备，其中，所述预测矩阵通过所述码本训练来预先定义。

5.根据权利要求1所述的设备，其中，还包括矢量量化器，所述矢量量化器配置成与所述第一误差矢量和所述量化的第一误差矢量之间的差值对应的第三误差矢量进行量化。

6.根据权利要求1所述的设备，其中，所述格栅结构化矢量量化器配置成基于加权函数来搜索最佳指标。

7.根据权利要求5所述的设备，其中，所述矢量量化器配置成基于加权函数来搜索最佳指标。

8.一种量化设备，包括：

第一量化模块，用于在没有帧间预测的情况下执行量化；以及

第二量化模块，用于利用帧间预测来执行量化；

其中，所述第一量化模块包括：

第一帧内预测器，配置成通过基于当前级的第一预测矩阵和量化的输入矢量的前一级子矢量估计预测矢量的当前级子矢量来生成所述预测矢量，其中，所述量化的输入矢量基于所述预测矢量和量化的预测误差矢量来获得；以及

第一格栅结构化矢量量化器，配置成对与所述预测矢量和输入矢量之间的差值对应的预测误差矢量进行量化，以生成所述量化的预测误差矢量。

9.根据权利要求8所述的设备，其中，所述第二量化模块包括：

帧间预测器，配置成从前一帧的量化的输入矢量生成当前帧的第一预测矢量；

第二帧内预测器，配置成通过基于所述当前帧的量化的第一误差矢量的前一级子矢量和当前级的第二预测矩阵估计所述当前帧的第二预测矢量的当前级子矢量来生成所述当前帧的所述第二预测矢量，其中，所述当前帧的所述量化的第一误差矢量基于所述当前帧的所述第二预测矢量和所述当前帧的量化的第二误差矢量来获得；以及

第二格栅结构化矢量量化器，配置成对所述当前帧的与所述当前帧的第一误差矢量和所述当前帧的所述第二预测矢量之间的差值对应的第二误差矢量进行量化，以生成所述当前帧的所述量化的第二误差矢量，其中，所述当前帧的所述第一误差矢量与所述当前帧的所述第一预测矢量和所述当前帧的输入矢量之间的差值对应。

10.根据权利要求8所述的设备，还包括选择器，所述选择器配置成以开环方式选择所述第一量化模块和所述第二量化模块中的一个。

11.根据权利要求9所述的设备，其中：

所述第一量化模块还包括第一矢量量化器，所述第一矢量量化器配置成对与所述输入矢量和所述量化的输入矢量之间的差值对应的量化误差矢量进行量化；以及

所述第二量化模块还包括第二矢量量化器，所述第二矢量量化器配置成对与所述第一误差矢量和所述量化的第一误差矢量之间的差值对应的第三误差矢量进行量化。

12.根据权利要求11所述的设备，其中，所述第一矢量量化器和所述第二矢量量化器配置成共享码本。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;汉阳大学校艾丽卡产学协力团，未经三星电子株式会社;汉阳大学校艾丽卡产学协力团许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110189314.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种防控病虫害的有机质土壤及其制备方法
下一篇：电连接器

同类专利

对音频信号进行编码的方法以及音频编码器-201880042163.2
发明人： M·M·古德文;A·考克;A·周 -专利权人： DTS公司
申请日： 2018-04-28 - 公布日： 2023-09-22 - 主分类号： G10L19/022
摘要：提供了一种对音频信号进行编码的方法，该方法包括：将多个不同的时频变换应用于音频信号帧；针对多个时频分辨率在多个频带上计算编码效率的量度；至少部分地基于所计算的编码效率的量度，选择时频分辨率的组合以表示在多个频带中的每个频带处的帧；确定窗口大小和对应的变换大小；确定修正变换；使用确定的窗口大小对帧进行加窗；使用确定的变换大小来变换被加窗帧；使用确定的修正变换来修正被加窗帧的变换的频带内的时频分辨率。

对信息信号进行编码和解码的方法及设备-201880086073.3
发明人：马库斯·施奈尔;曼福莱特·卢次克;亚历山大·切卡林斯基;拉尔夫·盖格 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2018-11-08 - 公布日： 2023-07-07 - 主分类号： G10L19/022
摘要：提供用于使用分析窗口化函数(40，50，60，70，240)利用分析/合成窗口化函数执行修改余弦变换(MDCT)的方法及设备，分析窗口化函数(40，50，60，70，240)具有以至少四个点(#1，#2，#2，#4)的对应性经过线性函数(40’，240’)的曲折部分(44，64，244)。

音频输入信号的处理-201680091323.3
发明人： M.阿尔布兰特 -专利权人：迪拉克研究公司
申请日： 2016-12-02 - 公布日： 2023-05-23 - 主分类号： G10L19/022
摘要：提供了一种用于处理音频输入信号的方法和对应音频滤波器系统。该方法包括对输入信号应用（S1）非线性时域处理以生成输入信号的处理的副本，将输入信号和输入信号的处理的副本变换（S2）到频域，以及基于变换的输入信号和输入信号的变换的处理的副本在频域中执行（S3）比较。该方法还包括基于比较确定（S4）至少一个控制参数，基于（一个或多个）控制参数执行（S5）变换的输入信号的频域处理，以及通过将频域处理的信号变换到时域来生成（S6）输出信号。

自动确定音频流中语音字幕的定时窗口-202310074852.4
发明人：苏里什·乔杜里;内博伊沙·齐里奇;谦·范 -专利权人：谷歌有限责任公司
申请日： 2016-12-29 - 公布日： 2023-05-05 - 主分类号： G10L19/022
摘要：本发明涉及自动确定音频流中语音字幕的定时窗口。内容系统将音频流的分段输入到用于分类的语音分类器中，语音分类器针对音频流的分段生成表示音频流的相应分段包括语音声音出现的可能性的原始分值。内容系统基于该组原始分值生成音频流的二进制分值，每个二进制分值基于来自音频流的连续系列分段的原始分值的聚合而生成。内容系统基于二进制分值为音频流中的语音声音生成一个或多个定时窗口，每个定时窗口指示音频流中的一个或多个语音声音的开始和结束时间戳的估计。

用于音频变换编码中重叠率的信号自适应切换的编码器、解码器以及方法-201680067262.7
发明人：克里斯蒂安·赫尔姆里希;贝恩德·埃德勒;托拜厄斯·施维格勒;弗洛里安·舒赫 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2016-09-23 - 公布日： 2023-04-04 - 主分类号： G10L19/022
摘要：提供了用于解码多个频谱域音频样本的解码器。该解码器包括用于从频谱域音频样本生成第一组时域中间音频样本和第二组时域中间音频样本的第一解码模块(110)。而且，该解码器包括重叠加法器(130)，用于以多于5％且至多50％的重叠将第一组时域中间音频样本和第二组时域中间音频样本重叠相加。此外，该解码器包括用于从频谱域音频样本生成第三组时域中间音频样本和第四组时域中间音频样本的第二解码模块(120)。而且，该解码器包括输出接口(140)。重叠加法器(130)被配置为以多于60％且少于100％的重叠将至少第三组时域中间音频样本和第四组时域中间音频样本重叠相加。而且，重叠加法器(130)被配置为将至少第二组时域中间音频样本和第三组时域中间音频样本重叠相加，或者将至少第四组时域中间音频样本和第一组时域中间音频样本重叠相加。

一种音频信号的编解码方法和装置-202110865328.X
发明人：夏丙寅;李佳蔚;王喆 -专利权人：华为技术有限公司
申请日： 2021-07-29 - 公布日： 2023-02-03 - 主分类号： G10L19/022
摘要：本申请实施例公开了一种音频信号的编解码方法和装置，用于提高编码质量以及音频信号的重建效果。本申请实施例提供一种音频信号的编码方法，包括：根据待编码音频信号的当前帧的M个块的频谱获得所述M个块的M个暂态标识；所述M个块包括第一块，所述第一块的暂态标识用于指示所述第一块为暂态块，或者指示所述第一块为非暂态块；根据所述M个块的M个暂态标识获得所述M个块的分组信息；根据所述M个块的分组信息对所述M个块的频谱进行分组排列，以获得所述当前帧的待编码频谱；利用编码神经网络对所述待编码频谱进行编码，以获得频谱编码结果；将所述频谱编码结果写入码流。

一种音频带宽扩展方法、装置、编码方法及介质-202211199395.3
发明人：李强;叶东翔;朱勇 -专利权人：北京百瑞互联技术股份有限公司
申请日： 2022-09-29 - 公布日： 2022-12-27 - 主分类号： G10L19/022
摘要：本申请公开了一种音频带宽扩展方法、装置、编码方法、介质及设备，属于音频编解码技术领域。该方法包括：在编码过程中，对输入的音频数据进行分帧，得到多个音频帧；确定当前音频帧的窗口长度，根据窗口长度判定当前音频帧的音频帧类型；根据音频帧类型，对当前音频帧进行块切换和滤波器组处理，得到谱系数；根据谱系数计算当前音频帧的有效带宽，在有效带宽小于对应的奈奎斯特带宽的条件下，将当前帧音频数据输入到音频帧类型相应的带宽扩展模型中，进行带宽扩展。本申请的音频带宽扩展方法通过预训练的带宽扩展模型对不同音频帧类型的窄带音频分别进行带宽扩展，得到全带宽音频，从而在编码过程中提升音质，保证用户体验。

音频信号处理方法、装置、电子设备及可读存储介质-202211104870.4
发明人：彭江 -专利权人：维沃移动通信有限公司
申请日： 2022-09-09 - 公布日： 2022-12-20 - 主分类号： G10L19/022
摘要：本申请公开了一种音频信号处理方法、装置、电子设备及可读存储介质，属于通信技术领域。该方法包括：获取第一音频信号对应的第一音频信号帧序列，上述第一音频信号帧序列包括n个音频信号帧，n为大于1的整数；基于上述第一音频信号帧序列对应的第一重叠比例，和第一音频信号的播放速率参数，得到第二重叠比例；根据上述第二重叠比例，对第一音频信号帧序列进行合成处理，得到第二音频信号；其中，上述第一重叠比例为：上述n个音频信号帧中相邻两个音频信号帧之间的重叠比例。

具有使用子带合并和时域混叠消减的自适应非均匀时间/频率平铺的感知音频编码-201980087032.0
发明人：尼尔斯·沃纳;伯恩德·埃德勒;萨沙·迪什 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2019-10-16 - 公布日： 2021-08-31 - 主分类号： G10L19/022
摘要：实施例提供用于处理音频信号以获得音频信号的子带表示的音频处理器。音频处理器被配置为对音频信号的样本的至少两个部分重叠的块执行级联的重叠临界采样变换，以音频信号的第一样本块为基础获得子带样本集合，以及以音频信号的第二样本块为基础获得对应的子带样本集合。此外，音频处理器被配置为执行两个对应的子带样本集合的加权组合，一个子带样本集合以音频信号的第一样本块为基础获得，且一个子带样本集合是以音频信号的第二样本块为基础获得的，以获得音频信号的经混叠消减的子带表示；其中执行级联的重叠临界采样变换包括使用至少两个窗函数对以第一样本块为基础获得的二进制位的集合进行分段，并且基于经分段的对应于第一样本块的二进制位的集合获得至少两个经分段的二进制位的集合；其中执行级联的重叠临界采样变换包括使用至少两个窗函数对以第二样本块为基础获得的二进制位的集合进行分段，并且基于经分段的对应于第二样本块的二进制位的集合获得至少两个二进制位的集合；并且其中使用级联的重叠临界采样变换的第二重叠临界采样变换来处理二进制位的集合，其中第二重叠临界采样变换包括对至少一个二进制位的集合执行具有相同帧长度的重叠临界采样变换。

用于处理音频信号的方法和装置，音频解码器和音频编码器-202110100360.9
发明人：以马利·拉韦利;曼努埃尔·扬德尔;格热戈日·皮耶奇克;马丁·迪茨;麦克·盖尔 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2015-07-03 - 公布日： 2021-06-22 - 主分类号： G10L19/022
摘要：描述了一种处理音频信号(100)的方法，使用线性预测滤波(102、110、112)来去除音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性。

对线性预测系数量化的方法和装置及解量化的方法和装置-202110189314.0
发明人：成昊相;姜尚远;金钟铉;吴殷美 -专利权人：三星电子株式会社;汉阳大学校艾丽卡产学协力团
申请日： 2015-05-07 - 公布日： 2021-06-08 - 主分类号： G10L19/022
摘要：一种量化装置，包括：格栅结构化矢量量化器，对N维(这里，“N”是两个或更多个)子矢量与第一预测矢量之间的第一误差矢量进行量化；以及帧间预测器，从量化的N维子矢量生成第一预测矢量，其中帧间预测器使用包括N×N矩阵的预测系数，并且使用前一级的量化的N维子矢量来执行帧间预测。

对线性预测系数量化的方法和装置及解量化的方法和装置-202110189590.7
发明人：成昊相;姜尚远;金钟铉;吴殷美 -专利权人：三星电子株式会社;汉阳大学校艾丽卡产学协力团
申请日： 2015-05-07 - 公布日： 2021-06-08 - 主分类号： G10L19/022
摘要：一种量化装置，包括：格栅结构化矢量量化器，对N维(这里，“N”是两个或更多个)子矢量与第一预测矢量之间的第一误差矢量进行量化；以及帧间预测器，从量化的N维子矢量生成第一预测矢量，其中帧间预测器使用包括N×N矩阵的预测系数，并且使用前一级的量化的N维子矢量来执行帧间预测。

用于处理音频信号的方法和装置，音频解码器和音频编码器-201580040572.5
发明人：以马利·拉韦利;曼努埃尔·扬德尔;格热戈日·皮耶奇克;马丁·迪茨;麦克·盖尔 -专利权人：弗劳恩霍夫应用研究促进协会
申请日： 2015-07-03 - 公布日： 2021-02-02 - 主分类号： G10L19/022
摘要：描述了一种处理音频信号(100)的方法，使用线性预测滤波(102、110、112)来去除音频信号的经滤波的过去帧和经滤波的当前帧之间的不连续性。

基于深度学习注意力机制的频带扩展方法及装置-202010933415.X
发明人：方泽煌;康元勋 -专利权人：厦门亿联网络技术股份有限公司
申请日： 2020-09-08 - 公布日： 2021-01-15 - 主分类号： G10L19/022
摘要：本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置，所述方法包括：基于窄带语音信号生成伪高频信号；计算所述伪高频信号的功率谱能量；通过预先训练好的逆滤波参数估计模型，获取所述伪高频信号功率谱能量对应的逆滤波参数；所述逆滤波参数估计模型为基于深度学习注意力机制，以伪高频信号的功率谱能量作为输入，逆滤波参数作为输出训练得到；将所述逆滤波参数与所述伪高频信号的频谱相乘，得到相乘结果；对所述相乘结果进行逆傅里叶变换和低通滤波处理，得到宽带信号。本发明实施例既保证了扩频效果，保证语音质量，还可应用部署于要求时延低，内存小、计算能力较弱的通信设备。

一种音频信号的时域包络处理方法及装置、编码器-201610992299.2
发明人：刘泽新;苗磊 -专利权人：华为技术有限公司
申请日： 2014-06-12 - 公布日： 2020-08-25 - 主分类号： G10L19/022
摘要：本发明实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括：根据接收到的当前帧音频信号，得到所述当前帧音频信号的高带信号；根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧，其中，M为大于等于2的整数；计算每一个所述子帧的时域包络；采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗；对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明实施例提供的音频信号的时域包络处理方法及装置，在求解多个时域包络能够很好的保持信号能量的连续，同时降低了计算时域包络的复杂度。

使用音频对象的时间变化的音频对象聚类-201410078314.3
发明人：陈连武;芦烈;J·布里巴特 -专利权人：杜比实验室特许公司
申请日： 2014-02-28 - 公布日： 2019-10-29 - 主分类号： G10L19/022
摘要：本发明的实施例涉及使用音频对象的时间变化的音频对象聚类。提供一种用于在音频对象聚类中使用音频对象的时间变化的方法。该方法包括：获取与所述音频对象相关联的音轨的至少一个片段，所述至少一个片段包含所述音频对象；基于所述音频对象的至少一个属性，估计所述音频对象在所述至少一个片段的持续时间上的变化；以及至少部分地基于估计的所述变化，调整所述音频对象在所述音频对象聚类中对聚类中心的确定的贡献。还公开了相应的系统和计算机程序产品。

音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置-201380041457.0
发明人：文韩吉;金贤郁;李男淑;吴殷美 -专利权人：三星电子株式会社
申请日： 2013-06-04 - 公布日： 2018-07-31 - 主分类号： G10L19/022
摘要：一种对音频信号进行编码的方法，包括：产生时域的修正信号使得以帧为单位补偿频率分辨率；通过使用被设计为具有小于50％的重叠区间的窗类型来对时域的修正信号进行分析加窗；通过对时域的经分析加窗的信号进行变换来产生频域的变换系数。一种对音频信号进行解码的方法，包括：通过针对从比特流解码的频域信号以子频带为单位分解频率槽，来恢复频率分辨率；将频域的恢复了分辨率的信号逆变换为时域信号；通过使用被设计为具有小于50％的重叠区间的窗类型，来对时域信号进行合成加窗。

一种音频信息获取的方法及其装置-201510172408.1
发明人：陈延 -专利权人：广东欧珀移动通信有限公司
申请日： 2015-04-10 - 公布日： 2018-07-06 - 主分类号： G10L19/022
摘要：本发明实施例公开了一种音频信息获取的方法及其装置。其中的方法包括：当接收到音频采样信号时，获取所述音频采样信号的采样率；根据所述音频采样信号的采样率获取最大采样点个数；采用所述最大采样点个数获得所述音频采样信号的采样位数。本发明实施例还相应地公开了一种音频信息获取的装置。采用本发明，可以实现准确获取音频采样信号的采样位数，提升对音频信息采样的准确度。

音频信号的比特分配的方法和装置-201210243316.4
发明人：齐峰岩;苗磊;刘泽新 -专利权人：华为技术有限公司
申请日： 2012-07-13 - 公布日： 2017-04-12 - 主分类号： G10L19/022
摘要：本发明实施例提供了一种音频信号的比特分配的方法和装置。其中，音频信号的比特分配的方法包括将音频信号的频带分为多个子带，量化每个子带的子带归一化因子；将该多个子带划分为多个组，获取每个组的组参数，其中该组参数用于表征对应组的音频信号的信号特点和能量属性；根据每个组的组参数，为至少一个组分配编码比特，其中该至少一个组分配的编码比特数之和为该音频信号的编码比特数；依据至少一个组中的每个组的每个子带的子带归一化因子，将分配到该至少一个组的编码比特分配到该至少一个组中的每个组的每个子带。本发明实施例可以在中低比特率时，通过分组保证前后帧分配比较稳定，减少全局对局部不连续的影响。

一种音频信号的时域包络处理方法及装置、编码器-201410260730.5
发明人：刘泽新;苗磊 -专利权人：华为技术有限公司
申请日： 2014-06-12 - 公布日： 2016-02-17 - 主分类号： G10L19/022
摘要：本发明实施例提供一种音频信号的时域包络处理方法及装置、编码器。该方法包括：根据接收到的当前帧音频信号，得到所述当前帧音频信号的高带信号；根据预先确定的时域包络个数M将所述当前帧音频信号的高带信号分成M个子帧，其中，M为大于等于2的整数；计算每一个所述子帧的时域包络；采用非对称窗对所述M个子帧中的最前端的子帧和所述M个子帧中的最末端的子帧进行加窗；对所述M个子帧中除所述最前端的子帧和所述最末端的子帧之外的子帧进行加窗。本发明实施例提供的音频信号的时域包络处理方法及装置，在求解多个时域包络能够很好的保持信号能量的连续，同时降低了计算时域包络的复杂度。

基于分层事件检测和上下文模型的多源场景声音摘要方法-201410391254.0
发明人：路通;翁炀冰;王公友 -专利权人：南京大学
申请日： 2014-08-08 - 公布日： 2014-11-26 - 主分类号： G10L19/022
摘要：本发明公开了一种基于分层事件检测和上下文模型的多源场景声音摘要方法，包括以下步骤：步骤一，输入一段待摘要的目标多源场景音频分割片段；步骤二，基于背景声音对音频场景片段进行分割；步骤三，通过一个谱聚类算法，将目标音频中相似的分割片段聚类起来，利用仿射函数检测背景声音事件，并计算声音事件的评分函数得到关键声音事件；步骤四，通过一个上下文模型计算声音事件之间的相关函数；步骤五，根据声音事件之间的相关值在关键声音事件的音频分割片段前后合并相关度较高的音频分割片段得出最后的多源场景声音摘要。

用于变换编码或解码的分析或合成加权窗口的自适应-201280034844.7
发明人： J·福尔;P·菲利浦 -专利权人：奥林奇公司
申请日： 2012-07-09 - 公布日： 2014-05-21 - 主分类号： G10L19/022
摘要：本发明涉及一种使用应用于样本帧的分析(h_s)或合成(h_a)加权窗口的数字音频信号的变换编码或解码的方法。所述方法包括对为具有给定初始大小N的变换提供的初始窗口进行不规则采样(E10)，以应用具有大小为M的第二变换，M不同于N。本发明还涉及适用于实现上述方法的设备。

一种自适应的变采样率音频采样方法-201310562870.3
发明人：肖唐良;刘娜;杨青;宫夏 -专利权人：中国电子科技集团公司第四十一研究所
申请日： 2013-11-07 - 公布日： 2014-04-23 - 主分类号： G10L19/022
摘要：本发明提供一种自适应的变采样率音频采样方法，其根据采样数据测量过零点数目，依据过零点数目调整采样频率，具体包括以下步骤：步骤1，通过采样点的电压值估计过零点的时刻：判断前后2个采样值的符号是否相同，若相同，则两个采样值的两个采样点间没有过零点发生；若不同，则两个采样值的两个采样点的电压穿过零点一次，两个采样点的电压符号发生一次变更；步骤2，统计一帧采样数据内变更的次数得出过零点的数目，具体而言，以采样数据的符号位为计数时钟，利用符号位的上升沿和下降沿，在一帧采样数据传输时间内进行计数，得到计数值就是这帧数据的过零点数目；步骤3，根据过零点数目与频率的对应关系，利用分段采样进行采样频率的选择。

使用时间分辨率能选择的低复杂性频谱分析/合成-201310553487.1
发明人： A.塔莱布 -专利权人：爱立信电话股份有限公司
申请日： 2008-08-25 - 公布日： 2014-02-19 - 主分类号： G10L19/022
摘要：信号处理是基于这样的构思：将时域混叠(12，TDA)帧用作时间分段(14)和频谱分析(16)的基础，基于时域混叠帧来在时间上执行分段并且基于所得到的时间段来执行频谱分析。因此可以通过基于应用哪个频谱分析而简单地适配时间分段以获得合适数目的时间段，从而改变整体“分段的”时间到频率的变换的时间分辨率。为所有段获得的整个频谱系数集提供原始信号帧的能选择的时间-频率平铺。

一种基于软件实现的音乐内容截幅检测方法-201210578700.X
发明人：梅林海;刘丹;路雪玲;史峰;张磊;聂小林;江涛 -专利权人：安徽科大讯飞信息科技股份有限公司
申请日： 2012-12-27 - 公布日： 2013-05-22 - 主分类号： G10L19/022
摘要：本发明涉及一种基于软件实现的音乐内容截幅检测方法，用于实现对运营商提供的音乐内容的质量检测，具体为：解析现有的音频文件，将音频文件转化成单通道；对音频数据进行加窗，通常直接使用矩形窗；统计加载的音频信号中超过某一个特定幅度值Fδ的采样点的个数,使用变量sum对个数进行累加统计；计算sum与步骤二中的矩形窗的窗宽M，求出它们的比值ξ，将ξ与选定的阈值α进行比较，判断音频文件是否存在截幅；通过不断的重复加窗、统计频率、计算比值并与阈值比较，最终完成整个音频文件的检测。本发明能够实现快速检测音频截幅问题，检测过程中不需要人工参与，节约人力、提高审核效率，且降低审核出错几率。

音频编码装置和方法、音频解码装置和方法以及程序-201210350062.6
发明人：铃木志朗;松村祐树;户栗康裕;前田祐儿;松本淳 -专利权人：索尼公司
申请日： 2012-09-19 - 公布日： 2013-04-03 - 主分类号： G10L19/022
摘要：本发明提供了音频编码装置和音频编码方法、音频解码装置和音频解码方法、以及程序，其中该音频编码装置包括：第一加窗部，将音频信号与第一窗函数相乘；第二加窗部，将音频信号与第二窗函数相乘，第二窗函数的特征不同于第一窗函数的特征；窗选择部，基于经第一加窗部相乘后的音频信号和经第二加窗部相乘后的音频信号，选择第一窗函数或第二窗函数作为最佳窗函数；编码部，对与最佳窗函数相乘后的音频信号的频谱进行编码；以及传送部，传送经编码部编码后的频谱和表示最佳窗函数的窗函数信息。

信号处理器以及用于处理信号的方法-201180023295.9
发明人：克里斯蒂安·赫尔姆里希;拉尔夫·盖尔 -专利权人：弗兰霍菲尔运输应用研究公司
申请日： 2011-03-08 - 公布日： 2013-01-23 - 主分类号： G10L19/022
摘要：一种信号处理器，用于根据输入信号提供输入信号的处理版本，该信号处理器包括：窗口化器，被配置为根据用于多个窗口值指数值的信号处理窗口值所描述的信号处理窗口，将输入信号的一部分或其预处理版本窗口化，以获得输入信号的处理版本。该信号处理器还包括窗口提供器，用于根据一个或多个窗口形状参数，提供用于多个窗口值指数值的信号处理窗口值。

使用取样率依赖时间扭曲轮廓编码的音频信号解码器、音频信号编码器、方法及计算机程序-201180023298.2
发明人：斯特凡·拜尔;汤姆·贝克斯特伦;拉尔夫·盖尔;贝恩德·埃德勒;萨沙·迪施;拉尔斯·维莱蒙斯 -专利权人：弗兰霍菲尔运输应用研究公司;杜比AB国际公司
申请日： 2011-03-09 - 公布日： 2013-01-16 - 主分类号： G10L19/022
摘要：一种经组配来基于包含取样频率信息的编码音频信号表示形态、编码时间扭曲信息及编码频谱表示形态而提供一解码音频信号表示形态的音频信号解码器，其包含一时间扭曲计算器及一扭曲解码器。该时间扭曲计算器经组配来依据该取样频率信息而调适一映射规则用以将编码时间扭曲信息的码字组映射至描述该解码时间扭曲信息的解码时间扭曲值。扭曲解码器经组配来基于编码频谱表示形态及依据该解码时间扭曲信息而提供该解码音频信号表示形态。

音频信号解码器、音频信号编码器、用以将音频信号解码的方法、用以将音频信号编码的方法、及使用编码上下文的音高相依适应技术的计算机程序-201180021269.2
发明人：斯特凡·拜尔;汤姆·贝克斯特伦;拉尔夫·盖尔;贝恩德·埃德勒;萨沙·迪施;拉尔斯·维莱蒙斯 -专利权人：弗兰霍菲尔运输应用研究公司;杜比AB国际公司
申请日： 2011-03-09 - 公布日： 2013-01-16 - 主分类号： G10L19/022
摘要：一种基于包含一编码频谱表示（ac_spectral_data[]）和一编码时间扭曲信息（tw_data[]）的编码音频信号表示（152）提供一解码音频信号表示（154）的音频信号解码器（150），该音频信号解码器包含一基于上下文的频谱值解码器（160），配置成依赖一上下文状态解码一描述一或更多频谱值、或一或更多频谱值的一数字表示的至少一部分（m）的码字（acod_m）以获得解码频谱值（162，297，x_ac_dec[]）。音频信号解码器也包含一配置成依赖一或更多先前解码频谱值（162，297）决定一现行上下文状态（164，c）的上下文状态决定器（170）。音频信号解码器也包含一时间扭曲频域对时域转换器（180），配置成基于一组与该特定音帧关联且由该基于上下文的频谱值解码器提供的解码频谱值（162）、并依赖时间扭曲信息而提供一特定音帧的时间扭曲时域表示（182）。上下文状态决定器（170）配置成使上下文状态的决定适应后续音帧之间的一基本频率改变。一音频信号编码器应用一类似的概念。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]对线性预测系数量化的方法和装置及解量化的方法和装置在审

专利文献下载