[发明专利]音频数据的处理方法、装置、电子设备及存储介质有效

专利信息
申请号: 201910367661.0 申请日: 2019-05-05
公开(公告)号: CN110335615B 公开(公告)日: 2021-11-16
发明(设计)人: 辛远铭 申请(专利权)人: 北京字节跳动网络技术有限公司
主分类号: G10L19/20 分类号: G10L19/20;G11C7/16
代理公司: 上海光栅知识产权代理有限公司 31340 代理人: 马雯雯
地址: 100041 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请提供一种音频数据的处理方法、装置、电子设备及存储介质,该方法包括:获取待处理音频数据及待配置音频参数,所述待配置音频参数包括待配置声道数、待配置采样率和待配置采样位数中的至少一种;根据所述待配置音频参数对所述待处理音频数据进行相应的处理,获得音频二进制数据。实现了根据用户需求的声道数、采样率和采样位数,导出音频数据,一方面提高了录音产生的音频文件的导出灵活性和可用性,另一方面提高了用户体验。
搜索关键词: 音频 数据 处理 方法 装置 电子设备 存储 介质
【主权项】:
1.一种音频数据的处理方法,其特征在于,包括:获取待处理音频数据及待配置音频参数,所述待配置音频参数包括待配置声道数、待配置采样率和待配置采样位数中的至少一种;根据所述待配置音频参数对所述待处理音频数据进行相应的处理,获得音频二进制数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910367661.0/,转载请声明来源钻瓜专利网。

同类专利
  • 音频处理方法、装置、电子设备及计算机可读介质及产品-202111081197.2
  • 林贻鸿 - OPPO广东移动通信有限公司
  • 2021-09-15 - 2023-10-03 - G10L19/20
  • 本申请公开了一种音频处理方法、装置、电子设备、计算机可读介质及产品,涉及音频技术领域,该方法应用于音频编码系统的发送端,该音频编码系统还包括接收端,所述发送端和所述接收端相连接,所述方法包括:获取待传输音频数据;确定所述待传输音频数据的音频类型;若所述待传输音频数据的音频类型为指定类型,则降低所述待传输音频数据的数据量,以得到目标音频数据;向所述接收端发送所述目标音频数据。
  • 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置-202310171516.1
  • A.克鲁格;S.科唐;J.贝姆;J-M.巴特克 - 杜比国际公司
  • 2013-05-06 - 2023-06-06 - G10L19/20
  • 本公开涉及压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置。高阶高保真度立体声响复制(HOA)表示在最佳听音位置附近的完整声场,其不依赖于扩音器结构。高空间分辨率需要大量的HOA系数。在本发明中,估计主声音方向,并且将HOA信号表示分解成时域中的主方向信号和相关的方向信息以及HOA域中的环境分量,继之以通过降低它的阶来压缩环境分量。阶降低后的环境分量被变换到空间域,并且与方向信号一起被感知编码。在接收器侧,编码后的方向信号和阶降低后经编码的环境分量被感知地解压缩,被感知地解压缩的环境信号被变换到降低的阶的HOA域表示,继之以阶扩展。从方向信号、对应的方向信息以及原始阶的环境HOA分量重新组成总的HOA表示。
  • 嵌入式环境下的音频解码方法、装置、设备及介质-201910087608.5
  • 张国成;毛建鑫 - 乐鑫信息科技(上海)股份有限公司
  • 2019-01-29 - 2023-04-25 - G10L19/20
  • 本发明公开了一种嵌入式环境下的音频解码方法、装置、设备及介质。该方法包括:根据嵌入式环境下检测到的针对目标音频文件的解码触发指令,获取内存缓冲区中缓存的与所述目标音频文件对应的至少一段比特流进行至少一种音频格式的检测;如果确定检测出与所述目标音频文件对应的目标音频格式,则使用与所述目标音频格式匹配的音频解码库对所述目标音频文件进行音频解码。通过上述方法,使嵌入式平台可以兼容更多的音频格式,有效地实现了有限资源下的嵌入式平台对各类音频格式的自动检测,并在检测出音频的格式后对其进行解码播放。
  • 音频编解码方法及相关产品-202210546928.4
  • 华超;黄飞 - 腾讯科技(深圳)有限公司
  • 2022-05-19 - 2022-09-13 - G10L19/20
  • 本申请属于音视频技术领域,具体涉及一种音频编解码方法、音频编解码装置、计算机可读介质、电子设备以及计算机程序产品。音频解码方法包括:获取音频帧序列中各个音频帧的编码向量;对历史音频帧的编码向量进行上采样得到至少一个上采样特征值,所述历史音频帧是在当前音频帧之前解码的一个或者多个音频帧,所述上采样特征值是在上采样过程中得到的用于描述音频帧的特征向量;根据所述至少一个上采样特征值对所述当前音频帧的编码向量进行上采样得到所述当前音频帧的解码数据。本申请可以提高音频数据的编解码质量。
  • 编码控制方法、装置以及电子设备-201810923291.X
  • 严锋贵;龚金华 - OPPO广东移动通信有限公司
  • 2018-08-14 - 2022-06-21 - G10L19/20
  • 本申请实施例公开了一种编码控制方法、装置以及电子设备。所述方法包括:获取当前的音频输出场景;获取与所述当前的音频输出场景对应的音频编码类型;基于所述音频编码类型对向音频播放设备传输的音频数据进行编码。本方法在输出编码的音频数据之前,通过获取当前的音频输出场景,然后再获取与所述当前的音频输出场景对应的音频编码类型,然后基于所述音频编码类型对向音频播放设备传输的音频数据进行编码,从而使得电子设备可以根据不同的音频输出场景来确定不同的音频编码类型,进而提升了电子设备进行编码的灵活性。
  • 串行音频元数据帧生成方法、装置、设备及存储介质-202111425628.2
  • 吴健 - 赛因芯微(北京)电子科技有限公司
  • 2021-11-26 - 2022-04-15 - G10L19/20
  • 本申请涉及一种串行音频元数据帧生成方法、装置、设备及存储介质,该方法包括:获取串行音频元数据帧的帧头子元素和音频格式扩展子元素;将所述帧头子元素置于所述串行音频元数据帧的头部,将所述音频格式扩展子元素置于所述帧头子元素之后,生成所述串行音频元数据帧;其中,所述帧头子元素包括帧格式元素和传输音频接口格式元素,所述音频格式扩展子元素包括规定的音频模型元数据。以生成串行音频模式下的串行音频元数据帧,实现声音模型元数据的工作流。
  • 一种语音信号处理方法、装置、设备及存储介质-201911248791.9
  • 谭志鹏;谭北平 - 北京明略软件系统有限公司;清华大学
  • 2019-12-06 - 2022-03-29 - G10L19/20
  • 本申请提供一种语音信号处理方法、装置、设备及存储介质,涉及语音识别技术领域。该方法包括:检测输入的模拟音频信号的语音质量;根据语音质量,确定差分脉冲编码调制DPCM和自适应差分脉冲编码调制ADPCM的权重;分别对模拟音频信号进行DPCM处理和ADPCM处理,得到第一调制信号和第二调制信号;根据DPCM和ADPCM的权重、对第一调制信号和第二调制信号的预设类型参数进行加权,得到目标调制信号。本申请可以有效地解决语音识别效率低下的问题,提高语音识别率。
  • 音频数据的处理方法、装置、电子设备及存储介质-201910367661.0
  • 辛远铭 - 北京字节跳动网络技术有限公司
  • 2019-05-05 - 2021-11-16 - G10L19/20
  • 本申请提供一种音频数据的处理方法、装置、电子设备及存储介质,该方法包括:获取待处理音频数据及待配置音频参数,所述待配置音频参数包括待配置声道数、待配置采样率和待配置采样位数中的至少一种;根据所述待配置音频参数对所述待处理音频数据进行相应的处理,获得音频二进制数据。实现了根据用户需求的声道数、采样率和采样位数,导出音频数据,一方面提高了录音产生的音频文件的导出灵活性和可用性,另一方面提高了用户体验。
  • 音频编码方法和装置-201710188022.9
  • 王喆 - 华为技术有限公司
  • 2014-06-24 - 2021-10-26 - G10L19/20
  • 本发明实施例提供音频编码的方法和装置,包括:确定输入的N个音频帧的能量在频谱上分布的稀疏性,其中该N个音频帧包括当前音频帧,N为正整数;根据该N个音频帧的能量在频谱上分布的稀疏性,确定采用第一编码方法或第二编码方法对该当前音频帧进行编码,其中该第一编码方法为基于时频变换和变换系数量化且不基于线性预测的编码方法,该第二编码方法为基于线性预测的编码方法。上述技术方案在对音频帧进行编码时,考虑了该音频帧的能量在频谱上分布的稀疏性,能够降低编码的复杂度,同时能够保证编码具有较高的准确率。
  • 一种编码模式切换方法和装置、解码模式切换方法和装置-201811418613.1
  • 黄冬梅;郭轶芹;袁浩 - 中兴通讯股份有限公司
  • 2013-01-07 - 2021-09-07 - G10L19/20
  • 本发明实施例提供一种编码模式切换方法,第i帧和第i+1帧分别为MDCT和ACELP编码模式时,采用预定义窗型对第i帧进行MDCT编码获得MDCT编码信息;对第i帧或者第i帧及其之前的帧的编码信息进行解码,获得解码信号;根据解码信号、以及第i帧的部分输入信号及第i+1帧的部分输入信号建立并更新ACELP编码模式中所需滤波器的历史状态后,对后续的一帧长度的输入信号进行ACELP编码处理。本发明实施例提供一种从MDCT到ACELP的编码模式切换装置。本发明实施例还提供一种从MDCT到ACELP的解码模式切换方法和装置。本发明实施例还提供一种从ACELP到MDCT的编码模式切换方法和解码模式切换方法和装置。
  • 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置-201710350511.X
  • A.克鲁格;S.科唐;J.贝姆;J-M.巴特克 - 杜比国际公司
  • 2013-05-06 - 2021-03-09 - G10L19/20
  • 本公开涉及压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置。高阶高保真度立体声响复制(HOA)表示在最佳听音位置附近的完整声场,其不依赖于扩音器结构。高空间分辨率需要大量的HOA系数。在本发明中,估计主声音方向,并且将HOA信号表示分解成时域中的主方向信号和相关的方向信息以及HOA域中的环境分量,继之以通过降低它的阶来压缩环境分量。阶降低后的环境分量被变换到空间域,并且与方向信号一起被感知编码。在接收器侧,编码后的方向信号和阶降低后经编码的环境分量被感知地解压缩,被感知地解压缩的环境信号被变换到降低的阶的HOA域表示,继之以阶扩展。从方向信号、对应的方向信息以及原始阶的环境HOA分量重新组成总的HOA表示。
  • 音频编码方法和装置-201710188023.3
  • 王喆 - 华为技术有限公司
  • 2014-06-24 - 2020-12-25 - G10L19/20
  • 本发明实施例提供音频编码的方法和装置,包括:确定输入的N个音频帧的能量在频谱上分布的稀疏性,其中该N个音频帧包括当前音频帧,N为正整数;根据该N个音频帧的能量在频谱上分布的稀疏性,确定采用第一编码方法或第二编码方法对该当前音频帧进行编码,其中该第一编码方法为基于时频变换和变换系数量化且不基于线性预测的编码方法,该第二编码方法为基于线性预测的编码方法。上述技术方案在对音频帧进行编码时,考虑了该音频帧的能量在频谱上分布的稀疏性,能够降低编码的复杂度,同时能够保证编码具有较高的准确率。
  • 音讯处理装置及方法-201710321331.9
  • 王奕桓;陈锦荣 - 瑞昱半导体股份有限公司
  • 2017-05-09 - 2020-09-08 - G10L19/20
  • 一种音讯处理装置,包含:第一及第二类比至数位转换模组、暂存器及处理模组。处理模组执行对应第一类比输入音讯的第一音讯应用程式,将第一类比输入音讯分配给第一类比至数位转换模组。当处理模组判断第二音讯应用程式同样对应于第一类比输入音讯时,将共享配置资讯写入于暂存器中,以使第一类比至数位转换模组读取暂存器并处理第一类比输入音讯。当处理模组判断第二音讯应用程式对应第二类比输入音讯时,将第二类比输入音讯分配给第二类比至数位转换模组,以由第一及第二类比至数位转换模组分别处理第一及第二类比输入音讯。
  • 用于修正通用音频合成的设备及其方法-201710020311.8
  • T.瓦兰考特;M.杰里尼克 - 沃伊斯亚吉公司
  • 2012-11-01 - 2020-08-18 - G10L19/20
  • 一种用于修正由时域解码器解码的时域激励的合成的方法和设备,其中解码的时域激励的合成被分类到多个类别之一。将解码的时域激励转换成频域激励,并作为解码的时域激励的合成被分类到的类别的函数,对频域激励进行修正。将修正的频域激励转换成修正的时域激励,并向合成滤波器提供修正的时域激励,以产生解码的时域激励的修正的合成。
  • 包括编码HOA表示的位流的解码方法和装置、以及介质-202010019977.3
  • A·克鲁埃格尔;S·科尔多恩;O·伍埃博尔特 - 杜比国际公司
  • 2014-12-19 - 2020-05-19 - G10L19/20
  • 本公开涉及包括编码HOA表示的位流的解码方法和装置、以及介质。高阶高保真度立体声响复制代表与特定扬声器设置无关的三维声音。但是,传送HOA表示导致非常高的位速率。因此,使用具有固定数量的通道的压缩,其中,方向和环境信号成分以不同的方式被处理。对于编码,从方向信号成分预测原始HOA表示的多个部分。这种预测提供相应解码所需要的边信息。通过使用一些附加的特定目的位,已知边信息编码处理得到改善,这在于用于编码该边信息的需要的位数平均减少。
  • 音频信号分类和编码-201580026065.6
  • 艾力克·诺维尔;斯蒂芬·布鲁恩 - 瑞典爱立信有限公司
  • 2015-05-12 - 2020-03-13 - G10L19/20
  • 本发明涉及编解码器和信号分类器以及其中的基于音频信号特征进行的信号分类和编码模式选择的方法。一种由解码器执行的方法实施例包括,针对帧m:基于变换域中帧m的频谱包络的范围和相邻帧m‑1的频谱包络的相应范围之间的差,确定稳定性值D(m)。每个这种范围包括与音频信号的分段的频谱带中的能量相关的量化频谱包络值的集合。所述方法还包括:基于所述稳定性值D(m)从多个解码模式中选择解码模式;以及应用所选的解码模式。
  • 音频信号区分器和编码器-201580023968.9
  • 艾力克·诺维尔;沃洛佳·格兰恰诺夫 - 瑞典爱立信有限公司
  • 2015-05-07 - 2019-11-01 - G10L19/20
  • 本发明涉及编解码器和区分器以及其中用于音频信号区分和编码的方法。编码器执行的方法的实施例包括,针对音频信号的分段:识别频谱峰值的集合;确定所述集合中峰值之间的平均距离S;以及确定峰值包络与噪声基底包络之间的比率PNR。所述方法还包括:至少基于所述平均距离S和比率PNR,从多个编码模式中选择编码模式;以及应用所选编码模式,用于所述音频信号的分段的编码。
  • 具有语音信息的改进型帧丢失矫正-201580023682.0
  • 朱利恩·福雷;斯泰凡·雷高特 - 奥兰吉公司
  • 2015-04-24 - 2019-07-26 - G10L19/20
  • 本发明涉及数字音频信号的处理,包括一系列在连续帧中分布的样本。尤其是在解码所述信号以便在解码过程中替换丢失的至少一个信号帧的情况下,进行所述处理。所述方法包括下列步骤:a)在解码时可用的有效信号段中,搜索信号中的至少一个周期,所述周期是按照所述有效信号确定的;b)分析所述周期中的信号从而确定所述周期中信号的频谱分量;c)通过从所述预定频谱分量中选择的增加分量和加入增加分量的噪音构成合成信号,从而合成替代丢失帧的至少一帧。特别地,按照解码时得到的有效信号的语音信息加权加入增加分量的噪音的量。
  • 基于上下文的算术解码设备和方法-201610031675.1
  • 朱基岘;金重会;吴殷美 - 三星电子株式会社
  • 2010-06-18 - 2019-07-19 - G10L19/20
  • 公开了一种基于上下文的算术解码设备和方法。所述基于上下文的算术解码设备可确定将被解码的当前N元组的上下文,确定与当前N元组的最高有效位(MSB)码元相应的MSB上下文,并使用当前N元组的上下文和MSB上下文来确定概率模型。随后,所述基于上下文的算术解码设备可基于确定的概率模型来对MSB执行解码,并基于从对转义码进行解码的处理而得到的最低有效位(LSB)的比特深度,对LSB执行解码。
  • 音频信号编码方法和系统-201410421971.3
  • 何伟旭;孙铁军 - 广东美的集团芜湖制冷设备有限公司
  • 2014-08-25 - 2019-06-04 - G10L19/20
  • 本发明公开了一种音频信号编码方法,终端实时获取当前运行环境中的混合音频信号,并对获取到的混合音频信号进行解析,以提取混合音频信号中各个音频信号中强度大于预设阈值的音频信号频率作为有效频率,并确定预设的编码频率中与所述有效频率均不匹配的编码频率,将确定的编码频率作为当前编码频率,在接收到音频信号编码指令时,所述终端采用所述当前编码频率将源数据编码为音频信号。本发明还公开了一种音频信号编码系统。本发明降低了环境中的噪音对待传输的音频信号的影响,提高音频信号传输的准确率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top