[发明专利]丢包补偿方法及装置在审

专利信息
申请号: 202011502968.6 申请日: 2020-12-18
公开(公告)号: CN112634912A 公开(公告)日: 2021-04-09
发明(设计)人: 王晓红;陈佳路;王冬晓;杨明祺;马楠;高强;夏龙;郭常圳 申请(专利权)人: 北京猿力未来科技有限公司
主分类号: G10L19/00 分类号: G10L19/00;G10L25/30;G10L25/03;G10L25/24
代理公司: 北京智信禾专利代理有限公司 11637 代理人: 刘晓楠
地址: 100102 北京市朝阳区广顺南大*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本说明书提供丢包补偿方法及装置,其中所述丢包补偿方法包括:接收音频数据流,若确定音频数据流中当前帧为丢包帧,且所述当前帧的上一帧不是丢包帧,则确定所述当前帧为第一个丢包帧;从音频数据流中获取所述第一个丢包帧之前的M帧历史音频数据,生成第一音频序列;确定M帧历史音频数据的音频特征,并基于M帧历史音频数据的音频特征,生成第二音频序列;基于第一音频序列,在第二音频序列中确定与第一音频序列的互相关性最大的位置,并将第二音频序列中互相关性最大的位置之后的音频数据确定为第一个丢包帧的第一补偿音频数据。通过上述方法可以减少播放的音频数据机械且重复的问题的出现。
搜索关键词: 补偿 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202011502968.6/,转载请声明来源钻瓜专利网。

同类专利
  • 基于响应网络的语义通信编码传输和接收方法及相关设备-202310621227.7
  • 戴金晟;王思贤;王俊;秦晓琦;牛凯;张平 - 北京邮电大学
  • 2023-05-29 - 2023-10-20 - G10L19/00
  • 本申请提供一种基于响应网络的语义通信编码传输和接收方法及相关设备;方法包括:利用设置的第一缩放参量构建第一响应函数,利用第一响应函数构建解析变换网络,利用预设的第二缩放参量构建第二响应函数,利用第二响应函数构建编码器;将图像向量输入解析变换网络的第一基线网络,并输出潜在表示向量,利用第一缩放参量对其进行缩放,得到目标表示向量;将其输入编码器中的第二基线网络,得到第二基线网络输出向量,利用第二缩放参量对其进行缩放得到码字;设置条件熵模型,利用条件熵模型估计目标表示向量每个维度各自的熵值;利用每个维度各自的熵值确定目标表示向量对应的符号数向量,按照符号数向量将码字映射为信道传输符号,发送至接收端。
  • 电子装置及其控制方法-201880066283.6
  • 朱基岘;A.波洛夫;郑钟勋;成昊相;吴殷美;柳宗烨 - 三星电子株式会社
  • 2018-07-19 - 2023-10-20 - G10L19/00
  • 本文公开了一种电子装置。所述电子装置包括:存储器,其用于存储分别在多个卷积神经网络(CNN)中训练的多个滤波器;以及处理器,其配置成获取对应于受损音频信号的第一频谱图,将所述第一频谱图输入到对应于每个频带的CNN,以分别应用在所述多个CNN中训练的所述多个滤波器,通过合并其中应用了所述多个滤波器的所述CNN的输出值来获取第二频谱图,以及获取基于所述第二频谱图重构的音频信号。
  • 音频数据编码格式转换的方法及装置-202211268426.6
  • 廖国波 - 深圳市超时代软件有限公司
  • 2022-10-17 - 2023-10-20 - G10L19/00
  • 本发明公开了一种音频数据编码格式转换的方法及装置,包括:若接收到的待播放音频数据为无法识别的编码格式,获取待播放音频数据的回程链路路径以及压缩率;根据待播放音频数据的压缩率,生成最小化量化噪声矩阵;根据回程链路路径向运营商的电信网络结构的中间层请求下发用于对待播放音频数据解码的目标解码器,并基于运营商的电信网络结构的中间层下发的目标解码器,根据最小化量化噪声矩阵,将对应音频帧带最小化量化噪声解码得到待编码音频帧序列;根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示,根据目标编码器和线性变换的差分表示对待编码音频帧序列进行编码,得到目标编码格式音频数据。避免音频数据丢帧,提高了音质。
  • 音频波形图生成方法及视频拆条方法、装置、电子设备-202310841926.2
  • 方鹏 - 咪咕文化科技有限公司;中国移动通信集团有限公司
  • 2023-07-10 - 2023-10-13 - G10L19/00
  • 本申请实施例提供了一种音频波形图生成方法及视频拆条方法、装置、电子设备及存储介质,通过获取音频切片文件,并对所述音频切片文件进行粗滤采样,快速生成粗粒度的波形图,实现快速获取音频波形特征以应对强实时性的需要,同时也对切片文件进行解码,通过对解码后的切片文件进行精细采样得到更加精确的振幅序列,从而绘制细粒度的音频波形。并且通过对最近切片粗粒度振幅数据的存储和比较,识别目标波形特征,从而大致确定目标波形的位置,自动在拆条轨道添加入点并创建临时拆条片段。本申请解决了在大文件或直流流的音频波形图绘制中可能出现浏览器内存过大而导致失败的问题,保证了音频波形图绘制的效率和精确度。
  • 音色转换方法、装置、设备、存储介质及程序产品-202311054309.4
  • 黄家鸿;马东鹏;项伟 - 百果园技术(新加坡)有限公司
  • 2023-08-21 - 2023-10-13 - G10L19/00
  • 本申请实施例提供了一种音色转换方法、装置、设备、存储介质及程序产品,该方法包括:获取原始音频,通过设置的第一编码模块以及音色向量对所述原始音频进行编码处理得到第一音频数据;对所述第一音频数据进行矢量量化处理得到对应的嵌入向量信息;将所述嵌入向量信息发送至解码端,用于所述解码端基于所述音色向量以及所述嵌入向量信息生成第二音频数据,并通过设置的解码模块对所述第二音频数据进行解码得到变声音频。本方案在保证音色转换质量的前提下,将音色转换服务部署在客户端,降低了服务器成本。
  • 无损编码方法和无损解码方法-202010005273.0
  • 朱基岘 - 三星电子株式会社
  • 2014-09-15 - 2023-10-13 - G10L19/00
  • 提供了一种无损编码方法和无损解码方法。所述无损编码方法包括:基于能量的量化索引被表示的范围来选择第一编码方法和第二编码方法中的一个,通过使用选择的编码方法对量化索引进行编码。无损解码方法包括:确定比特流中所包括的能量的差分量化索引的编码方法,响应于确定的编码方法,通过基于能量的量化索引被表示的范围使用第一解码方法和第二解码方法中的一个来对差分量化索引进行解码。
  • 多通道语音压缩系统和方法-202280014514.5
  • D·夏尔马;P·A·纳伊勒;U·H·约斯特 - 纽奥斯通讯有限公司
  • 2022-02-10 - 2023-10-10 - G10L19/00
  • 一种用于从音频记录系统的多个音频采集设备中选择参考音频采集设备的方法、计算机程序产品和计算系统。参考麦克风的音频就诊信息可以被编码,从而定义编码后的参考音频就诊信息。可以生成音频记录系统的多个音频采集设备和参考麦克风之间的多个声学相对传递函数。可以传输多个声学相对传递函数的表示和编码后的参考音频就诊信息。
  • 一种语音分频传输方法、源端、播放端、源端电路和播放端电路-201980000976.X
  • 郭仕林 - 深圳市汇顶科技股份有限公司
  • 2019-05-21 - 2023-10-10 - G10L19/00
  • 本申请涉及通信领域,尤其涉及一种语音分频传输方法、源端、播放端、源端电路和播放端电路;一种语音分频传输方法包括:源端对第一频段语音信号和第二频段语音信号进行编码;源端将帧同步信息标记到编码后的第一频段语音信号和编码后的第二频段语音信号中;源端通过第一同步链路和第二同步链路分别发送带有帧同步信息的编码后的第一频段语音信号和带有帧同步信息的编码后的第二频段语音信号给播放端。本申请通过第一同步链路和第二同步链路分别发送带有帧同步信息的编码后的第一频段语音信号和带有帧同步信息的编码后的第二频段语音信号给播放端,解决了由于传输带宽限制带来的音质下降的问题和改善音质时影响正在播放的音频的问题。
  • 音频编码方法及装置、电子设备、存储介质-202010383119.7
  • 闫玉凤;肖全之;黄荣均;方桂萍 - 珠海市杰理科技股份有限公司
  • 2020-05-08 - 2023-09-29 - G10L19/00
  • 本发明提供了一种音频编码方法及装置、电子设备、存储介质,该方法包括:对待编码音频数据进行语音端点检测处理,以将待编码音频数据中的活动音频段和非活动音频段相分割;对于每一个活动音频段,利用其每一个粒度中每一子带的能量值计算其粒度平均能量;根据每一个活动音频段的粒度平均能量确定每一个活动音频段的编码码率,其中,活动音频段的编码码率与活动音频段的粒度平均能量正相关;对于每一个活动音频段,按照其编码码率对其进行音频编码;对待编码音频数据分割得到的非活动音频段进行编码,且每一个活动音频段的编码码率大于每一个非活动音频段的编码码率。本发明能够有利于提高编码质量,减少编码后的音频失真。
  • 一种基于压缩感知的语音线谱频率编码及自适应快速重构方法-201811268384.X
  • 李强;王怡曼 - 重庆邮电大学
  • 2018-10-29 - 2023-09-26 - G10L19/00
  • 本发明提出一种基于压缩感知的语音线谱频率编码及自适应快速重构方法,具体实施方法包括:编码端对语音子帧进行话音激活检测后,n个子帧组成1个超帧,对不同类型超帧的线谱频率采用压缩感知方法得到观测序列,对观测序列进行矢量量化和编码;解码端通过解码和反量化得到观测序列,判断出超帧类型后,自适应地选择调整参数,调整感知矩阵的维度,根据观测序列和调整后的感知矩阵,计算出待重构超帧线谱频率的稀疏系数矩阵前一部分原子,后一部分原子用0代替,然后进行稀疏反变换快速重构出超帧的线谱频率。本发明提出的方法可用于语音信号单帧或多帧联合编码,具有线谱频率参数量化效率高,重构速度快的优点。
  • 增强型多功能数字音频解码器-201710807653.4
  • 崔巍 - 崔巍
  • 2017-09-08 - 2023-09-26 - G10L19/00
  • 本发明提供了一种增强型多功能数字音频解码器,包括:电源时钟单元Power Deck(10)、解码均衡单元DAC Deck(20)、缓冲放大单元Level Deck(30)。与现有技术相比,本发明具有如下的有益效果:本发明既能补救CD唱片(PCM格式)的先天有损,争取媲美黑胶唱片的无损音质,使存世的海量CD唱片起死回生。又能解码现代的无损DSD格式的高清音乐(SACD载体);同时,本发明包括多功能的扩展和低端普及机型,旨在扩大用户覆盖面。
  • 一种多声道信号的编解码方法和编解码设备以及终端设备-202210699863.7
  • 王智;王喆;李海婷 - 华为技术有限公司
  • 2022-06-20 - 2023-09-22 - G10L19/00
  • 本申请实施例公开了一种多声道信号的编码方法和编解码设备以及终端设备,其中,一种多声道信号的编解码方法,包括:获取多声道信号的静音标记信息,所述静音标记信息包括:静音使能标志,和/或静音标志;对所述多声道信号进行多声道编码处理,以得到各传输通道的传输通道信号;根据所述各传输通道的传输通道信号和所述静音标记信息生成码流,所述码流包括:所述静音标记信息和所述传输通道信号的多声道编码结果。本申请实施例中根据静音标记信息对各传输通道的传输通道信号进行编码以生成码流,考虑到了多声道信号的静音情况,因此提高编码效率和编码比特资源利用率。
  • 音频数据和保存在块处理存储系统中的数据的简化-201680078825.2
  • H·莎朗潘尼 - 阿斯卡瓦公司
  • 2016-12-09 - 2023-08-15 - G10L19/00
  • 本公开涉及音频数据和保存在块处理存储系统上的数据的简化。音频分量的无损简化表示可包括对一个或多个基本音频分量的引用,并且可选地包括当被应用于所述一个或多个基本音频分量时,导致所述音频分量的重建程序的描述。数据块的无损简化表示可包括对一个或多个基本数据单元块的引用,并且可选地包括当被应用于所述一个或多个基本数据单元块时,导致所述数据块的重建程序的描述。
  • 一种混音方法和装置-202011375166.3
  • 熊佳;陈森海;徐志坚;谢睿;陈光尧 - 广州趣丸网络科技有限公司
  • 2020-11-30 - 2023-08-01 - G10L19/00
  • 本申请公开了一种混音方法和装置,其中方法包括:获取用于混音的人声录音和背景音乐;对人声录音进行语音活动性检测,获取人声录音的第一能量;对背景音乐进行能量检测,获取背景音乐的第二能量;根据预置人声录音系数计算公式,结合第一能量和第二能量,计算人声录音对应的人声录音系数;根据预置背景音乐系数计算公式,结合第一能量和第二能量,计算背景音乐对应的背景音乐系数;基于人声录音系数、背景音乐系数对人声录音和背景音乐进行混音,得到混音文件。解决了现有的混音调节方法,人为操作麻烦降低了用户体验的技术问题。
  • 一种近场双耳渲染方法、系统及可读存储介质-201780050265.4
  • E·斯特因;M·沃尔什;石光霁;D·科尔塞洛 - DTS公司
  • 2017-06-16 - 2023-07-25 - G10L19/00
  • 本文描述的方法和装置最佳地将全3D音频混合(例如,方位角、仰角和深度)表示为“声音场景”,其中解码处理促进头部跟踪。能够针对收听者的朝向(例如,偏航、俯仰、滚动)和3D位置(例如,x、y、z)修改声音场景渲染。这提供了将声音场景源位置视为3D位置而不是限制于相对于收听者的位置的能力。本文讨论的系统和方法能够在任何数量的音频声道中完全表示此类场景,以提供与通过诸如DTS HD之类的现有音频编解码器的传输的兼容性,但是携带比7.1声道混合实质上更多的信息(例如,深度、高度)。
  • 一种音频通信方法、设备及系统-201811633342.1
  • 徐斌;杨晓东 - 南京中感微电子有限公司
  • 2018-12-29 - 2023-07-21 - G10L19/00
  • 本申请实施例中提供了一种音频通信方法、设备及系统。所述音频通信方法包括:将待发送的音频数据按固定间隔编码;生成广播同步序列和广播音量控制序列;以预定的广播间隔为周期在第一时隙上广播发送编码的音频数据;以预定的广播音量控制间隔为周期广播发送所述广播音量控制序列,其中在每个音量控制间隔内,所述广播音量控制序列被广播发送一组或多组,每组包含一次或多次;以预定的广播同步序列间隔为周期广播发送所述广播同步序列。这样,可以实在点到多点之间进行音频传输时实现音量控制。
  • 一种基于深度学习的全景音频编码方法-202310424297.3
  • 鲁逢源;温凯林;褚洁;李天红;张呈恺;孔亮;王鹍;蔡觉平 - 苏州鸿鹄骐骥电子科技有限公司
  • 2023-04-20 - 2023-07-18 - G10L19/00
  • 本发明涉及全景音频编码技术领域。一种基于深度学习的全景音频编码方法,将每个声源产生L帧的音频信号的驱动信号、每个声源相对于坐标原点的方位角、每个声源相对于坐标原点的高度角、每个声源相对于坐标原点的空间直线距离输入到反馈模块F的参考信号产生器R,参考声源S的每个声源受到驱动信号的驱动发出的声波广播至空间时,麦克风阵列A接收到声波后收录为L帧的音频信号输送给深度神经网络全景声编码模块N中,评价器E依据统计学指标得出差异性评价误差,如果差异性评价误差小于设置值,返回麦克风阵列A当前空间声场信号的全景音频编码。
  • 一种语音同步方法、装置及通信终端-201910376909.X
  • 班先亮;张颖哲;张晶晶 - 海能达通信股份有限公司
  • 2019-05-07 - 2023-07-18 - G10L19/00
  • 本发明提供的语音同步方法、装置及通信终端,应用于无线通信技术领域,所述方法中通信终端生成第一语音的多个语音帧,按照预设编码方式依次为各语音帧添加标号,并通过第一通信网络分别将各语音帧发送至多模终端及第二通信网络,多模终端判定第一通信网络无法满足通信要求后,通过第二通信网络接收多个语音帧,并根据当前播放的语音帧的标号,确定目标标号,进而确定需要播放的下一个目标语音帧,从目标语音帧开始,播放通过第二通信网络接收的第一语音的语音帧,本发明提供的方法,对各语音帧添加标号,在越区通信前,确定目标语音帧,并在越区后从目标语音帧开始播放后续语音帧,使得越区过程中,语音播放连续平滑,改善用户使用感受。
  • 一种基于生成对抗网络的脑电信号语音解码方法-202310220138.1
  • 张韶岷;刘腾俊;冉星辰;万子俊;李悦;郑能干;陈卫东 - 浙江大学
  • 2023-03-09 - 2023-06-30 - G10L19/00
  • 本发明公开了一种基于生成对抗网络的脑电信号语音解码方法,对脑电进行语音解码,并合成可理解的元音音频。本发明利用同步采集的被试的脑电信号和语音数据,有效预处理之后,使用生成对抗网络学习脑电信号到语音数据的映射关系,使得本方法能够有效缓解过平滑问题,并且解码语音特征合成的音频有较好的可懂性。该方法由生成器和判别器两部分构成。其中生成器负责对神经特征进行降维处理和生成语音特征;判别器负责判定语音特征的真实性。本发明具有解码精度高、对单个音素的解码可理解性强的特点。此外,与现有的语音解码算法发明相比,本发明对脑电解码的语音特征存在的过平滑现象有明显的改善。
  • 使用深度生成网络的实时数据包丢失隐藏-202180070229.0
  • S·帕斯夸尔;J·塞拉;J·庞斯普伊格 - 杜比国际公司
  • 2021-10-14 - 2023-06-30 - G10L19/00
  • 本公开涉及一种用于使用神经网络系统执行数据包丢失隐藏的方法和系统。方法包括获得不完整音频信号的表示,将不完整音频信号的表示输入到编码器神经网络,并输出预测的完整音频信号的潜在表示。潜在表示被输入到解码器神经网络,解码器神经网络输出预测的完整音频信号的表示,预测的完整音频信号的表示包括完整音频信号的原始部分的重构,其中,该编码器神经网络和该解码器神经网络已经用对抗神经网络进行训练。
  • 丢包补偿方法及装置-202010485134.2
  • 王晓红;陈佳路;刘鲁鹏;元海明;高强;夏龙;郭常圳 - 北京猿力未来科技有限公司
  • 2020-06-01 - 2023-06-30 - G10L19/00
  • 本说明书提供丢包补偿方法及装置,其中所述丢包补偿方法包括:获取目标音频信号的丢包信号区段,其中所述丢包信号区段包括丢包位置,以及丢包位置的上下文预定时长的音频信号区段;将所述丢包信号区段从时域变换到频域,得到第一频域参数;将所述第一频域参数输入预先建立的基于深度神经网络的音频补偿模型,获得第二频域参数,其中,所述第二频域参数是与所述丢包位置相关的频域参数;根据所述第二频域参数与所述第一频域参数得到第三频域参数。本说明书的丢包补偿方法利用丢包位置的上下文音频信号对丢包位置进行补偿,将相位和幅值同时输入基于深度神经网络的音频补偿模型进行预测,降低了计算复杂度并且提高了丢包补偿质量。
  • 语音解码、识别方法、装置、系统和机器设备-201810313090.8
  • 蒲松柏;罗敏;王广森;曹立新 - 腾讯科技(深圳)有限公司
  • 2018-04-09 - 2023-06-30 - G10L19/00
  • 本发明揭示了一种语音识别中的解码方法、语音识别方法、装置、系统和机器设备。所述方法包括:根据所进行语音识别对应的语音解码范围获取文本数据;生成文本数据的前缀搜索树;通过前缀搜索树解码语音识别中声学模型输出的声学特征,获得匹配的路径;根据匹配的路径获得语音识别的解码结果。至此实现封闭集场景下语音解码,对封闭集以前缀搜索树的方式取代语言模型,获得较强实时性以及灵活性,而对于解码结果通过前缀搜索树进行搜索获得,消除了edit‑distance度量的约束,也避免了语言模型与封闭集之间概率模型的不一致性,能够极大提高准确性,在前缀搜索树的作用下不需要大量存储空间且加快搜索速度,实现低复杂度、实时性强且准确的语音解码。
  • 丢包补偿模型训练方法、丢包补偿方法及装置-202310118799.3
  • 李镇权;郑能恒 - 深圳大学
  • 2023-02-01 - 2023-06-23 - G10L19/00
  • 本发明提供丢包补偿模型训练方法、丢包补偿方法及装置,包括:获取输入信号和初始丢包补偿模型;基于输入信号,构造与输入信号对应的目标信号;基于初始丢包补偿模型和输入信号,得到重构信号;基于重构信号与目标信号,对初始丢包补偿模型进行训练,得到目标丢包补偿模型。通过本发明,通过对丢包补偿模型进行训练,进一步优化了语音丢包补偿算法采用的损失函数,降低了噪声干扰,避免了丢包补偿模型受误差累积的影响,进而避免了出现重构信号包络异常的情况。通过优化后的损失函数,实现了在降低包络失真的同时,增强模型对于包络的重构能力,进一步提高了补偿信号的语音质量、可懂度和自动语音识别准确率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top