[发明专利]一种音频处理方法、装置、设备及存储介质在审

专利信息
申请号: 202010873874.3 申请日: 2020-08-26
公开(公告)号: CN112289330A 公开(公告)日: 2021-01-29
发明(设计)人: 王柯柯;李为 申请(专利权)人: 北京字节跳动网络技术有限公司
主分类号: G10L21/003 分类号: G10L21/003;G10L25/18;G10L25/24;G10L25/27;G10L25/45
代理公司: 北京开阳星知识产权代理有限公司 11710 代理人: 王雪
地址: 100041 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开实施例涉及一种音频处理方法、装置、设备及存储介质,其中该方法包括:获取变调音频的频谱和频谱包络线;获取变调音频对应的变调前音频的频谱包络线;基于变调前音频的频谱包络线与变调音频的频谱包络线之间的比例关系,对变调音频的频谱进行修正,得到修正后频谱;基于修正后频谱确定修正后音频。本公开能够在音频变调之后改善音色变化,明显提升声音的自然度。
搜索关键词: 一种 音频 处理 方法 装置 设备 存储 介质
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010873874.3/,转载请声明来源钻瓜专利网。

同类专利
  • 语音传输方法、终端和计算机可读存储介质-202210364802.5
  • 颜蓓 - 中兴通讯股份有限公司
  • 2022-04-08 - 2023-10-24 - G10L21/003
  • 本发明公开了语音传输方法、终端和计算机可读存储介质,通过获取第一终端的语音信号,提取语音信号的特征信息,通过电路交换域发送特征信息至第二终端,通过分组交换域传输语音信号至第二终端,以使得在网络参数满足预设条件的情况下,第二终端根据电路交换域收到的特征信息对分组交换域收到的语音信号进行修复,并输出修复后的语音信号。基于此,本发明具备很大的灵活性,当网络信号好的时候,可以不需要进行修补和修复,当网络信号衰落时,自动启动修复,用户根本感觉不到因网络信号回落对于通话音质的影响。
  • 基于安卓系统的车载音频渲染方法、装置及设备-202310802291.5
  • 邱渝;刘沛鑫;盛佳鹏;苏津立 - 重庆长安汽车股份有限公司
  • 2023-06-30 - 2023-10-13 - G10L21/003
  • 本申请公开了一种基于安卓系统的车载音频渲染方法、装置及设备,具体基于安卓系统完成以下方法的步骤:获取车辆信息;根据所述车辆信息,确定至少一个车辆运行事件的事件标识信息;根据预设的映射关系,确定所述至少一个车辆运行事件的事件标识信息对应的音频数据及其音频渲染策略;其中,所述映射关系包括所述事件标识信息、所述音频渲染策略和所述音频数据之间的映射关系;根据所述音频渲染策略对所述音频数据进行渲染处理,得到目标音频数据;输出所述目标音频数据。如此,通过安卓系统实现的车载音频渲染处理,不受音频数据类型约束,能够缩短音频数据的传输链路,提高音频数据的处理效率,丰富车载音频的处理效果。
  • 音量调节方法、装置、系统、设备及存储介质-202210260687.7
  • 吕鹏 - 北京字跳网络技术有限公司
  • 2022-03-16 - 2023-09-22 - G10L21/003
  • 本公开涉及一种音量调节方法、装置、设备及存储介质。其中,音量调节方法包括:在音频播放通道由第一通道切换至第二通道时,获取第一通道的第一音量参数和第二通道的第二音量参数;在第一音量参数大于第二音量参数时,增大第二音量参数;基于增大后的第二音量参数,播放音频。根据本公开实施例,在音频播放通道由第一通道切换至第二通道时,若第一通道的音量参数大于第二通道的音量参数,可增大第二通道的音量参数,例如,在观众上麦后音频播放通道由媒体音乐通道切换至通话通道时,若媒体音乐通道的音量参数大于通话通道的音量参数,可增大通话通道的音量参数,以改善切换通道之后声音较小的问题,从而提高用户的直播体验。
  • 调节音频信号的方法、装置、设备和存储介质-202011199552.1
  • 张在东 - 北京百度网讯科技有限公司
  • 2020-10-30 - 2023-09-22 - G10L21/003
  • 本申请公开了一种调节音频信号的方法、装置、设备和存储介质,应用于智能语音领域和云计算领域。具体实现方案为:获取当前环境中的测试音频信号;确定在当前环境中测试音频信号的混响时间与频率之间的第一关系;以及根据第一关系调节待输出音频信号的增益与待输出音频信号的频率之间的第二关系,以调节待输出音频信号的音质。
  • 一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法-202010922366.X
  • 杨耀根;张东 - 中山大学
  • 2020-09-04 - 2023-09-05 - G10L21/003
  • 本发明涉及语音合成,语音转换领域,更具体地,涉及一种基于双声纹特征向量和序列到序列建模的多对多语音转换方法。本发明用多说话人的语音合成技术生成大量的平行预料,这为模型的训练提供了极大的方便。然后使用序列到序列的神经网络对输入的源说话人特征建模映射到目标说话人特征。为了实现多对多的语音转换,本发明使用说话人验证任务的模型产生表征说话人身份的声纹特征向量。源说话人和目标说话人的声纹特征向量作为辅助信心加入序列到序列的模型中去。经过模型训练测试,本发明能够取得不错的效果。
  • 一种便携式激励器-201811278476.6
  • 赵永吉 - 比亚迪股份有限公司
  • 2018-10-30 - 2023-09-05 - G10L21/003
  • 为解决现有技术中激励器对于高频噪声不能起到优化的作用的问题,本发明提供了一种便携式激励器。包括信号采集装置、处理发生器和声音播放装置;信号采集装置用于采集声环境中的噪声;处理发生器用于获取所述信号采集装置采集的噪声,并根据所述噪声生成分谐波信号;声音播放装置用于输入所述分谐波信号,播出可与所述声环境中的噪声相融合,以形成融合和声的降噪构造声音。本发明提供的便携式激励器,其无需考虑噪声源的具体形式,只要将便携式激励器置于噪声源附近,可以改善音质、音色、降低声音的尖锐度,改善声环境的声品质。该便携式激励器易于实现,操作简单,且不受环境限制,只要将其置于需要进行噪声消除的声环境中即可。
  • 一种骨传导耳机失真音质的矫正方法-202310657459.8
  • 王波涛;赵晶晶;王相焜;陈聪实 - 北京工业大学
  • 2023-06-05 - 2023-09-01 - G10L21/003
  • 一种骨传导耳机失真音质的矫正方法,属于骨传导耳机技术领域,基本思路是将骨传导耳机失真语音的矫正看作一个非线性建模问题,首先对语音进行分帧,利用语音编码器获取每帧语音的编码参数,以及语音的编码结果。利用神经网络的非线性映射能力,将骨传导耳机语音参数作为网络输入,正常语音参数作为网络输出对网络进行训练。利用训练好的网络,映射得到骨传导耳机语音矫正后的编码参数,将矫正参数与骨传导耳机编码结果输入到译码器,生成矫正语音,实现对骨传导耳机失真音质的矫正。本发明可提高骨传导耳机失真语音的清晰度和可懂度,对人类的社会生活、救援行动和军事活动都有着长远的意义。
  • 一种基于稀疏分解的齿音抑制方法-202310102948.7
  • 甘涛;吴嘉鑫;罗瑜;何艳敏 - 电子科技大学
  • 2023-02-03 - 2023-08-25 - G10L21/003
  • 本发明属于数字音频处理技术领域,具体提供一种基于稀疏分解的齿音抑制方法,用以解决现有齿音抑制方法由于没有对齿音和有用语音进行细粒度的区分、导致在抑制齿音时带来可感知的有用语音信息损失的问题。本发明包括齿音字典构建和齿音抑制两个阶段,该方法提取训练齿音音频帧的频谱,将齿音频率段的频谱幅度数据作为训练数据,采用稀疏字典训练方法,训练生成齿音字典,在此字典上,对提取的测试音频数据以帧为单位进行稀疏分解,利用残差矢量的能量来确定分解的原子数目,并根据分解系数的大小对齿音和有用语音进行了细粒度区分,同时通过保留残差信号的方式来去除齿音成分,从而在保持原语音信息的基础上,有效地抑制了音频中的齿音。
  • 一种声音修饰方法、装置、电子设备和存储介质-202310437459.7
  • 李明;石磊;朱马 - 上海艾为电子技术股份有限公司
  • 2023-04-21 - 2023-07-28 - G10L21/003
  • 本申请公开了一种声音修饰方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为获取原始声音信号;将原始声音信号进行分频处理,得到N路第一子频带;针对每路第一子频带生成谐波信号;将谐波信号与第一子频带进行叠加处理,得到N路分别与每个第一子频带对应的第二子频带;将N路第二子频带进行叠加处理,得到修饰后的声音信号。通过上述处理,使得增加的谐波成分符合心理声学原理,给声音增加了泛音,实现了声音的音质和音色的改善,增加了声音的空间感。
  • 适用于音频系统的声处理运算服务器及声处理运算方法-202310416532.2
  • 宁海悦;颜子力;高康瑜 - 中国传媒大学
  • 2023-04-19 - 2023-07-14 - G10L21/003
  • 本发明提供一种适用于音频系统的声处理运算服务器及声处理运算方法,首先根据预获取的用户意向数据选择适用于声音数据的声处理插件,并根据声处理插件判断是否需要对所述声音数据进行模数/数模转换;若需要对声音数据进行模数/数模转换,则根据声音数据的时钟频率将所述声音数据转换为离散的数字信号点;根据数字信号点以及所述声处理插件进行与声处理插件相对应的调音计算以生成调音信号;而后将调音信号转换为模拟信号;再将模拟信号传输至所述音频系统以完成对模拟形式的声音数据进行数字化处理,从而使大型音频系统使用数字插件进行扩展成为可能,并且可以脱离计算机独立使用。
  • 一种基于移动终端的实时EQ曲线形成方法-202310468529.5
  • 吴可测;朱正辉;赵定金;明德 - 广东保伦电子股份有限公司
  • 2023-04-26 - 2023-07-11 - G10L21/003
  • 本发明公开一种基于移动终端的实时EQ曲线形成方法,包括如下步骤:按照频率从小到大将频段依次划分第一频段、第二频段和第三频段,分别确定第一频段、第二频段和第三频段作为EQ曲线横坐标的初始频率点数量;根据所述移动终端的分辨率确定出EQ曲线的宽度,根据宽度从第三频率点数量中再次筛选频率点,得到最终第三频率点数量;按所述第一频率点数量、第二频率点数量和最终第三频率点数量的总频率点数量,以频率点为横坐标、频率点对应的音频幅度作为纵坐标,采用多边形方法绘制EQ曲线,从而得到EQ曲线。本发明能够快速生成EQ曲线,并且由于计算量更小,能够更快地、流畅显示出EQ曲线,形成的EQ曲线更加连贯、平滑。
  • 音频处理方法、装置及介质-202111593318.1
  • 陈朝喜;孙鹏达 - 北京小米移动软件有限公司
  • 2021-12-23 - 2023-06-27 - G10L21/003
  • 本公开涉及一种音频处理方法、装置及介质,属于电子技术领域,能够抑制超声波对传声器的干扰,避免传声器获取到的语音信号中出现杂音。该音频处理方法,包括:获取终端设备的超声波发射状态和传声器工作状态;基于所获取的超声波发射状态和传声器工作状态,确定所述终端设备当前是否执行超声波发射且传声器处于工作状态;若确定所述终端设备当前执行所述超声波发射且所述传声器处于工作状态,则按照预设策略来抑制超声波对所述传声器的干扰。
  • 音频处理方法、装置、存储介质及电子设备-201810922856.2
  • 陈岩 - OPPO广东移动通信有限公司
  • 2018-08-14 - 2023-06-20 - G10L21/003
  • 本申请公开了一种音频处理方法、装置、存储介质及电子设备。该方法包括:获取待处理音频数据,所述待处理音频数据包括预设的左声道信号以及右声道信号;将预设的左声道信号以及右声道信号分别通过盲源分离模型分离出对应声道的人声信号与背景声信号;将预设的左声道信号以及右声道信号,分别与对应声道的人声信号与背景声信号按预设方式进行合成,以获得处理后的左声道信号以及右声道信号。本申请实施例通过盲源分离模型分离出人声信号与背景声信号,可以降低运算量,提高设备的数据处理速度,且利用分离出的人声信号、背景声信号与原信号进行结合,从而可以获得听觉效果更好的音频信号。
  • 一种多设备的音效算法共享方法、装置、设备及存储介质-202211725712.0
  • 王冕 - 广东以诺通讯有限公司
  • 2022-12-30 - 2023-05-12 - G10L21/003
  • 本发明涉及一种多设备的音效算法共享方法、装置、设备及存储介质。本发明所述的方法包括以下步骤:智能终端获取当前处于连接关系的其他智能设备内的音效算法;智能终端根据用户发起的音效处理请求,确定目标音效算法,以及目标音效算法所在的目标智能设备;智能终端基于目标音效算法,构建通讯处理管道,其中,通讯处理管道包括连通智能终端与目标智能设备的音频输入通路;智能终端将待处理的音频数据通过音频输入通路,发送给目标智能设备;目标智能设备通过目标音效算法,对待处理的音频数据处理后,得到音效处理后的音频数据。本发明所述的共享方法使得用户可根据自己的需求选择偏好的音效算法处理模式,不用局限于当前设备内的音效算法。
  • 通话音质优化方法、移动终端及存储介质-202111329259.7
  • 许梅 - 中兴通讯股份有限公司
  • 2021-11-10 - 2023-05-12 - G10L21/003
  • 本发明实施例提供一种通话音质优化方法、移动终端及存储介质,属于通讯技术领域。该方法包括:获取语音信号并检测所述语音信号的信号强度;当所述信号强度小于预设的信号强度阈值时,对无线设备的编码功能进行解禁;基于解禁后的所述编码功能进行信号编码。本发明实施例的技术方案能够在使用无线设备通话时,对通话音质进行改善,从而改善用户对于无线设备的使用体验。
  • 一种低音增强方法、装置和音频输出设备-202111274633.8
  • 石磊;朱马;吉亚敏 - 上海艾为电子技术股份有限公司
  • 2021-10-29 - 2023-05-05 - G10L21/003
  • 本发明提供一种低音增强方法、装置和音频输出设备,首先对待处理音频数据进行处理得到高通滤波信号,再对所述待处理音频数据进行处理得到带通滤波信号,然后再根据带通滤波信号的基频频点的幅值生成与所述带通滤波信号对应的虚拟低音,从而对于不同幅值的基频频点产生对应的虚拟低音,从而使得用户接收到的音频数据中的低频听感更好,冲击力更足,动态更好,提高了音频设备输出的音频信息的音频质量。
  • 语音变调方法、存储介质及电子设备-202211606702.5
  • 宋明辉;阎张懿;王红丽;韦莎丽 - 深圳市中科蓝讯科技股份有限公司
  • 2022-12-13 - 2023-04-18 - G10L21/003
  • 本发明涉及语音变调技术领域,公开了一种语音变调方法、存储介质及电子设备。语音变调方法包括:获取语音信号,每帧语音信号包括多个语音采样点,确定目标语音采样点的至少一类目标相位信息,目标语音采样点为多个语音采样点中的一个语音采样点,根据目标相位信息平滑调整目标语音采样点的幅值,得到变调语音信号。本实施例能够根据目标语音采样点的目标相位信息平滑调整目标语音采样点的幅值,如此可避免帧间不连续的现象出现,会使得变调语音信号变得更为自然。
  • 一种车载混音方法及装置-201911051264.9
  • 尚平 - 惠州华阳通用电子有限公司
  • 2019-10-31 - 2023-04-18 - G10L21/003
  • 本发明提供车载混音方法及装置,方法包括:S1、确定最低可闻音量值V0与系统最大音量值Vmax的关系式;S2、标定不同车内环境下的最低可闻音量值V0;S3、获取当前车内噪声值N;S4、根据所述当前车内噪声值N确定第一参数P的当前值Pm;S5、确定主通道音量预衰减幅度A;S6、判断是否接收到混音指令,是则获取主通道当前音量值Vc,否则返回步骤S3;S7、根据所述主通道当前音量值Vc、主通道音量预衰减幅度A确定衰减策略;S8、根据所述衰减策略,对主通道、副通道进行混音。本发明提高了混音效果,改善了用户体验。
  • 语音处理方法及装置、计算机可读存储介质、电子设备-202010115650.6
  • 黄振胜 - 网易(杭州)网络有限公司
  • 2020-02-25 - 2023-04-14 - G10L21/003
  • 本公开涉及音频处理技术领域,提供了一种语音处理方法、装置、计算机可读存储介质及电子设备,该语音处理方法包括:获取与待恢复语音信息对应的多个语音恢复包,其中各语音恢复包包括待恢复语音信息中的语音包和针对待恢复语音信息中丢失的语音帧生成的语音补偿包;对各语音恢复包进行发声分析和静音检测,以得到与各语音恢复包对应的第一失真信息和第二失真信息;根据与各语音恢复包对应的第一失真信息和第二失真信息确定目标语音恢复包,并将目标语音恢复包对应的语音补偿包作为目标语音补偿包。本公开的语音处理方法提高了恢复语音包的音频质量,提升了用户体验。
  • 一种含共振单元的带隙可调减振超材料及其制作方法-202211546948.8
  • 孙齐东;陶然;周胜 - 北京理工大学
  • 2022-12-05 - 2023-04-07 - G10L21/003
  • 本发明公开的一种含共振单元的带隙可调减振超材料,属于振动控制技术领域。本发明由具有局域共振特性的胞元在某一方向阵列排布。胞元为负泊松比结合弹簧振子结构,主要由外部负泊松比结构外框架、连接处S形弹簧结构、圆柱形振子、圆环组成。圆柱形振子嵌入负泊松比结合弹簧振子结构中心位置圆环内,并通过S形弹簧与负泊松比结构外框架的对称中心线处相连接。内部S形弹簧结构和圆环结构通过刚性连接。圆环结构和圆柱形振子采用过盈配合。负泊松比结构外框架为聚醚醚酮、聚乳酸、铝合金等低密度材料,圆柱形振子采用高密度金属纯钨。本发明在带隙范围内振动沿着某预定方向的波传播被禁止,实现减振。
  • 音频数据处理方法、装置、设备和存储介质-202011461369.4
  • 袁俊;陈昌滨;王俊超;聂志朋 - 北京百度网讯科技有限公司
  • 2020-12-09 - 2023-04-07 - G10L21/003
  • 本申请公开了音频数据处理方法、装置、设备和存储介质,涉及语音技术、深度学习等人工智能技术领域。具体实现方案为:获取待处理音频数据的原始特征张量;根据原始特征张量与可学习的权值张量,获取待处理特征张量和关键特征张量;分别对待处理特征张量和关键特征张量中的目标维度进行维度变换,获取待压缩特征张量和候选关键特征张量;根据待压缩特征张量和候选关键特征张量,获取权重矩阵;根据权重矩阵和候选关键特征张量,获取目标特征张量,对目标特征张量进行处理,获取压缩特征张量;将压缩特征张量输入神经网络进行处理,获取待处理音频数据的处理结果。由此,在保证信息压缩质量的同时提高信息压缩效率,提高后续语音处理效果。
  • 一种适用于汽车智能仪表的软件混音方法-202211399495.0
  • 贾廷栋 - 南京市德赛西威汽车电子有限公司
  • 2022-11-09 - 2023-03-28 - G10L21/003
  • 本发明涉及一种适用于汽车智能仪表的软件混音方法,包括将需要进行混音播放的第一声音数据和第二声音数据分别分解为多段第一数据单元和多段第二数据单元;预先配置第一DMA和第二DMA,第一DMA和第二DMA用于将第一声音数据和第二声音数据搬运到声音输出接口;第一DMA和第二DMA交替将第一声音数据的一段第一数据单元和第二声音数据的一段第二数据单元的混合声音进行搬运输出;直到第一声音数据和第二声音数据全部搬运输出完成。本发明在任意不具备额外声音处理硬件的智能仪表上均能实现任意通道的声音混合。且本方法实时性高,声音播放延时上限可控,多声音同时播放时不会发生打断、排队等情况,用户体验良好。
  • 提升个性化合成语音质量的方法-202010163515.9
  • 丁少为;关海欣 - 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司
  • 2020-03-11 - 2023-03-21 - G10L21/003
  • 本发明涉及语音处理技术领域,提供了一种提升个性化合成语音质量的方法,包括以下步骤:S100采集用户语音作为原始语音数据;S200对原始语音数据进行降噪处理;S300利用降噪后的语音数据,通过模型转换将基底模型生成个性化语音模型;S400采用所述个性化模型与用户语音进行合成,得到个性化合成语音。本专利的提升个性化合成语音质量的方法,提通过对用户采集数据进行离线降噪处理,提升个性化语音模型质量,之后采用该质量较好的个性化语音模型对用户语音进行个性化语音合成的模型训练,达到提升个性化合成语音质量的目的。
  • 音频处理方法、装置、计算设备及介质-202211358913.1
  • 张龙;陈功;阮良;陈耀斌 - 杭州网易智企科技有限公司
  • 2022-11-01 - 2023-02-24 - G10L21/003
  • 本公开提供了一种音频处理方法、装置、计算设备及介质。通过响应于针对待处理音频序列的音量调整操作,基于待处理音频序列中目标音频帧对应的当前能量分布信息和历史能量分布信息,确定目标音频调整信息,以便基于目标音频调整信息实现音频处理。由于当前能量分布信息对应的是用户正在收听的音频帧,而历史能量分布信息对应的是用户过往收听过的音频帧,这些都是已经被用户所感知、接受并认可的,从而使得通过当前能量分布信息和历史能量分布信息确定出目标音频调整信息,并基于目标音频调整信息来实现对音频序列的调整,是可以满足用户的个性化听音需求的,进而使得本公开所提供的方案可以为用户提供自适应的个性化音频调整方式。
  • 变声处理方法、存储介质、芯片及电子设备-202211329941.0
  • 宋明辉;阎张懿;王红丽;韦莎丽 - 深圳市中科蓝讯科技股份有限公司
  • 2022-10-27 - 2023-01-24 - G10L21/003
  • 本发明涉及变声处理技术领域,公开一种变声处理方法、存储介质、芯片及电子设备。方法包括:获取变声频域信息,对变声频域信息进行归一化处理,得到归一化频域信息,归一化频域信息包括共振峰归一化后的频域信息,对归一化频域信息进行修正处理,得到修正频域信息,修正频域信息包括共振峰被修正后的频域信息,根据修正频域信息及变声频域信息的相位信息,生成时域语音信息。本实施例不仅能够对语音信号在整体上进行变声处理,而且还能够归一化共振峰和在归一化后的共振峰上进行修正,从而能够得到新的共振峰,使得变声后的语音信号更加准确和自然。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top