[发明专利]一种自动混音的方法、混音器、存储介质及电子设备在审

申请号：	202211471323.X	申请日：	2022-11-23
公开（公告）号：	CN115862663A	公开（公告）日：	2023-03-28
发明（设计）人：	周彦琼;乌尔里希·哈杰	申请（专利权）人：	音王电声股份有限公司
主分类号：	G10L21/0316	分类号：	G10L21/0316;H03G3/30;G10L25/51;H04R3/00
代理公司：	宁波甬致专利代理有限公司 33228	代理人：	费玲玲
地址：	315100 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及混音技术领域，具体而言，涉及一种自动混音的方法、混音器、存储介质及电子设备，包括如下步骤：步骤S1、获取第i个样本值；步骤S2、得到输入值；步骤S3、对比输入值和存储值，判断输入值与存储值的大小；步骤S4、得到第一输出值，并将第一输出值替换存储值；步骤S5、得到第二输出值，并将第二输出值替换存储值；步骤S6、将第一输出值或第二输出值输出至外部音箱以使外部音箱输出声音，控制采集模块采集下一时刻的第i+1个样本值；直接对单个样本值进行平方并输出，减少了对内存的损耗，在运行过程中反复调用输出值，使其作为下一个样本值计算中的存储值，实现了递归的过程，并通过控制样本值的激活和释放，消除了杂音干扰。
搜索关键词：	一种自动方法混音器存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于音王电声股份有限公司，未经音王电声股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202211471323.X/，转载请声明来源钻瓜专利网。

上一篇：自适应动态跨链共识机制选择的方法
下一篇：一种高适应性的直连式光伏发电水电解制氢系统

同类专利

语音处理方法、装置、通信设备及可读存储介质-202211562088.7
发明人：陈亚楠;张世磊;高莹莹 -专利权人：中国移动通信有限公司研究院;中国移动通信集团有限公司
申请日： 2022-12-07 - 公布日： 2023-10-20 - 主分类号： G10L21/0316
摘要：本申请公开了一种语音处理方法、装置、通信设备及可读存储介质，属于数据处理技术领域。该语音处理方法包括：获取待处理的带噪语音信号；根据带噪语音信号的幅度谱，确定带噪语音信号的理想比例掩膜值，并确定带噪语音信号中的语音信号的幅度谱；利用基音滤波器对带噪语音信号的幅度谱进行谐波筛选，获得第一谐波特征，以及利用基音滤波器对带噪语音信号中的语音信号的幅度谱进行谐波筛选，获得第二谐波特征；根据第一谐波特征、第二谐波特征以及带噪语音信号对应的目标说话人的声纹特征，确定复数理想比例掩膜值；利用所述复数理想比例掩膜值，获得带噪语音信号中的降噪后的语音信号。由此，可以准确获得降噪后的语音信号。

一种平衡降噪量和语音音质的单通道语音增强方法-202310707811.4
发明人：汪大涵;卢晶;朱长宝;胡玉祥;程光伟;刘松;朱天一;张哲会;刘磊 -专利权人：南京大学
申请日： 2023-06-15 - 公布日： 2023-10-20 - 主分类号： G10L21/0316
摘要：本发明公开了一种平衡降噪量和语音音质的单通道语音增强方法。该方法步骤如下：(1)将含噪信号变换到时频域，并利用PEFAC方法估计基频；(2)计算后验信噪比，根据基频估计在倒谱域对其平滑，进而利用固定先验的方法估计后验语音存在概率；(3)根据后验语音存在概率估计噪声功率谱密度；(4)更新后验信噪比，计算语音功率谱密度的最大似然估计；(5)根据基频估计在倒谱域平滑语音功率谱密度，并增强基频，得到先验信噪比的估计；(6)利用自适应先验的方法再次估计后验语音存在概率；(7)计算基于广义伽马先验的对数谱幅度增益，并结合后验语音存在概率导出基于语音存在不确定性的增益估计；(8)增强语谱并变换回时域，得到增强信号。

单耳语音增强方法、装置、计算机设备及存储介质-202310714641.2
发明人：张旭龙;王健宗;程宁;赵金凤 -专利权人：平安科技（深圳）有限公司
申请日： 2023-06-15 - 公布日： 2023-10-17 - 主分类号： G10L21/0316
摘要：本发明公开了一种单耳语音增强方法，该方法包括获取待处理音频；对所有待处理音频进行傅里叶变换，得到与各待处理音频对应的幅度谱，以及与各待处理音频对应的相位谱；通过预设幅度调整模型对幅度谱进行幅度调整，得到调整幅度谱；通过预设相位调整模型对调整幅度谱和相位谱进行相位调整，得到调整相位谱；获取预设声码器，通过预设声码器对调整幅度谱和调整相位谱进行音频转换，得到与各待处理音频对应的增强音频。本发明通过对幅度谱和相位谱的调整将空间信息注入到单耳语音增强模型中，解决了金融或保险等业务中无法从单声道中提取空间信息，实现了金融或保险等业务中低信噪比条件下重构更高可解性和语音质量增强。

语音增益控制方法、装置、语音控制设备及存储介质-202310920929.5
发明人：张洪福 -专利权人：迈普通信技术股份有限公司
申请日： 2023-07-25 - 公布日： 2023-09-08 - 主分类号： G10L21/0316
摘要：本申请提供一种语音增益控制方法、装置、语音控制设备及存储介质，涉及语音信号处理技术领域。该方法包括：根据历史统计周期内多帧语音信号的第一音量参数，确定当前统计周期的目标增益等级；根据当前统计周期内每帧语音信号的第二音量参数和目标增益等级，对每帧语音信号的第二音量参数进行调整。本申请可以提高语音信号的音量增益控制的稳定性。

音频处理方法和音频处理设备-202310410915.9
发明人：方博伟 -专利权人：阿里巴巴（中国）有限公司
申请日： 2023-04-13 - 公布日： 2023-08-08 - 主分类号： G10L21/0316
摘要：本公开涉及一种音频处理方法和音频处理设备。例如可以提供功能开关，以便由用户选择是否开启主讲人模式。响应于主讲人模式被开启，仅在主讲人讲话时，对所采集到的待处理音频数据进行语音增益处理。判断待处理音频数据的语音特征与主讲人的语音特征是否相匹配。在判定相匹配的情况下，对待处理音频数据进行语音增益处理。由此，在例如主讲人模式下，通过引入说话人识别，对主讲人的语音进行增益，而避免对非主讲人的语音进行增益，提升音视频沟通的体验。

一种音频信号处理方法、装置、设备及介质-202310311891.1
发明人：戚成杰 -专利权人：深圳万兴软件有限公司
申请日： 2023-03-21 - 公布日： 2023-08-01 - 主分类号： G10L21/0316
摘要：本申请实施例公开一种音频信号处理方法包括：获取第一音频数据，所述第一音频数据包括多个第一音频数据片段，所述第一音频片段包括多个第一音频数据帧，预处理所述多个第一音频数据片段得到多个第二音频数据片段，所述第二音频片段包括多个第二音频数据帧，基于所述多个第一音频数据片段一一对应的多个功率谱和无声条件确定所述多个第二音频片段中的预估噪声片段和噪声阈值，基于所述每一第二音频数据片段的多个第二音频数据帧和所述噪声阈值降噪处理得到多个第三音频数据片段，所述第三音频片段包括多个第三音频数据帧，对每一所述第三音频数据片段中的每一第三音频数据帧进行响度增益操作得到目标音频数据。

一种音频处理方法、装置、设备和介质-202310492332.5
发明人：马路;魏伟 -专利权人：北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司
申请日： 2023-05-04 - 公布日： 2023-07-21 - 主分类号： G10L21/0316
摘要：本发明实施例公开了一种音频处理方法、装置、设备和介质，其中，方法包括：获取待处理音频信号对应的初始幅度谱和初始相位谱；将初始幅度谱输入到经过训练的目标混响参数估计模型中，得到混响消除参数；根据混响消除参数和初始幅度谱，预估待处理音频信号的晚期混响功率谱；根据晚期混响功率谱确定音频处理后的目标音频信号的目标幅度谱中各频点的增益，并基于增益和初始相位谱对待处理音频信号进行音频处理，得到目标音频信号。本发明实施例的技术方案，解决了利用线性滤波器的方法线性预测音频信号晚期谱再减去混响尾部的去混响效果不佳的问题，可以更准确的估计有混响的音频的晚期谱，从而提升去混响效果。

自适应语音增强方法和电子设备-201880002760.2
发明人：朱虎;王鑫山;李国梁;曾端;郭红敬 -专利权人：深圳市汇顶科技股份有限公司
申请日： 2018-11-28 - 公布日： 2023-07-21 - 主分类号： G10L21/0316
摘要：本申请部分实施例提供了一种自适应语音增强方法和电子设备。自适应语音增强方法，包括：在接收到语音信号后，根据语音信号，计算语音信号的当前帧的功率(101)；将当前帧的功率与前一帧的噪声功率进行比较(102)；根据比较的结果和前一帧的噪声功率，获取当前帧的噪声估计值(103)；根据噪声估计值，获取纯净语音信号(104)。采用本申请的实施例，使得对于噪声的估计更加准确，且降低了算法的复杂度，从而有利于对语音信号进行增强，改善人的听觉感知质量。

使用自适应平滑的对话增强-202080069218.6
发明人：余雪梅 -专利权人：杜比实验室特许公司
申请日： 2020-08-26 - 公布日： 2023-06-13 - 主分类号： G10L21/0316
摘要：一种增强音频信号中的对话可懂度的方法，其包括：确定音频内容包含语音内容的语音置信度分数；响应于所述语音置信度分数，确定所述音频内容包含音乐相关内容的音乐置信度分数；及应用所述音频信号的所选择的频带的用户所选择的增益，以获得对话增强音频信号。所述用户所选择的增益通过自适应平滑算法进行平滑，所述平滑算法中的过去帧的影响由平滑因子确定，所述平滑因子响应于所述音乐置信度分数而计算，且针对具有相对较高音乐置信度分数的内容具有相对较高的值，且针对具有相对较低音乐置信度分数的语音内容具有相对较低的值，以便增加过去帧对音乐相关内容的对话增强的影响。

语音信号的信号增强方法、装置、设备及存储介质-202310194932.3
发明人：邓刚;邱彬涵 -专利权人：深圳市长丰影像器材有限公司
申请日： 2023-02-23 - 公布日： 2023-05-19 - 主分类号： G10L21/0316
摘要：本发明涉及音频处理领域，公开了一种语音信号的信号增强方法、装置、设备及存储介质。该方法包括：获取第一频域信号并记录相角；获取第一频域信号的前40帧计算初始噪声方差；若初始噪声方差存在，则根据初始噪声方差生成第一频域信号对应的先验信噪比以及第一频域信号对应的后验信噪比；根据先验信噪比、后验信噪比计算第一频域信号对应的系统函数以及第一频域信号对应的语音存在概率；根据系统函数以及语音存在概率计算修正系统函数；根据修正系统函数以及相角计算修正语音增强谱；对修正语音增强谱进行傅里叶逆变换，得到第二时域信号；根据预设权系数、第二时域信号计算目标语音信号。本发明提升了语音信号的信号增强幅度。

信号的增益值调节方法、装置和声音信号的处理方法-202211663652.4
发明人：王志轩;包远鑫;赵勇 -专利权人：杭州微纳核芯电子科技有限公司
申请日： 2022-12-23 - 公布日： 2023-04-11 - 主分类号： G10L21/0316
摘要：本申请涉及一种信号的增益值调节方法、装置和声音信号的处理方法，其中，该信号的增益值调节方法包括：获取目标信号；识别目标信号中是否存在目标事件；若是，于目标事件持续期间内对目标信号的增益值进行调节。其能够实现一种基于目标事件触发的联动机制，在得益于增益控制提高目标事件的量化精度的同时，降低整体使用时间上对于信号幅度的操作次数，进而降低无效功耗以及整体使用时间的平均功耗，进而能够兼顾高精度和低功耗的需求。

一种语音增强方法、装置、计算机设备以及存储介质-202211458680.2
发明人：谢鹏 -专利权人：湖南国科微电子股份有限公司
申请日： 2022-11-21 - 公布日： 2023-04-04 - 主分类号： G10L21/0316
摘要：本发明公开了一种语音增强方法、装置、计算机设备以及计算机可读存储介质，涉及计算机应用技术领域，其中方法包括：获取音视频数据，其中所述音视频数据包含图像信息和语音信号；确定所述语音信号中是否存在人声；若存在所述人声，确定所述图像信息中是否存在对应的面部信息；若存在所述面部信息，则根据所述面部信息调整噪声增益因子；利用所述噪声增益因子抑制噪声得到增强的所述语音信号；相较于现有的增强语音的方法，本发明通过音视频信息结合实现语音增强的方法，避免受到环境噪声的影响，更好地抑制非稳态噪声，能更准确地识别语音信号，提高了语音的质量以及具有较高的鲁棒性。

音频帧处理方法、装置、电子设备及存储介质-202211168036.1
发明人：马路;魏伟 -专利权人：北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司
申请日： 2022-09-23 - 公布日： 2023-04-04 - 主分类号： G10L21/0316
摘要：本发明实施例公开了一种音频帧处理方法、装置、电子设备及存储介质，该方法包括：获取第一音频帧，确定所述第一音频帧对应的第一幅值增益；根据第二音频帧对应的第二幅值增益，对所述第一幅值增益进行平滑处理；和/或，根据第三音频帧对应的第三幅值增益，对所述第一幅值增益进行平滑处理；其中，所述第二音频帧为与所述第一音频帧相邻且位于所述第一音频帧之前的音频帧，所述第三音频帧为与所述第一音频帧相邻且位于所述第一音频帧之后的音频帧；基于平滑处理后的第一幅值增益，对所述第一音频帧的幅值进行调整，得到目标音频帧。通过本发明实施例的技术方案，解决了音频帧增益调整后导致的音频不连贯的问题，提高了音频的主观听觉质量。

一种自动混音的方法、混音器、存储介质及电子设备-202211471323.X
发明人：周彦琼;乌尔里希·哈杰 -专利权人：音王电声股份有限公司
申请日： 2022-11-23 - 公布日： 2023-03-28 - 主分类号： G10L21/0316
摘要：本发明涉及混音技术领域，具体而言，涉及一种自动混音的方法、混音器、存储介质及电子设备，包括如下步骤：步骤S1、获取第i个样本值；步骤S2、得到输入值；步骤S3、对比输入值和存储值，判断输入值与存储值的大小；步骤S4、得到第一输出值，并将第一输出值替换存储值；步骤S5、得到第二输出值，并将第二输出值替换存储值；步骤S6、将第一输出值或第二输出值输出至外部音箱以使外部音箱输出声音，控制采集模块采集下一时刻的第i+1个样本值；直接对单个样本值进行平方并输出，减少了对内存的损耗，在运行过程中反复调用输出值，使其作为下一个样本值计算中的存储值，实现了递归的过程，并通过控制样本值的激活和释放，消除了杂音干扰。

音视频设备自动调节音量的方法、手持设备和电视机-202211105866.X
发明人：姚远;党生;张军烽;张波;郭颂 -专利权人：深圳市优博讯科技股份有限公司
申请日： 2022-09-09 - 公布日： 2023-03-03 - 主分类号： G10L21/0316
摘要：本发明涉及音视频设备自动调节音量的方法、手持设备和电视机，包括以下步骤：判断是否检测到用户触发的切换音频视频操作信息；若是，采集音视频设备的第一音频信息；根据第一音频信息调节音视频设备的音量。本发明在几乎不增加产品成本的情况下增加了产品自动调节音量的功能，可以让用户在听音频和看视频时解放双手，增加了产品的便利性；尤其对于不便于调整音量大小的用户更加便利；而且播放不同音频视频时自动调节音量，可以很大程度上便利用户使用，提高用户体验。

用于使得能够进行音频缩放的装置、方法和计算机程序-202210819846.2
发明人： M·T·维勒尔莫;H·J·普拉卡;R·O·杰尔维宁;J·J·梅基宁 -专利权人：诺基亚技术有限公司
申请日： 2022-07-12 - 公布日： 2023-01-17 - 主分类号： G10L21/0316
摘要：本公开的示例涉及用于使得能够进行音频缩放的装置、方法和计算机程序。该装置可以包括用于以下操作的部件：针对音频信号确定在至少一个第一方向上的声能是否与在至少一个第二方向上的声能相差至少阈值量。该部件还可以用于基于在至少一个第一方向上的声能是否与至少一个第二方向上的声能相差至少阈值量来控制所提供的动态余量的量。

一种基于卷积和循环融合网络的语音增强方法-202211278482.8
发明人：程云苓;周琳;邓宇汐;王启瑞;曹焱翔;庄程浩;王天仪 -专利权人：东南大学
申请日： 2022-10-19 - 公布日： 2023-01-13 - 主分类号： G10L21/0316
摘要：本发明公布了一种基于卷积和循环融合网络的语音增强方法。训练阶段，对含噪语音和纯净语音分帧、加窗、短时傅里叶变换，提取含噪语音的对数幅度谱图，作为卷积和循环融合网络的输入特征，训练目标为理想比值掩膜矩阵，通过反向传播算法训练卷积和循环融合网络；测试阶段，卷积和循环融合网络根据测试含噪语音的对数幅度谱图，估计增强语音的理想比值掩膜矩阵，结合含噪语音的幅度谱和相位谱，得到增强语音的频谱，通过短时傅里叶逆变换，得到增强语音的时域信号。在低信噪比的情况下，语音增强效果显著，对噪声和混响具有很好的鲁棒性和泛化性。

语音增强方法和装置-202211073000.5
发明人：许成林;陈联武;张旭;任新蕾;郑羲光;张晨 -专利权人：北京达佳互联信息技术有限公司
申请日： 2022-09-02 - 公布日： 2022-11-29 - 主分类号： G10L21/0316
摘要：本公开关于一种语音增强方法和装置。该语音增强方法包括：获取待处理的含噪声的语音信号；将待处理的含噪声的语音信号的语音幅度谱划分为宽带幅度谱和高频幅度谱；对宽带幅度谱进行宽带增强处理，得到宽带增强幅度谱；对宽带增强幅度谱和高频幅度谱进行高频增强处理，得到高频增强幅度谱；对宽带增强幅度谱和高频增强幅度谱进行融合，根据融合结果得到待处理的含噪声的语音信号的全频带增强语音信号。本公开解决了全频带语音增强处理不能兼容宽带语音增强处理的问题。

音频处理方法、装置、电子设备和存储介质-202110107918.6
发明人：熊贝尔;朱一闻;曹偲;郑博;刘华平 -专利权人：杭州网易云音乐科技有限公司
申请日： 2021-01-27 - 公布日： 2022-07-19 - 主分类号： G10L21/0316
摘要：本申请提供一种音频处理方法、装置、电子设备和存储介质，该方法包括：获取干音音频中目标时间段的目标干音音频；根据该目标干音音频的全局能量特征和该目标干音音频对应的目标伴奏音频的全局掩蔽特征，确定伴奏音频对干音音频的目标掩蔽能力度量值；基于预先设置的伴奏对干音的掩蔽能力度量值与伴奏干音音量比的对应关系，确定上述目标掩蔽能力度量值对应的目标伴奏干音音量比，将伴奏音频与干音音频的音量比调节至目标伴奏干音音量比。本申请可以得到适合音乐作品的伴奏音频与干音音频的音量比，并将伴奏音频的音量与干音音频的音量调节至该音量比，节省用户的调音时间，调音过程简单并且调音效果好。

一种音频信号调控方法及扬声器系统-202210523440.X
发明人：张鹏锋 -专利权人：深圳市德康兴技术有限公司
申请日： 2022-05-13 - 公布日： 2022-07-08 - 主分类号： G10L21/0316
摘要：本发明公布了一种音频信号调控方法，方法包括：接入原始音频信号，将原始音频信号输入到后处理模块调节，得到第一音频信号；调节原始音频信号的增益，得到第二音频信号；滤除第二音频信号中的中、高频信号，得到第三音频信号；将第三音频信号均衡调校，得到第四音频信号；对第四音频信号进行动态范围控制，得到第五音频信号；对第五音频信号进行限幅，得到第六音频信号。一种扬声器系统，包括音源输入、多通道独立控制的数字信号处理器、功放、箱体，及第一扬声器单元、第二扬声器单元分别接收将第一音频信号、第六音频信号分别放大后的两音频信号。

一种基于嘈杂环境的语音增强方法及系统-202111547228.9
发明人：汪张龙;许东生;徐俊;许建威;邹月荣;郭清霞;魏述勇 -专利权人：广东讯飞启明科技发展有限公司
申请日： 2021-12-17 - 公布日： 2022-07-08 - 主分类号： G10L21/0316
摘要：本发明公开了一种基于嘈杂环境的语音增强方法及系统，属于语音领域，用于解决在嘈杂环境中无法对用户的语音数据进行准确性增强的问题，分贝计算模块、语音增强模块、特征提取模块和身份识别模块，所述身份识别模块用于对用户的身份进行识别，识别得到识别失败信号或记为语音增强对象，所述特征提取模块用于对语音增强对象的语音特征进行提取，提取得到语音特征包，所述分贝计算模块用于对语音增强对象所在地理位置的语音分贝进行计算，得到语音增强信号以及对应的分贝均值或语音正常信号以及对应的语音分贝值，所述语音增强模块用于对语音增强对象的语音进行增强，本发明方便在嘈杂环境中对用户的语音数据进行准确性增强。

一种音频处理方法及装置-201810884112.6
发明人：李东洋;孙永文;刘炳毓;王维佳;贾全升 -专利权人：航天信息股份有限公司
申请日： 2018-08-06 - 公布日： 2022-06-03 - 主分类号： G10L21/0316
摘要：本发明公开了一种音频处理方法及装置，所述方法包括对输入的音频信号进行处理，获得N个各自属于不同频段的输出音频信号，获取所述N个输出音频信号各自的能量参数，所述能量参数用于表征信号能量大小，然后，基于所述能量参数，在所述N个输出音频信号中选择能量最大的输出音频信号作为第一目标输出音频信号，最后，对所述第一目标输出音频信号进行功率放大处理，获得第二目标输出音频信号。该方案解决了现有技术中存在播报的输出音频的不清晰的技术问题，实现对能量集中的频段的音频进行放大后输出，提高播报的输出音频的清晰度，有利于播报内容有效传达的技术效果。

一种语音频信号的处理方法和装置-201910358522.1
发明人：刘泽新;苗磊 -专利权人：华为技术有限公司
申请日： 2014-06-03 - 公布日： 2022-05-10 - 主分类号： G10L21/0316
摘要：本发明实施例公开了一种恢复语音频信号噪声成分的方法及装置，方法包括：接收码流，解码所述码流得到语音频信号；根据所述语音频信号确定第一语音频信号；确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值；确定自适应归一化长度；根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值；根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。本发明实施例对于具有上升沿或下降沿的语音频信号，在恢复其噪声成分时不会造成语音频信号恢复噪声成分后的信号具有回声，提高语音频信号恢复噪声成分后的信号的听觉质量。

噪声重塑式数字自动增益控制系统、方法-202110892038.4
发明人：林义雄;陈浩铭 -专利权人：漳州立达信光电子科技有限公司
申请日： 2021-08-04 - 公布日： 2022-03-18 - 主分类号： G10L21/0316
摘要：本申请属于控制技术领域，提供一种噪声重塑式数字自动增益控制系统、方法，其中，噪声重塑式数字自动增益控制系统包括：麦克风、音量范围控制装置以及数字自动增益装置。所述麦克风接收声音信号并经由模拟‑数字转换器输出原始音频信号。所述音量范围控制装置输出包含预期音量范围的控制信号。所述数字自动增益装置的输入端连接至所述麦克风的输出端与所述音量范围控制装置的输出端。所述数字自动增益装置通过所述控制信号与前一阶由所述数字自动增益装置所输出的修正音频信号进行比较并输出维持在预期音量的范围内的这一阶所述修正音频信号。本申请能使音量调整过程较为平滑且迅速，避免因为调整音量所造成的不适感。

音频数据包的丢包恢复方法、装置、电子设备及存储介质-202111069091.0
发明人：周文欢 -专利权人：阿波罗智联（北京）科技有限公司
申请日： 2021-09-13 - 公布日： 2021-12-24 - 主分类号： G10L21/0316
摘要：本公开提供了一种音频数据包的丢包恢复方法、装置、电子设备及存储介质，涉及数据处理技术领域，尤其涉及语音技术、车联网、智能座舱和智能交通等人工智能领域，方案为：接收车载终端发送音频数据包，若音频数据包发生丢包，识别被丢掉的第一采样点集，第一采样点集中包括N个第一采样点，N为正整数；获取与第一采样点集相邻，且位于第一采样点集前面的第二采样点集和后面的第三采样点集，第二采样点集中包括至少N个第二采样点，第三采样点集中包括至少N个第三采样点；根据第二采样点采样的第一音频数据和第三采样点采样的第二音频数据，生成第一采样点的目标音频数据，并插入第一采样点的采样位置上。本公开中解决了车机的音频传输数据丢包问题。

一种基于人工智能的倍率确定方法、音量调节方法及装置-202110712666.X
发明人：高俊 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-06-25 - 公布日： 2021-12-21 - 主分类号： G10L21/0316
摘要：本发明实施例公开一种基于人工智能的倍率确定方法、音量调节方法及装置，该基于人工智能的倍率确定方法包括：获取第一音频数据，所述第一音频数据包括多帧音频信号；确定所述多帧音频信号的平均音量，得到第一音量；使用第一神经网络提取所述多帧音频信号中每帧音频信号的风格特征，得到第一风格特征向量；将所述第一风格特征向量输入第二神经网络，得到第二音量；根据所述第一音量和所述第二音量确定第一音量调节倍率。本发明实施例，可以提高用户体验。

语音信号的增强处理方法和装置-202110307449.2
发明人：陈泽华;吴俊仪;蔡玉玉;雪巍;杨帆;丁国宏;何晓冬 -专利权人：京东数字科技控股股份有限公司
申请日： 2021-03-23 - 公布日： 2021-12-03 - 主分类号： G10L21/0316
摘要：本公开涉及一种语音信号的增强处理方法和装置，涉及语音信号处理领域。该增强处理方法包括：提取待处理语音信号在时频域的幅度谱，作为待处理幅度谱，待处理语音信号中包含噪声；根据待处理语音信号的每一帧幅度谱及其相应的多帧历史幅度谱，确定待处理语音信号的幅度谱统计特征；根据待处理幅度谱、幅度谱统计特征，利用机器学习模型消除待处理幅度谱中的噪声，获取增强语音信号。

基于深度神经网络的音频处理方法、装置及存储介质-201910843603.0
发明人：陆丛希;李林锴;孙鸿程;刘心可 -专利权人：上海又为智能科技有限公司
申请日： 2019-09-06 - 公布日： 2021-09-14 - 主分类号： G10L21/0316
摘要：本申请公开了一种基于深度神经网络的语音处理方法，包括：获取基于深度神经网络的语音提取模型；接收具有语音部分和非语音部分的待处理的音频输入对象，所述音频输入对象包括一个或多个音频数据帧，并且所述一个或多个音频数据帧中的每个音频数据帧具有以预定采样间隔采样的一组音频数据，其中所述音频数据以时域数据格式表示；获取用户听力图谱以及与所述用户听力图谱相关联的一组用户增益补偿系数；以及将所述音频输入对象与所述一组用户增益补偿系数输入所述经训练的语音提取模型，从而得到所述经训练的语音提取模型输出的音频输出结果。

音源数据修复方法、装置、终端及存储介质-202110468827.5
发明人：曹伟鹏 -专利权人：广州繁星互娱信息科技有限公司
申请日： 2021-04-28 - 公布日： 2021-07-30 - 主分类号： G10L21/0316
摘要：本申请关于一种音源数据修复方法、装置、终端及存储介质，涉及音频数据处理技术领域。所述方法包括：获取目标音源数据；所述目标音源数据是从原始音源数据中去除指定类型声音后经过合成处理得到的合成音源数据；将所述目标音源数据与修复临界值进行比较，获取对应的振幅超过所述修复临界值的部分数据作为目标修复数据；所述修复临界值是基于合成音源数据样本得到的振幅值；基于所述修复临界值，对所述目标修复数据进行处理，获得修复后的所述目标音源数据。通过上述方法，将合成音源数据作为目标音源数据，对其中振幅过高或者过低的部分进行修正，从而抑制其中破音或者音质破损的部分，提高了合成音源数据的音质。

音频降噪方法及装置-201710661979.0
发明人：于锴;华洋;王若蕙 -专利权人：歌尔科技有限公司
申请日： 2017-08-04 - 公布日： 2021-07-30 - 主分类号： G10L21/0316
摘要：本发明实施例提供一种音频降噪方法及装置，该方法包括：获取待处理的音频信号，并对此音频信号进行滤波处理，以生成与音频信号等值反相的降噪控制信号。当将检测到此降噪控制信号中某一时间点的信号幅值满足限幅启动阈值时，则启动限幅器，对这一时间点之后的时间点对应的信号幅值进行衰减处理。由于发生啸叫所要到达的条件之一就是信号幅值达到一定数值，而减小第一时间点之后的时间点对应的信号幅值则可以破坏发生啸叫的条件，从而避免啸叫的发生。最后，再输出经过衰减处理的降噪控制信号，将此衰减处理后的降噪控制信号与噪声信号进行叠加以实现对待处理音频信号的降噪。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种自动混音的方法、混音器、存储介质及电子设备在审

专利文献下载