[发明专利]一种音频混音方法、装置、设备、存储介质及产品在审
申请号: | 202310679603.8 | 申请日: | 2023-06-08 |
公开(公告)号: | CN116546390A | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 陈爱文;曾泽兴;郑浩 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00 |
代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 徐濛 |
地址: | 511402 广东省广州市番禺区南村镇万博二路79号201房-203房、*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 方法 装置 设备 存储 介质 产品 | ||
本申请实施例提供了一种音频混音方法、装置、设备、存储介质及产品。本申请实施例提供的技术方案通过分别在伴奏抖动缓冲器和多个人声抖动缓冲器中获取伴奏音频帧和多个人声音频帧,根据各个人声音频帧相对于伴奏音频帧的同步情况进行对齐,并对对齐后的人声音频帧和伴奏音频帧进行混音处理得到混音结果,将各个人声音频帧向伴奏音频帧进行对齐,即使存在不同大小的人声抖动缓冲器,仍能正确将各个人声音频帧与伴奏音频帧对齐,有效提高音频混音效果。
技术领域
本申请实施例涉及音频处理技术领域,尤其涉及一种音频混音方法、装置、设备、存储介质及产品。
背景技术
随着智能设备和移动互联网的发展,越来越多的泛娱乐类应用都提供了唱歌功能,满足用户随时随地进行歌曲合唱的需求。而在歌曲合唱过程中,各路人声流与伴奏流是否同步直接决定了用户的使用体验。
目前,人声流与伴奏流的同步一般是在用户端通过网络时间协议(NTP)对齐伴奏,然后通过网络发送给混音服务器进行混音后再转发给观众。但是不同用户端的网络情况各不相同,混音服务器为每路流维护的抖动缓冲器也各不相同,在混音服务器取帧进行混音时容易出现人声帧与伴奏帧不对齐,导致观众端播放混音流时感受到人声伴奏不同步情况,音频混音效果较差。
发明内容
本申请实施例提供一种音频混音方法、装置、设备、存储介质及产品,以解决相关技术中对人声帧与伴奏帧进行混音时不对齐导致音频混音效果较差的技术问题,使人声帧与伴奏帧对齐,提高音频混音效果。
在第一方面,本申请实施例提供了一种音频混音方法,包括:
在伴奏抖动缓冲器和多个人声抖动缓冲器中获取伴奏音频帧和多个人声音频帧;
确定各个所述人声音频帧相对于所述伴奏音频帧的同步情况;
基于各个所述人声音频帧对应的同步情况,将各个所述人声音频帧向所述伴奏音频帧对齐;
对对齐后的多个所述人声音频帧和所述伴奏音频帧进行混音处理,得到混音结果。
在第二方面,本申请实施例提供了一种音频混音装置,包括音频获取模块、同步确认模块、音频同步模块和音频混音模块,其中:
所述音频获取模块,配置在从伴奏抖动缓冲器和多个人声抖动缓冲器中获取伴奏音频帧和多个人声音频帧;
所述同步确认模块,配置为确定各个所述人声音频帧相对于所述伴奏音频帧的同步情况;
所述音频同步模块,配置为基于各个所述人声音频帧对应的同步情况,将各个所述人声音频帧向所述伴奏音频帧对齐;
所述音频混音模块,配置为对对齐后的多个所述人声音频帧和所述伴奏音频帧进行混音处理,得到混音结果。
在第三方面,本申请实施例提供了一种音频混音设备,包括:存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的音频混音方法。
在第四方面,本申请实施例提供了一种存储计算机可执行指令的非易失性存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的音频混音方法。
在第五方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序,使得设备执行如第一方面所述的音频混音方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310679603.8/2.html,转载请声明来源钻瓜专利网。