[发明专利]一种基于音色的智能调音方法、装置、介质和计算设备在审
申请号: | 202111073606.4 | 申请日: | 2021-09-14 |
公开(公告)号: | CN113870873A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 高月洁;熊贝尔;郑博;刘华平;曹偲 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音色 智能 调音 方法 装置 介质 计算 设备 | ||
本公开的实施方式提供了一种基于音色的智能调音方法,包括:获取用户的干声作为目标音频;将所述目标音频输入至预先训练完成的深度学习模型,以使所述深度学习模型输出所述目标音频对应的音色特征;将所述目标音频对应的音色特征,以及预设的多个音色模板对应的音色特征,进行相似度计算,并根据相似度计算的结果确定与所述目标音频对应的音色特征相匹配的音色模板;基于匹配到的所述音色模板,确定所述音色模板对应的预设调音参数;根据确定出的所述预设调音参数,为所述用户的干声进行调音处理。通过以上技术方案,既可以基于用户音色实现个性化定制的调音服务,又可以随时随地满足调音需求,并且无需花费高额的成本。
技术领域
本公开的实施方式涉及声音处理技术领域,更具体地,本公开的实施方式涉及一种基于音色的智能调音方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
音色,又称音品,是声音的固有属性之一。声音是通过振动产生的,振动的各项指标决定了声音的性质,比如振动的基准频率就决定了声音的音高,振动的幅度决定了声音的音量,而音色,由振动的泛音决定。
具体来说,物体振动发声时,在整体振动发出基准音的同时,同一物体的不同部位也会产生复合的振动,这些局部振动产生的声音就是泛音,这些泛音不断叠加、互相影响,使得声音呈现许多复杂多变的特性,这些特性就被称为音色。
调音,是一种通过后期制作调节声音的手段,专业的调音师可以通过调节音色,使声音更加好听,从而制作出更受欢迎的音乐。
然而,由于专业的调音师非常稀缺,通常没有空档期,并且收费不菲,导致大多数人很难享受到专业的调音服务。
发明内容
为此,非常需要一种简单快捷的面向大众的智能调音方案,既可以基于用户音色实现个性化定制的调音服务,又可以随时随地满足调音需求,并且无需花费高额的成本。
在本上下文中,本公开的实施方式期望提供一种基于音色的智能调音方法及装置。
在本公开实施方式的第一方面中,提供了一种基于音色的智能调音方法,包括:
获取用户的干声作为目标音频;
将所述目标音频输入至预先训练完成的深度学习模型,以使所述深度学习模型输出所述目标音频对应的音色特征;
将所述目标音频对应的音色特征,以及预设的多个音色模板对应的音色特征,进行相似度计算,并根据相似度计算的结果确定与所述目标音频对应的音色特征相匹配的音色模板;
基于匹配到的所述音色模板,确定所述音色模板对应的预设调音参数;
根据确定出的所述预设调音参数,为所述用户的干声进行调音处理。
在本公开的一个实施例中,在将所述目标音频输入至预先训练完成的深度学习模型之前,所述方法还包括:
对所述目标音频进行音量归一化处理。
在本公开的一个实施例中,所述对所述目标音频进行音量归一化处理,包括:
对所述目标音频对应的音频波形进行整体缩放,将所述音频波形的最大幅值固定为预设值。
在本公开的一个实施例中,所述音色模板中还包括音高特征;
所述方法还包括:
基于预设的音高提取算法提取所述目标音频的音高特征;
将所述目标音频的音高特征,与所述预设的多个音色模板对应的音高特征进行比对,根据预设的阈值筛选出与所述目标音频的音高特征相近的所述音色模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111073606.4/2.html,转载请声明来源钻瓜专利网。