[发明专利]音频处理方法、设备、存储介质及计算机程序产品在审

申请号：	202211442314.8	申请日：	2022-11-17
公开（公告）号：	CN115831098A	公开（公告）日：	2023-03-21
发明（设计）人：	王武城	申请（专利权）人：	腾讯音乐娱乐科技（深圳）有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L17/04;G10L15/25;G10L21/0216;G10L25/51
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	彭程
地址：	518000 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频处理方法设备存储介质计算机程序产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音频处理方法，其特征在于，包括：

获取歌曲特征库以及噪声特征库；所述歌曲特征库包括多首歌曲的多个歌曲特征组，所述歌曲特征组中的各个歌曲特征是所述歌曲的同一歌曲片段不同版本的声学特征，所述噪声特征库中的一个噪声特征为一个噪声片段的声学特征；

基于所述歌曲特征库以及所述噪声特征库构建样本组；所述样本组包括正样本、负样本以及参照样本，且所述样本组满足以下第一条件、第二条件或第三条件：第一条件为，所述正样本以及所述参照样本是从同一所述歌曲特征组中选取的不同歌曲特征，所述负样本是从所述噪声特征库中选取的噪声特征；第二条件为，所述正样本以及所述参照样本是从同一所述歌曲特征组中选取的不同歌曲特征，所述负样本是从所述歌曲特征库中其他歌曲特征组中选取的歌曲特征，所述其他歌曲特征组为所述正样本对应的歌曲之外的其他歌曲的歌曲特征组；第三条件为，所述正样本以及所述参照样本是从所述噪声特征库中选取的不同噪声特征，所述负样本是从所述歌曲特征库中选取的歌曲特征；

通过歌曲识别模型，提取所述正样本对应的指纹特征、所述负样本对应的指纹特征以及所述参照样本对应的指纹特征；

基于所述正样本对应的指纹特征、所述负样本对应的指纹特征以及所述参照样本对应的指纹特征对所述歌曲识别模型进行训练，以得到训练后的歌曲识别模型；其中所述训练后的歌曲识别模型用于提取待识别音频对应的指纹特征，所述待识别音频对应的指纹特征用于对所述待识别音频进行歌曲识别。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

从所述噪声特征库中选取多个噪声特征，并基于所述多个噪声特征确定新增的噪声特征，并将所述新增的噪声特征添加至所述噪声特征库，以更新所述噪声特征库；

所述基于所述歌曲特征库以及所述噪声特征库构建样本组，包括：

基于所述歌曲特征库以及更新后的噪声特征库构建所述样本组。

3.如权利要求2所述的方法，其特征在于，所述基于所述多个噪声特征确定新增的噪声特征，包括：

对所述多个噪声特征进行平均处理，得到所述新增的噪声特征。

4.如权利要求1所述的方法，其特征在于，所述基于所述正样本对应的指纹特征、所述负样本对应的指纹特征以及所述参照样本对应的指纹特征对所述歌曲识别模型进行训练，包括：

基于所述参照样本对应的指纹特征确定目标指纹特征；

朝着减小所述正样本对应的指纹特征与所述目标指纹特征之间的特征距离的方向，以及增大所述负样本对应的指纹特征与所述目标指纹特征之间的特征距离的方向，调整所述歌曲识别模型的模型参数。

5.如权利要求4所述的方法，其特征在于，所述样本组包括多个参照样本，所述基于所述参照样本对应的指纹特征确定目标指纹特征，包括：

对各个所述参照样本对应的指纹特征进行平均处理，得到所述目标指纹特征。

6.如权利要求1所述的方法，其特征在于，所述方法还包括：

通过所述训练后的歌曲识别模型，提取所述歌曲特征库中各个歌曲特征对应的指纹特征，以及所述噪声特征库中各个噪声特征对应的指纹特征；

获取所述待识别音频的声学特征，并通过所述训练后的歌曲识别模型，对所述待识别音频的声学特征进行特征转换处理，得到所述待识别音频对应的指纹特征；

基于所述待识别音频对应的指纹特征与所述各个歌曲特征对应的指纹特征之间的特征距离，以及所述待识别音频对应的指纹特征与所述各个噪声特征对应的指纹特征之间的特征距离，对所述待识别音频进行歌曲识别，得到歌曲识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技（深圳）有限公司，未经腾讯音乐娱乐科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211442314.8/1.html，转载请声明来源钻瓜专利网。

上一篇：函数调用方法、装置、设备及计算机可读存储介质
下一篇：盆底肌训练指导系统、方法及电子设备

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频处理方法、设备、存储介质及计算机程序产品在审

专利文献下载