[发明专利]音效设置方法、装置、设备以及计算机可读存储介质有效
申请号: | 202110945754.4 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113793623B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 包静;曾轶 | 申请(专利权)人: | 咪咕音乐有限公司;咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G06N3/048;G06N3/08;G10L25/03;G10L25/18;G10L25/30;G06F3/16 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 杨培权 |
地址: | 610000 四川省成都市高新区交子大道57*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音效 设置 方法 装置 设备 以及 计算机 可读 存储 介质 | ||
1.一种音效设置方法,其特征在于,所述音效设置方法包括:
获取用户的目标音频,提取所述目标音频的音频特征参数,所述目标音频包括用户播放的歌曲的音频或者所述用户所在的环境音频,所述音频特征参数包括梅尔倒谱特征、色度频率值、均方根误差值、频谱中心值、频谱带宽值、频谱滚降点以及过零率中的至少一个;
将所述音频特征参数输入预设的音效设置模型,所述音效设置模型由用户的历史音频训练得到的神经网络模型;
获取所述音效设置模型输出的各个预设音效的概率值,根据所述概率值在所述预设音效中选取所述目标音频对应的目标音效,以按照所述目标音效播放音频数据或者视频数据。
2.如权利要求1所述的音效设置方法,其特征在于,所述提取所述目标音频的音频特征参数的步骤包括:
对所述目标音频进行采样得到多个音频片段;
分别提取各个所述音频片段的所述音频特征参数;
根据各个所述音频片段的所述音频特征参数确定所述目标音频的音频特征参数。
3.如权利要求2所述的音效设置方法,其特征在于,所述根据各个所述音频片段的所述音频特征参数确定所述目标音频的音频特征参数的步骤包括:
根据所述目标音频对应的各个所述音频片段的音频特征参数确定目标数值,并将所述目标数值作为所述目标音频的所述音频特征参数,所述目标数值为各个音频片段的音频特征参数的平均值、最大值、最小值或者均方差值。
4.如权利要求1所述的音效设置方法,其特征在于,所述根据所述概率值在所述预设音效中选取所述目标音频对应的目标音效的步骤之后,还包括:
保存所述目标音频对应的目标音效;
获取用户对目标音效的选择操作,则将所述目标音效应用于播放的音频数据或者视频数据中。
5.如权利要求1所述的音效设置方法,其特征在于,所述根据所述概率值在所述预设音效中选取所述目标音频对应的目标音效的步骤之后,还包括:
保存所述目标音频对应的目标音效;
确定当前播放的音频数据或者视频数据对应的目标音频的音频参数与目标音效对应的音频参数的相似度;
若所述相似度大于预设阈值,则将所述目标音效应用于当前播放的音频数据或者视频数据中。
6.如权利要求1所述的音效设置方法,其特征在于,所述将所述音频特征参数输入预设的音效设置模型的步骤之前,还包括:
获取训练样本集,所述训练样本集包括历史音频的多个音频特征参数以及所述音频特征参数对应的音效;
根据训练样本集中的多个所述音频特征参数以及所述音效训练预设的神经网络模型;
当训练后的所述神经网络模型收敛后,将训练后的所述神经网络模型作为所述音效设置模型并保存。
7.如权利要求6所述的音效设置方法,其特征在于,所述根据多个所述音频特征参数以及所述音效训练预设的神经网络模型的步骤包括:
将所述训练样本集中的所述音频特征参数作为输入值依次输入所述神经网络模型的各个全连接层,其中,每个全连接层根据输入值以及所述全连接层的预设权重值以及预设激活函数得到所述全连接层的输出值,并将所述输出值输入至下一全连接层,直至最后一个全连接层;
获取最后一个全连接层的输出值;
根据预设的损失函数确定所述输出值与所述训练样本对应的真实值的损失值,根据所述损失值确定权重值;
根据所述权重值确定所述音效设置模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕音乐有限公司;咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕音乐有限公司;咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110945754.4/1.html,转载请声明来源钻瓜专利网。