[发明专利]经由音频分类进行动态音量调节的方法和装置在审
| 申请号: | 201980072115.2 | 申请日: | 2019-09-06 |
| 公开(公告)号: | CN113614684A | 公开(公告)日: | 2021-11-05 |
| 发明(设计)人: | M·克里默;R·库弗;S·D·舍夫;C·A·萨默斯 | 申请(专利权)人: | 格雷斯诺特有限公司 |
| 主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L21/0272;H03G3/20 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王小东;黄纶伟 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 经由 音频 分类 进行 动态 音量 调节 方法 装置 | ||
1.一种装置,所述装置包括:
音频信号分类器,所述音频信号分类器利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;
输入音量检测器,所述输入音量检测器确定所述音频信号的输入音量;
音量调节器,所述音量调节器向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及
动态范围压缩器,所述动态范围压缩器向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。
2.根据权利要求1所述的装置,所述装置还包括源改变确定器,所述源改变确定器确定所述音频信号的源是否已改变。
3.根据权利要求2所述的装置,其中,所述源改变确定器基于以下至少一项来确定所述音频信号的所述源是否已改变:(1)所述音频信号所关联的当前压缩器增益与所述音频信号所关联的先前压缩器增益的比较,(2)所述音频信号所关联的RMS功率与所述音频信号所关联的先前RMS功率的比较,或者(3)所述音频信号所关联的当前音频样本值与所述音频信号所关联的先前音频样本值的比较。
4.根据权利要求2所述的装置,其中,所述音量调节器还响应于确定所述音频信号的所述源已改变而重置所述音频信号的所述增益值。
5.根据权利要求1所述的装置,其中,所述分类组与以下至少一项相关联:(1)由所述音频信号表示的音乐的流派,(2)由所述音频信号表示的所述音乐的时间段,或者(3)由所述音频信号表示的所述音乐中存在的乐器。
6.根据权利要求1所述的装置,其中,
所述输入音量检测器还确定第一时间段内的第四音量水平未落在所述目标音量阈值内,所述第一时间段在第二时间段之后发生,所述第三音量水平与所述第二时间段相关联;并且
所述动态范围压缩器还调节所述压缩值以适应第五音量水平,经调节的压缩值将所述第四音量水平修改成满足所述目标音量阈值的第五音量水平。
7.根据权利要求1所述的装置,其中,所述目标音量阈值处于5满刻度相对分贝(dBFS)至21dBFS内。
8.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包括指令,所述指令在被执行时使处理器至少:
利用神经网络对与第一音量水平相关联的音频信号的参数进行分析,以确定与所述音频信号相关联的分类组;
确定所述音频信号的输入音量;
向所述音频信号施加增益值,所述增益值基于所述分类组和所述输入音量,所述增益值将所述第一音量水平修改成第二音量水平;以及
向所述音频信号施加压缩值,所述压缩值将所述第二音量水平修改成满足目标音量阈值的第三音量水平。
9.根据权利要求8所述的非暂时性计算机可读存储介质,其中,所述指令在被执行时使所述处理器确定所述音频信号的源是否已改变。
10.根据权利要求9所述的非暂时性计算机可读存储介质,其中,确定所述音频信号的源是否已改变是基于以下至少一项进行的:(1)所述音频信号所关联的当前压缩器增益与所述音频信号所关联的先前压缩器增益的比较,(2)所述音频信号所关联的RMS功率与所述音频信号所关联的先前RMS功率的比较,或者(3)所述音频信号所关联的当前音频样本值与所述音频信号所关联的先前音频样本值的比较。
11.根据权利要求9所述的非暂时性计算机可读存储介质,其中,所述指令在被执行时使所述处理器:响应于确定所述音频信号的所述源已改变,重置所述音频信号的所述增益值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格雷斯诺特有限公司,未经格雷斯诺特有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980072115.2/1.html,转载请声明来源钻瓜专利网。





