[发明专利]经由音频分类进行动态音量调节的方法和装置在审
| 申请号: | 201980072115.2 | 申请日: | 2019-09-06 |
| 公开(公告)号: | CN113614684A | 公开(公告)日: | 2021-11-05 |
| 发明(设计)人: | M·克里默;R·库弗;S·D·舍夫;C·A·萨默斯 | 申请(专利权)人: | 格雷斯诺特有限公司 |
| 主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L21/0272;H03G3/20 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王小东;黄纶伟 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 经由 音频 分类 进行 动态 音量 调节 方法 装置 | ||
公开了经由音频分类进行动态音量调节的方法、装置、系统和制品。示例方法包括:利用经神经网络训练的模型对与第一音量水平相关联的音频信号的参数进行分析,以确定与音频信号相关联的分类组;确定音频信号的输入音量,所述选择基于与音频信号相关联的分类组;向音频信号施加增益值,所述增益值基于分类组和输入音量,所述增益值将第一音量水平修改成第二音量水平;以及向音频信号施加压缩值,所述压缩值将第二音量水平修改成满足目标音量阈值的第三音量水平。
相关申请
本专利要求2018年9月7日提交的美国临时申请62/728,677和2018年10月12日提交的美国临时申请62/745,148的优先权和利益。美国临时申请62/702,734和美国临时申请62/745,148通过引用整体并入本文。
技术领域
本公开总体上涉及音量调节,并且更具体地,涉及经由音频分类进行动态音量调节的方法和装置。
背景技术
近年来,使用越来越多的渠道传送了大量具有时变特性的媒体。可以使用更传统的渠道(例如,无线电)或者使用最新开发的渠道(诸如使用因特网连接的流传输设备)来接收。随着这些渠道的开发,也已经开发了能够对来自多个源的音频进行处理和输出的系统。例如,一些汽车媒体系统能够从光盘(CD)、蓝牙连接设备、通用串行总线(USB)连接设备、Wi-Fi连接设备、辅助输入端和其它源传送媒体。
附图说明
图1是根据本公开的教导构造的用于经由音频分类进行动态音量调节的示例系统的示意图。
图2是示出图1的媒体单元的附加细节的框图。
图3是示出音频分类引擎的框图,该音频分类引擎能够提供经训练的模型以供图1和图2的媒体单元使用。
图4和图5是表示示例机器可读指令的流程图,该示例机器可读指令可以用于实现图1和图2的媒体单元106,以经由音频分类执行动态音量调节。
图6是可以执行图4和图5的指令以实现图1和图2的示例媒体单元106的示例处理器平台的示意图。
附图未按比例绘制。在任何可能的情况下,将在整个附图和所附书面描述中使用相同的附图标记来指代相同或相似的部分。
具体实施方式
在常规音频媒体实现中,与不同媒体相关联的音频信号可以具有不同音量。例如,一张CD上的媒体可以以与另一张CD的媒体显著不同的音量被记录和/或制作母带(mastered)。类似地,从流传输设备读取的媒体可以具有与从不同设备读取的媒体或经由不同应用从同一设备读取的媒体显著不同的音量水平。随着用户越来越多地收听来自各种不同源的媒体,源之间以及同一源的媒体之间的音量水平差异会变得非常明显,并且可能引起收听者的不适。
在一些用于音量调整的常规方法中,利用动态范围压缩器来压缩音频信号的总动态范围,以满足音量阈值。在一些常规实现中,这样的动态范围压缩持续地监测并调节音频信号的音量,以便满足音频信号的音量阈值。这样的持续调节对收听者对音频信号的感知具有可感知的影响,因为曲目(track)的原始动态会被显著更改。在一些示例中,动态范围压缩显著降低了感知的音频信号质量(例如,通过将失真(artifacts)引入音频中)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格雷斯诺特有限公司,未经格雷斯诺特有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980072115.2/2.html,转载请声明来源钻瓜专利网。





