[发明专利]对音乐进行音量调节的方法及设备有效
申请号: | 201810583114.1 | 申请日: | 2018-06-05 |
公开(公告)号: | CN109147816B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 姚青山;秦宇;喻浩文;卢峰 | 申请(专利权)人: | 安克创新科技股份有限公司 |
主分类号: | G10L21/034 | 分类号: | G10L21/034;G10L25/30;G06F3/16 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;刘爱平 |
地址: | 410205 湖南省长沙市高新开发区尖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 进行 音量 调节 方法 设备 | ||
本发明实施例提出了一种对音乐进行音量调节的方法及设备。该方法包括:获取待播放音乐的时域波形以及播放环境的噪声的时域波形;根据所述待播放音乐的时域波形以及所述噪声的时域波形,使用预先训练好的神经网络,得到所述待播放音乐的音量设置;使用所述音量设置调节所述待播放音乐的音量。由此可见,本发明实施例通过包括音乐风格神经网络、噪声类别辨识神经网络以及音量调节神经网络的预先训练好的神经网络,其考虑了所处环境的噪声类别和音乐风格等影响用户当前音量偏好的因素,能够对用户的待播放音乐的音量进行自动调节,如此能够极大地简化用户的操作,提升了用户体验。
技术领域
本发明实施例涉及声音领域,并且更具体地,涉及一种对音乐进行音量调节的方法及设备。
背景技术
音质是人对音频质量的主观评价。一般地音质被划分成几十个指标,音量(loudness)也称为响度,是其中一项重要的指标。音量的大小会影响人对音乐信息的接收质量。音量的设置一般与环境音有关,例如在嘈杂的环境中的音乐音量一般高于在安静的环境中的音乐音量。
目前的音量的设置主要是由用户自己调节的,这样给用户带来了操作复杂度,影响了用户的体验。另外现存的一些自动音量调节技术,一般只考虑了环境噪声参数,因此音量自动调节能力有限,实际上个人用户对音量的偏好与很多因素有关,如音乐的类别,人们听不同风格类型音乐时,可能会设置不同的音量,不同类型的环境噪声也会对音量设置造成不同的影响,其他的因素还有个人的偏好和个人的听力、音频播放设备参数等,音量模型必须全面考虑这些因素才能达到更好的性能。
发明内容
本发明实施例提供了一种对音乐的音量进行自动调节的方法及设备,可以基于深度学习实现对音乐的音量进行调节,简化了用户操作,从而提升了用户的体验。
第一方面,提供了一种对音乐进行音量调节的方法,包括:
获取待播放音乐的时域波形以及播放环境的噪声的时域波形;
根据所述待播放音乐的时域波形以及所述噪声的时域波形,使用预先训练好的神经网络,得到所述待播放音乐的音量设置;
使用所述音量设置调节所述待播放音乐的音量。
在本发明的一种实现方式中,还包括:
将所述预先训练好的神经网络作为基线模型;
重复执行以下步骤,直到特定用户的再次调节指令的次数小于预设值:
对在播放音乐,使用所述基线模型得到相应的音量设置;
获取所述特定用户对所述相应的音量设置的再次调节指令;
若所述特定用户的再次调节指令的次数达到预设值,则将所述特定用户调节后的音量作为训练样本,在所述基线模型的参数基础上进行学习,得到更新后的模型,并用所述更新后的模型替换基线模型。
在本发明的一种实现方式中,所述预先训练好的神经网络包括:音乐风格神经网络、噪声类别辨识神经网络以及音量调节神经网络。
在本发明的一种实现方式中,所述得到所述待播放音乐的音量设置的过程包括:
根据所述待播放音乐的时域波形,使用所述音乐风格神经网络,得到所述待播放音乐的风格向量;
根据所述噪声的时域波形,使用所述噪声类别辨识神经网络,得到所述噪声的类别;
根据所述待播放音乐的时域波形得到所述待播放音乐的能量特征;
根据所述噪声的时域波形得到所述噪声的能量特征;
将所述待播放音乐的风格向量、所述噪声的类别、所述待播放音乐的能量特征、所述噪声的能量特征输入至所述音量调节神经网络,得到所述待播放音乐的音量设置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安克创新科技股份有限公司,未经安克创新科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810583114.1/2.html,转载请声明来源钻瓜专利网。