[发明专利]音频音量智能调节方法、装置、电子设备及存储介质在审
申请号: | 202210138188.0 | 申请日: | 2022-02-15 |
公开(公告)号: | CN114489561A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 李蓉 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G10L25/03;G10L25/27;G10L25/51 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 音量 智能 调节 方法 装置 电子设备 存储 介质 | ||
本发明涉及人工智能领域,揭露一种音频音量智能调节方法,包括:采集目标移动设备的当前音频文件、当前音频环境参数及历史音频播放记录;识别当前音频环境参数的环境声音特征,从历史音频播放记录中查询当前音频文件的相似音频文件,从相似音频文件中提取音频播放特征;将环境声音特征和音频播放特征作为当前音频文件的音量特征输入至音频音量决策模型中,以通过音频音量决策模型检测音量特征的当前适宜音量;将当前音频文件的当前播放音量调节至当前适宜音量,得到当前音频文件的最终播放音量。此外,本发明还涉及区块链技术,所述音量特征可存储区块链中。本发明可以实现智能化的音频音量自动调节。
技术领域
本发明涉及人工智能领域,尤其涉及一种音频音量智能调节方法、装置、电子设备及计算机可读存储介质。
背景技术
随着社会的不断进步和发展,音频在我们的生活中大量存在并使用,常见的如视频观看、音乐播放等,目前音频播放器对于视频音量的调节,均需要用户手动调节,无法做到智能自动调节。因此,如何智能化的自动调节音频音量是目前亟待解决的问题。
发明内容
本发明提供一种音频音量智能调节方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现智能化的音频音量自动调节。
为实现上述目的,本发明提供的一种音频音量智能调节方法,包括:
采集目标移动设备的当前音频文件、当前音频环境参数以及历史音频播放记录;
识别所述当前音频环境参数的环境声音特征,从所述历史音频播放记录中查询所述当前音频文件的相似音频文件,并从所述相似音频文件中提取音频播放特征;
将所述环境声音特征和所述音频播放特征作为所述当前音频文件的音量特征输入至预先训练好的音频音量决策模型中,以通过所述预先训练好的音频音量决策模型检测所述音量特征的当前适宜音量;
将所述当前音频文件的当前播放音量调节至所述当前适宜音量,得到所述当前音频文件的最终播放音量。
可选地,所述识别所述当前音频环境参数的环境声音特征,包括:
对所述当前音频环境参数进行声音类别划分,得到多个类别声音;
提取每个类别声音的音量属性,并根据所述音量属性,计算每个所述类别声音的模拟音量,将所述音量属性和所述模拟音量作为所述环境声音特征。
可选地,所述从所述历史音频播放记录中查询所述当前音频文件的相似音频文件,包括:
获取所述当前音频文件的文件类型,从所述历史音频播放记录中查询具有所述文件类型的音频文件,并将查询的音频文件作为所述当前音频文件的相似音频文件。
可选地,所述从所述相似音频文件中提取音频播放特征,包括:
获取所述相似音频文件的播放时间,从所述相似音频文件中筛选出所述播放时间满足预设条件的文件,得到目标音频文件,将所述目标音频文件中的播放音量作为所述音频播放特征。
可选地,所述通过所述预先训练好的音频音量决策模型检测所述音量特征的当前适宜音量,包括:
利用所述训练完成的音频音量决策模型中的决策层对所述音量特征进行分割,得到多个分割节点;
利用所述训练完成的音频音量决策模型中的直方图函数计算每个所述分割节点中音量特征的梯度增益;
根据所述梯度增益,查找每个所述分割节点的最优分裂特征;
根据所述最优分裂特征,利用所述训练完成的音频音量决策模型中的激活函数计算所述音量特征的当前适宜音量。
可选地,所述利用所述训练完成的音频音量决策模型中的决策层对所述音量特征进行特征分割,得到多个分割节点,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210138188.0/2.html,转载请声明来源钻瓜专利网。