[发明专利]音频增益调整方法、装置、存储介质及电子设备有效
申请号: | 202310736063.2 | 申请日: | 2023-06-21 |
公开(公告)号: | CN116486833B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 鲁勇;刘波;刘海平;梁健林 | 申请(专利权)人: | 北京探境科技有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/27 |
代理公司: | 深圳市嘉勤知识产权代理有限公司 44651 | 代理人: | 刘自丽 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 增益 调整 方法 装置 存储 介质 电子设备 | ||
本申请公开了一种音频增益调整方法、装置、存储介质及电子设备,其中,该音频增益调整方法采用获取当前时间段内符合预设条件且信号值最大的第一音频数据;将第一音频数据的信号值作为第一更新因子对历史音频数据集进行更新,得到当前音频数据集;获取当前音频数据集中信号值最大的第二音频数据;将第二音频数据的信号值作为第二更新因子对历史音频增益进行更新,得到当前音频增益。本方案可以对音频增益进行自适应调整。
技术领域
本申请涉及通信技术领域,具体涉及一种音频增益调整方法、装置、存储介质及电子设备。
背景技术
随着移动互联网和人工智能时代的来临,语音交互近些年获得了前所未有的增长,其中,语音唤醒技术作为一种特别的语音识别技术,成为用户和机器进行交互重要组成部分。语音唤醒系统的目标,是在无手动操作的情况下,对设备进行唤醒。
在实际应用中,同一语音芯片在不同的时间和空间对音频增益的需求是不相同的。而目前通常是根据经验针对语音芯片在不同的应用中设置对应的音频增益,无法根据时间和空间的不同对音频增益进行自适应调整,导致音频信号失真,影响语音唤醒的效果。
发明内容
本申请提供了一种音频增益调整方法,可以对音频增益进行自适应调整。
第一方面,本申请提供了一种音频增益调整方法,包括:
获取当前时间段内符合预设条件且信号值最大的第一音频数据;
将所述第一音频数据的信号值作为第一更新因子对历史音频数据集进行更新,得到当前音频数据集;
获取所述当前音频数据集中信号值最大的第二音频数据;
将所述第二音频数据的信号值作为第二更新因子对历史音频增益进行更新,得到当前音频增益。
在本申请提供的音频增益调整方法中,所述将所述第二音频数据的信号值作为第二更新因子对历史音频增益进行更新,得到当前音频增益,包括:
获取音频量化最大值;
计算所述音频量化最大值与所述第二音频数据的信号值的商,得到初始音频增益;
按照预设策略对所述初始音频增益进行削弱,得到当前音频增益。
在本申请提供的音频增益调整方法中所述按照预设策略对所述初始音频增益进行削弱,得到当前音频增益,包括:
将所述初始音频增益的二分之一作为当前音频增益。
在本申请提供的音频增益调整方法中所述获取当前时间段内符合预设条件且信号值最大的第一音频数据,包括:
采集当前时间段内的第三音频数据;
将所有所述第三音频数据区分为第一音频数据集和第二音频数据集;
从所述第一音频数据集或所述第二音频数据集中选取信号值最大的第三音频数据作为所述第一音频数据。
在本申请提供的音频增益调整方法中所述将所有所述第三音频数据区分为第一音频数据集和第二音频数据集,包括:
将所有所述第三音频数据区分为人声音频数据集和环境声音频数据集;
所述从所述第一音频数据集或所述第二音频数据集中选取信号值最大的第三音频数据作为所述第一音频数据,包括:
从所述人声音频数据集选取信号值最大的第三音频数据作为所述第一音频数据。
在本申请提供的音频增益调整方法中,所述将所有所述第三音频数据区分为第一音频数据集和第二音频数据集,包括:
将所有所述第三音频数据区分为前景声音频数据集和背景声音频数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京探境科技有限公司,未经北京探境科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310736063.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:深沟槽隔离结构的制备方法
- 下一篇:一种便于试剂存放的医用冰箱