[发明专利]一种音量的调节方法及系统有效
申请号: | 201811235944.1 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109213471B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 邱泽宇;李昂 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音量 调节 方法 系统 | ||
1.一种音量的调节方法,其特征在于,包括:
采集环境中的音频信号;
将所述音频信号分割成多个短时音频帧,所述短时音频帧的短时特征包括:短时能量和短时频率;
判断所述短时能量是否大于短时能量阈值,且所述短时频率是否大于短时频率阈值;
如果是,则判定相对应的短时音频帧处于语音混合状态,所述语音混合状态包括:超过声音标准值的声音以及低于所述声音标准值的声音;
对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于所述基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量的自动调节;
其中,所述对所有处于语音混合状态的短时音频帧进行处理包括:对检测到的所述短时音频帧采用基于小波变换的语音信号分析,使用中心频率来区分不同用户以及噪声。
2.根据权利要求1所述的调节方法,其特征在于,所述对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于所述基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量进行自动调节,具体包括:
每检测到一个处于语音混合状态的短时音频帧,则对检测到的短时音频帧采用小波变换,得到来自不同用户的短时音频帧和环境噪声帧;
采用小波滤波方法对所述环境噪声帧进行滤除;
计算所有用户的短时音频帧在被检时刻的平均值;
当所述平均值与所述被检时刻的上一时刻的平均值的差值不在预设差值范围内时,则将所述被检时刻的平均值作为所述基准音频帧。
3.根据权利要求1所述的调节方法,其特征在于,所述对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于所述基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量进行自动调节,具体包括:
连续检测N个处于语音混合状态的短时音频帧,对每个被检短时音频帧采用小波变换,得到每个所述被检短时音频帧中包含的来自不同用户的短时音频帧和环境噪声帧,N为大于1的正整数;
采用小波滤波方法对每个所述被检短时音频帧中包含的环境噪声帧进行滤除;
分别计算每个所述被检短时音频帧相对应的所有用户的短时音频帧在被检时刻的平均值;
当所述平均值与所述被检时刻的上一时刻的平均值的差值不在预设差值范围内时,则将所述被检时刻的平均值作为相对应的被检短时音频帧的基准音频帧。
4.根据权利要求1所述的调节方法,其特征在于,当处于语音混合状态的短时音频帧的被检时刻为第一次检测对应的时刻时,所述基准音频帧为预先设定的默认值。
5.根据权利要求2或3所述的调节方法,其特征在于,当所述平均值与所述被检时刻的上一时刻的平均值的差值在所述预设差值范围内时,则跳过对所述被检时刻对应的来自不同用户的短时音频帧的调节过程,并继续对所述被检时刻的下一时刻的处于语音混合状态的短时音频帧进行调节。
6.根据权利要求1所述的调节方法,其特征在于,还包括:
当所述短时能量不大于所述短时能量阈值,或所述短时频率不大于所述短时频率阈值时,则判定相对应的短时音频帧处于语音正常状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811235944.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于语音识别的光标控制方法
- 下一篇:用于利用常数值的矢量运算的指令