[发明专利]一种自适应通话音量控制方法及装置有效
申请号: | 201910030712.0 | 申请日: | 2019-01-14 |
公开(公告)号: | CN109994104B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 谢宜昊 | 申请(专利权)人: | 珠海慧联科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L21/0208;G10L21/0272;G10L25/18;G10L25/21;G10L25/45 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 俞梁清 |
地址: | 519000 广东省珠*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 通话 音量 控制 方法 装置 | ||
1.一种自适应通话音量控制方法,其特征在于,包括以下步骤:
S100)分别采集远端语音信号和近端语音信号,并通过滤波分别提取形成远端子带信号和近端子带信号;
S200)基于远端子带信号和近端子带信号,形成针对远端语音信号和近端语音信号的语音均衡参数;
S300)根据语音均衡参数对远端子带信号作增益乘法,并解码所获得的输出子带信号;
S400)通过扬声器播放解码所述输出子带信号的输出语音;
其中,所述远端子带信号和所述近端子带信号分别是通过对远端语音信号和近端语音信号这两种语音信号交叠和快速傅里叶变换得到的;以及
其中,所述步骤S100包括以下子步骤:
S110)分别获取远端语音信号和近端语音信号在多个时刻的信号,以形成远端语音信号向量和近端语音信号向量;
S120)相应合并时间上连续的R个远端语音信号向量和近端语音信号向量为复合远端语音信号向量和复合近端语音信号向量;
S130)对复合远端语音信号向量和复合近端语音信号向量加窗处理,以获得加窗远端语音信号向量和加窗近端语音信号向量;
S140)分别对加窗远端语音信号向量和加窗近端语音信号向量执行快速傅里叶变换以形成相应的远端子带信号和近端子带信号。
2.根据权利要求1所述的方法,其特征在于,用于合并时间上连续远端语音信号向量和近端语音信号向量以形成复合远端语音信号向量和复合近端语音信号向量的个数R为2。
3.根据权利要求1或2所述的方法,其特征在于,所述语音均衡参数是基于远端子带信号的功率谱估计以及近端子带信号的背景噪声估计而确定的。
4.根据权利要求3所述的方法,其特征在于,所述步骤S200还包括以下子步骤:
S210)将远端子带信号和近端子带信号的幅度平方分别通过远端历史向量和近端历史向量进行平滑,并将平滑后的远端子带信号和近端子带信号作为远端子带信号的远端平滑功率谱,以及近端子带信号的近端平滑功率谱;
S220)将所述远端平滑功率谱和近端平滑功率谱分别映射为人耳感知域的远端临界频带功率谱及近端临界频带功率谱;
S230)分别根据远端平滑功率谱及近端平滑功率谱的频域粗糙度,选取人耳听觉域能量的远端子带信号输入平滑系数和近端子带信号输入平滑系数;
S240)基于远端子带信号输入平滑系数、近端子带信号输入平滑系数、远端临界频带功率谱及近端临界频带功率谱,计算语音均衡参数。
5.根据权利要求4所述的方法,其特征在于,所述步骤S240还包括以下子步骤:
S241)由所述远端子带信号输入平滑系数平滑远端临界频带功率谱,并选取平滑后的远端临界频带功率谱的能量与人耳绝对听觉阈值的最大值作为远端子带信号输入听觉域能量;
S242)由所述近端子带信号输入平滑系数平滑近端临界频带功率谱,并选取平滑后的近端临界频带功率谱的能量与人耳绝对听觉阈值的最大值作为近端子带信号输入听觉域能量;
S243)将近端子带信号输入听觉域能量与所述远端子带信号输入听觉域能量相减并插值,以作为语音均衡参数。
6.根据权利要求4或5所述的方法,其特征在于,所述步骤S300还包括以下子步骤:
S310)将所述远端子带信号和语音均衡参数作增益乘法,以获得输出子带信号;
S320)对所述输出子带信号作反傅里叶变换以获得全频带信号向量;
S330)对所述全频带信号向量进行所述加窗处理,以获得加窗全频带信号向量;
S340)叠加所述加窗全频带信号向量,以获得输出语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海慧联科技有限公司,未经珠海慧联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910030712.0/1.html,转载请声明来源钻瓜专利网。