首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种自适应通话音量控制方法及装置有效

申请号：	201910030712.0	申请日：	2019-01-14
公开（公告）号：	CN109994104B	公开（公告）日：	2021-05-14
发明（设计）人：	谢宜昊	申请（专利权）人：	珠海慧联科技有限公司
主分类号：	G10L15/20	分类号：	G10L15/20;G10L21/0208;G10L21/0272;G10L25/18;G10L25/21;G10L25/45
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	俞梁清
地址：	519000 广东省珠***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种自适应通话音量控制方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种自适应通话音量控制方法，其特征在于，包括以下步骤：

S100)分别采集远端语音信号和近端语音信号，并通过滤波分别提取形成远端子带信号和近端子带信号；

S200)基于远端子带信号和近端子带信号，形成针对远端语音信号和近端语音信号的语音均衡参数；

S300)根据语音均衡参数对远端子带信号作增益乘法，并解码所获得的输出子带信号；

S400)通过扬声器播放解码所述输出子带信号的输出语音；

其中，所述远端子带信号和所述近端子带信号分别是通过对远端语音信号和近端语音信号这两种语音信号交叠和快速傅里叶变换得到的；以及

其中，所述步骤S100包括以下子步骤：

S110)分别获取远端语音信号和近端语音信号在多个时刻的信号，以形成远端语音信号向量和近端语音信号向量；

S120)相应合并时间上连续的R个远端语音信号向量和近端语音信号向量为复合远端语音信号向量和复合近端语音信号向量；

S130)对复合远端语音信号向量和复合近端语音信号向量加窗处理，以获得加窗远端语音信号向量和加窗近端语音信号向量；

S140)分别对加窗远端语音信号向量和加窗近端语音信号向量执行快速傅里叶变换以形成相应的远端子带信号和近端子带信号。

2.根据权利要求1所述的方法，其特征在于，用于合并时间上连续远端语音信号向量和近端语音信号向量以形成复合远端语音信号向量和复合近端语音信号向量的个数R为2。

3.根据权利要求1或2所述的方法，其特征在于，所述语音均衡参数是基于远端子带信号的功率谱估计以及近端子带信号的背景噪声估计而确定的。

4.根据权利要求3所述的方法，其特征在于，所述步骤S200还包括以下子步骤：

S210)将远端子带信号和近端子带信号的幅度平方分别通过远端历史向量和近端历史向量进行平滑，并将平滑后的远端子带信号和近端子带信号作为远端子带信号的远端平滑功率谱，以及近端子带信号的近端平滑功率谱；

S220)将所述远端平滑功率谱和近端平滑功率谱分别映射为人耳感知域的远端临界频带功率谱及近端临界频带功率谱；

S230)分别根据远端平滑功率谱及近端平滑功率谱的频域粗糙度，选取人耳听觉域能量的远端子带信号输入平滑系数和近端子带信号输入平滑系数；

S240)基于远端子带信号输入平滑系数、近端子带信号输入平滑系数、远端临界频带功率谱及近端临界频带功率谱，计算语音均衡参数。

5.根据权利要求4所述的方法，其特征在于，所述步骤S240还包括以下子步骤：

S241)由所述远端子带信号输入平滑系数平滑远端临界频带功率谱，并选取平滑后的远端临界频带功率谱的能量与人耳绝对听觉阈值的最大值作为远端子带信号输入听觉域能量；

S242)由所述近端子带信号输入平滑系数平滑近端临界频带功率谱，并选取平滑后的近端临界频带功率谱的能量与人耳绝对听觉阈值的最大值作为近端子带信号输入听觉域能量；

S243)将近端子带信号输入听觉域能量与所述远端子带信号输入听觉域能量相减并插值，以作为语音均衡参数。

6.根据权利要求4或5所述的方法，其特征在于，所述步骤S300还包括以下子步骤：

S310)将所述远端子带信号和语音均衡参数作增益乘法，以获得输出子带信号；

S320)对所述输出子带信号作反傅里叶变换以获得全频带信号向量；

S330)对所述全频带信号向量进行所述加窗处理，以获得加窗全频带信号向量；

S340)叠加所述加窗全频带信号向量，以获得输出语音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于珠海慧联科技有限公司，未经珠海慧联科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910030712.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种智能语义匹配模型的训练方法
下一篇：信息输入方法、装置、系统、车辆以及可读存储介质

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top