[发明专利]一种语音频信号处理方法和装置有效

专利信息
申请号: 201610263621.8 申请日: 2012-03-01
公开(公告)号: CN105761724B 公开(公告)日: 2021-02-09
发明(设计)人: 刘泽新;苗磊 申请(专利权)人: 华为技术有限公司
主分类号: G10L19/125 分类号: G10L19/125;G10L21/0224;G10L21/0232
代理公司: 暂无信息 代理人: 暂无信息
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 信号 处理 方法 装置
【说明书】:

发明实施例公开了一种语音频信号处理方法和装置。一个实施例中,语音频信号处理方法包括:当语音频信号出现带宽切换时,获得当前帧语音频信号对应的初始高频带信号;获得所述初始高频带信号时域全局增益参数;将能量比值和所述时域全局增益参数进行加权处理,得到的加权值作为预测的全局增益参数,其中,能量比值为历史帧高频带时域信号能量与当前帧初始高频带信号能量的比值;利用预测的全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。

技术领域

本发明涉及数字信号处理技术领域,尤其是一种语音频信号处理方法和装置。

背景技术

在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。音频被数字化处理,通过音频通信网络从一个终端传递到另一个终端,这里的终端可以是手机、数字电话终端或其他任何类型的音频终端,数字电话终端例如VOIP电话或ISDN电话、计算机、电缆通信电话。为了降低语音频信号存储或者传输过程中占用的资源,语音频信号在发送端进行压缩处理后传输到接收端,接收端通过解压缩处理恢复语音频信号并进行播放。

在目前的多速率语音频编码中,由于网络状态的不同,网络会对从编码端传输到网络的码流做不同码率的截断,在解码端就会根据截断后的码流解码出不同带宽的语语音频信号,这样就使得输出的语语音频信号会在不同带宽间做切换。

不同带宽信号间的突然切换,会造成人耳听觉上的明显不舒适感;同时,由于滤波器及时频或频时变换等状态的更新,一般需要用到前后帧间的参数,在带宽切换时,如果不做一些适当的处理,这些状态的更新将会出现错误,从而造成一些能量激变的现象,造成听觉质量变差。

发明内容

本发明实施例的目的在于提供一种语音频信号处理方法和装置,在语音频信号带宽切换时提高听觉舒适性。

根据本发明的一实施例,一种语音频信号处理方法包括:

语音频信号从宽频带信号到窄频带信号的切换时,获得当前帧语音频信号对应的初始高频带信号;

根据当前帧语音频信号的谱倾斜参数、当前帧窄频带信号与历史帧窄频带信号的相关性获得所述初始高频带信号的时域全局增益参数;

利用所述时域全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;

合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。

根据本发明的另一实施例,一种语音频信号处理装置包括:

预测单元,当语音频信号从宽频带信号到窄频带信号的切换时,用于获得当前帧语音频信号对应的初始高频带信号;

参数获得单元,用于根据当前帧语音频信号的谱倾斜参数、当前帧窄频带信号与历史帧窄频带信号的相关性获得所述初始高频带信号的时域全局增益参数;

修正单元,用于利用所述时域全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;

合成单元,用于合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。

本发明实施例通过宽频带和窄频带间切换时对高频带信号的修正,使得宽频带和窄频带间高频带信号平稳的过渡,有效地去除了宽频带和窄频带间切换时造成的听觉不舒适感;同时,由于带宽切换算法和切换前高频带信号的编解码算法在相同的信号域,保证了不增加额外延且算法简单的同时,还保证了输出信号的性能。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610263621.8/2.html,转载请声明来源钻瓜专利网。

同类专利
  • 解码方法、解码装置、和计算机可读取的记录介质-201810026834.8
  • 日和崎佑介;守谷健弘;原田登;镰本优;福井胜宏 - 日本电信电话株式会社
  • 2013-08-28 - 2021-12-07 - G10L19/125
  • 其目的在于,提供在基于以CELP类的方式为首的声音的生成模型的声音编码方式中,即使输入信号为噪声重叠声音也能够实现自然的再现音的解码方法。包含:声音解码步骤,从所输入的码得到解码声音信号;噪声生成步骤,生成作为随机的信号的噪声信号;以及噪声附加步骤,将噪声附加处理后信号设为输出信号,其中,所述噪声附加处理后信号是将对噪声信号进行基于与过去的帧的解码声音信号对应的功率和与当前的帧的解码声音信号对应的谱包络中的至少其中一个的信号处理而得到的信号、以及解码声音信号进行相加而得到的。
  • 一种语音频信号处理方法和装置-201610263621.8
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2012-03-01 - 2021-02-09 - G10L19/125
  • 本发明实施例公开了一种语音频信号处理方法和装置。一个实施例中,语音频信号处理方法包括:当语音频信号出现带宽切换时,获得当前帧语音频信号对应的初始高频带信号;获得所述初始高频带信号时域全局增益参数;将能量比值和所述时域全局增益参数进行加权处理,得到的加权值作为预测的全局增益参数,其中,能量比值为历史帧高频带时域信号能量与当前帧初始高频带信号能量的比值;利用预测的全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。
  • 一种语音频信号处理方法和装置-201210051672.6
  • 刘泽新;苗磊 - 华为技术有限公司
  • 2012-03-01 - 2013-09-11 - G10L19/125
  • 本发明实施例公开了一种语音频信号处理方法和装置。一个实施例中,语音频信号处理方法包括:当语音频信号出现带宽切换时,获得当前帧语音频信号对应的初始高频带信号;获得所述初始高频带信号时域全局增益参数;将能量比值和所述时域全局增益参数进行加权处理,得到的加权值作为预测的全局增益参数,其中,能量比值为历史帧高频带时域信号能量与当前帧初始高频带信号能量的比值;利用预测的全局增益参数对所述初始高频带信号进行修正,获得修正的高频带时域信号;合成当前帧的窄频带时域信号和所述修正的高频带时域信号并输出。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top