[发明专利]语音信号复原装置以及语音信号复原方法有效
申请号: | 201180073679.1 | 申请日: | 2011-12-27 |
公开(公告)号: | CN103827967A | 公开(公告)日: | 2014-05-28 |
发明(设计)人: | 细谷耕佑;古田训;山浦正 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L21/04 | 分类号: | G10L21/04;G10L21/0216 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 张丽 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 复原 装置 以及 方法 | ||
技术领域
本发明涉及语音信号复原装置以及语音信号复原方法,该语音信号复原装置以及语音信号复原方法从由于经由电话线路等传送路等而频率频带被限制为窄频带的语音信号向宽频带的语音信号扩展、或者对由于噪声抑制处理以及语音压缩处理等而劣化以及缺损了的频带的语音信号进行复原。
背景技术
在模拟电话中,通过电话线路发送的语音的频率频带被限制得较窄、例如300~3400Hz。因此,无法说以往的电话线路的音质非常良好。另外,在便携电话等数字语音通信中,由于比特率的限制,与模拟线路同样地频带宽度被限制,所以即使在该情况下,也无法说音质良好。
针对上述课题,有在接收侧根据窄频带语音信号虚拟地生成或者复原宽频带语音信号的语音信号复原技术。但是,该语音信号复原技术本来是作为应用于音频或者固定电话的技术而发展起来的,以在成为复原对象的窄频带语音信号中未混入噪声、或者仅混入少量的噪声的环境为前提的情况较多。
另一方面,作为在成为复原对象的窄频带语音信号中混入了噪声的情况下的、虚拟的宽频带语音信号的复原技术,提出了例如专利文献1的语音频带扩展装置。
在该专利文献1中,作为语音信号复原的预处理,导入了将窄频带语音信号分离为噪声去除信号(语音分量)和提取噪声信号(噪声分量)的分量分离部。该分量分离部由噪声去除部、差分处理部以及周期分量去除部构成,分离为由噪声去除部提取出的语音分量、和由差分处理部以及周期分量去除部提取出的噪声分量。然后,在分量分离部的后级,针对各个分量进行语音信号复原,从而即使在成为输入的窄频带语音信号中混入了噪声,令人不悦的噪声降低,所输出的宽频带的语音复原信号的清晰度提高。
专利文献1:日本特开2011-75728号公报
发明内容
在上述以往方法中,存在以下叙述的课题。
在上述专利文献1公开的语音信号复原技术中,在成为输入的窄频带语音信号中以低SN比(Signal to Noise ratio:信噪比)混入了噪声的情况下,噪声去除部的噪声推测未顺利地动作,噪声量将被过剩地推测。于是,根据被过剩地推测的噪声量进行噪声抑制,所以存在不仅是窄频带语音信号的噪声分量、而且语音分量也被抑制,且所分离出的语音分量的谐波构造破坏这样的课题。
进而,还存在如果使用谐波构造破坏了的窄频带语音信号来生成包括扩展频带的微细构造的音源信号,则反而变为清晰度低的语音这样的课题。其原因为,由于使用窄频带语音信号的谐波构造的信息来生成包括扩展频带的微细构造的音源信号,所以易于受到谐波构造的破坏的影响的缘故。
本发明是为了解决上述课题而完成的,其目的在于提供一种语音信号复原装置以及语音信号复原方法,即使在成为输入的窄频带语音信号中以低SN比混入了噪声的情况下,也能够防止窄频带语音信号的谐波构造的破坏,生成清晰度高的语音复原信号。
本发明提供一种语音信号复原装置,其特征在于,具备:音源生成部,根据第1频率频带的语音信号生成包含该第1频率频带的第2频率频带的音源信号;噪声抑制部,抑制第1频率频带的语音信号中包含的噪声分量;谱包络推测部,根据由噪声抑制部抑制了噪声的第1频率频带的语音信号,推测第2频率频带的谱包络;以及信号合成部,合成音源生成部生成的第2频率频带的音源信号以及谱包络推测部推测出的第2频率频带的谱包络,生成第2频率频带的语音信号。
本发明提供一种语音信号复原方法,其特征在于,具备:音源生成步骤,根据第1频率频带的语音信号生成包含该第1频率频带的第2频率频带的音源信号;噪声抑制步骤,抑制第1频率频带的语音信号中包含的噪声分量;谱包络推测步骤,根据在噪声抑制步骤中抑制了噪声的第1频率频带的语音信号,推测第2频率频带的谱包络;以及信号合成步骤,合成在音源生成步骤中生成的第2频率频带的音源信号以及在谱包络推测步骤中推测出的第2频率频带的谱包络,生成第2频率频带的语音信号。
根据本发明,设为根据未进行噪声抑制处理的第1频率频带的语音信号生成音源信号,所以能够防止该语音信号的谐波构造的破坏。因此,即使在以低SN比混入了噪声的情况下,也能够使用语音信号本来具有的谐波构造的信息来生成音源信号,作为结果,能够生成清晰度高的语音复原信号。
附图说明
图1是示出本发明的实施方式1的语音信号复原装置的结构的框图。
图2是实施方式1的语音信号复原装置进行的频带扩展处理的影像图。
图3是示出本发明的实施方式2的语音信号复原装置的结构的框图。
图4是示出本发明的实施方式3的语音信号复原装置的结构的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180073679.1/2.html,转载请声明来源钻瓜专利网。