[发明专利]声音处理装置及声音处理方法有效
| 申请号: | 201110387197.5 | 申请日: | 2011-11-29 |
| 公开(公告)号: | CN102479505A | 公开(公告)日: | 2012-05-30 |
| 发明(设计)人: | 山边孝朗 | 申请(专利权)人: | JVC建伍株式会社 |
| 主分类号: | G10L11/02 | 分类号: | G10L11/02;G10L15/04 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 谢丽娜;关兆辉 |
| 地址: | 日本神*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 处理 装置 方法 | ||
技术领域
本发明涉及一种识别输入信号中的噪声成分和声音成分的声音处理装置及声音处理方法。
背景技术
作为收录声音而生成的信号的输入信号中,存在含有声音的声音区间、及因会话间隙、喘息等而不含有声音的非声音区间。例如在声音识别装置中,通过确定声音区间和非声音区间,来实现声音识别率的提高、及声音识别处理的高效化。并且,在利用了移动电话、无线设备等的移动体通信中,通过在声音区间和非声音区间切换输入信号的编码处理,可保持音质的同时,提高压缩率、传送效率。在移动体通信中,因要求实时性,所以希望抑制声音区间的判断处理造成的延迟。
作为抑制这种延迟的声音区间的判断处理,例如提出了以下方案:对输入信号的帧使用倒频谱法,导出作为表示含有最多泛音成分的基波的信息的谐波信息,通过该谐波信息、及表示该帧的能量是否为阈值以上的功率信息是否分别表示声音的特征,来检测出声音区间(例如专利文献1),或导出扩展到频率区域的频谱的自相关,根据该相关的高低检测出声音区间(例如专利文献2)。
专利文献1:JP特开2009-294537号公报
专利文献2:JP特开2009-69425号公报
发明内容
但是,上述专利文献1、2等现有的声音区间的检测技术在噪声较低的环境下有效,但当噪声变大时,输入信号的帧的频率分布的平坦性(峰值的频率)、音高(pitch)等声音性质埋没于噪声中,易产生声音区间的误测。并且,倒频谱法需要进行二次傅立叶变换,频率区域上的处理负荷较高,耗电变大。因此,特别在移动体通信这样以蓄电池驱动为前提的情况下,当使用倒频谱法时,为对应耗电,需要增大蓄电池的容量,会导致高成本化、大型化。
进一步,在输入信号中含有像声音一样具有周期性的噪声时、根据声音的周期性检测出声音的特征的现有的方法中,存在将噪声判断为声音,出现误测的情况。
因此,本发明鉴于该课题,其目的在于提供一种可识别输入信号中的噪声成分和声音成分的声音处理装置及声音处理方法。
为解决上述课题,本发明的声音处理装置的特征在于,具有:帧化部,以预先确定的帧单位截取输入信号,生成帧化输入信号;频谱生成部,将上述帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图;峰值检测部,从上述频谱图中检测出具有峰值的峰值频谱,生成集中了上述峰值频谱的峰值图形;以及泛音判断部,在上述峰值图形中,判断成为基音和泛音的关系的泛音构造,即泛音频谱。
峰值检测部也可以在多个频谱的能量总和与相邻的多个频谱的能量总和之间的能量比超过预先确定的阈值时,将该多个频谱中、基于预先确定的规则的一个或多个频谱作为峰值频谱。
泛音判断部也可以根据通过多个频谱中的每个频谱的能量进行了加权的重心频率,判断泛音频谱。
多个频谱整体的频带也可以是小于100Hz的频带。
频谱生成部也可以以小于33Hz的频率分解能力生成频谱图。
频谱生成部也可以生成200Hz到2000Hz范围的频谱图。
也可以还具有:噪声衰减部,在上述频谱图中,衰减从上述峰值图形中去除了泛音频谱的图形所对应的能量;以及声音判断部,根据已衰减的频谱图,判断帧化输入信号是否是声音。
也可以还具有:噪声衰减部,在频谱图中,衰减从峰值图形中去除了泛音频谱的图形所对应的能量;以及噪声削减部,根据已衰减的频谱图削减噪声成分。
为解决上述课题,本发明的声音处理方法的特征在于,以预先确定的帧单位截取输入信号,生成帧化输入信号,将帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图,从频谱图检测出具有峰值的峰值频谱,生成集中了峰值频谱的峰值图形,在峰值图形中,判断成为基音和泛音的关系的泛音构造,即泛音频谱。
上述声音处理装置中的技术思想所对应的构成要素、及其说明也可适用于该声音处理方法。
如上所述,在本发明中,可识别输入信号中的噪声成分和声音成分。
附图说明
图1是具有周期性的噪声信号的频率特性图。
图2是包括具有周期性的噪声信号和声音信号的输入信号的频率特性图。
图3是图2所示的输入信号中,仅提取了声音成分的频率特性图。
图4是表示声音处理装置的概要功能的功能框图。
图5是用于说明总能量的导出的说明图。
图6是用于说明重心频率的说明图。
图7是表示声音处理方法的处理的流程的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于JVC建伍株式会社,未经JVC建伍株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110387197.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆的智能头灯组件
- 下一篇:用于双离合器变速器的离合器促动装置





