[发明专利]一种声气信号分离与合成的方法及系统有效
申请号: | 201511033483.6 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105679331B | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 滕少华;霍颖翔;张巍 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/028;G10L13/07;G10L25/18 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声气 信号 分离 合成 方法 系统 | ||
本发明公开了一种声气信号分离与合成的方法及系统,方法包括:将采样的人声语音信号由时域转换到频域,得到原始的频谱图;根据原始的频谱图测定人声语音信号的基频;在原始的频谱图上将与基频成整数倍距离的位置标记为峰值的位置,以两峰之间的位置作为谷值的位置;从原始的频谱图中分别将峰值的位置信息和谷值的位置信息提取出来,进而得到对应的声音信息频谱图以及对应的气音信息频谱图;分别对声音信息和气音信息进行处理;将处理后的声音信息和处理后的气音信息频进行合成,得到最终的人声语音信号。本发明能将声音信息与气音信息进行分离,以单独对声音信号或气音信号进行修改等后续处理,可广泛应用于信号处理领域。
技术领域
本发明涉及信号处理领域,尤其是一种声气信号分离与合成的方法及系统。
背景技术
语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也是人类进行思维的一种依托。人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储和获取语音信息,这对于促进社会的发展具有十分重要的意义。最近几十年,对语音的研究使科学家和工程师们走到一起,从而形成了一门重要的学科:语音信号处理。语音信号处理技术简称语音处理,它与语言学、语音学、心理学、声学、计算机学以及人工智能等学科都有着紧密的联系,极大地推动了社会的科技进步,我们可以用自动语音识别技术,使手写文稿和手工打印文本变成自动听写机操作;把人工查阅各种书面文字资料的操作变为口呼自动查阅各种各样的数据库;可以采用语音合成技术,将存储的语音或文字资料转化为语音高质量的回放,甚至自动翻译成另一种语言的语音回放或进行文字显示。总而言之,语音信号处理技术的研究对于信息化社会的发展具有极其重要的意义。
然而,目前对人声的语音信号处理技术大多只能根据基频与共振峰的关系提取出声带与口腔共鸣发出的声音信号,尚未能从人声语音信号中提取出唇齿发出的气音信号,无法单独对声音信号或气音信号进行修改等后续处理。
发明内容
为解决上述问题,本发明的目的在于:提供一种能将声音信号和气音信号进行分离的,声气信号分离与合成的方法。
本发明的另一目的在于:提供一种能将声音信号和气音信号进行分离的,声气信号分离与合成的系统。
本发明所采取的技术方案是:
一种声气信号分离与合成的方法,包括:
A、将采样的人声语音信号由时域转换到频域,得到原始的频谱图;
B、根据原始的频谱图测定人声语音信号的基频;
C、在原始的频谱图上将与基频成整数倍距离的位置标记为峰值的位置,以两峰之间的位置作为谷值的位置;
D、从原始的频谱图中分别将峰值的位置信息和谷值的位置信息提取出来,进而得到峰值的位置信息对应的声音信息频谱图以及谷值的位置信息对应的气音信息频谱图;
E、分别对声音信息频谱图中的声音信息和气音信息频谱图中的气音信息进行处理;
F、将处理后的声音信息和处理后的气音信息频进行合成,得到最终的人声语音信号。
进一步,所述步骤A,其具体为:
采用至少0.02322*a点的重叠加窗快速傅里叶变换对采样的人声语音信号进行处理,得到原始的频谱图,其中,a为设定的采样频率。
进一步,所述步骤B,其具体为:
通过分片段重叠加窗测定时域信号周期序列的方法,准确测定出人声语音信号的信号流在不同时间点的基频,其中,片段的长度在快速傅里叶变换窗口长度的1到4倍的范围内,重叠加窗的间距小于等于快速傅里叶变换的窗间距。
进一步,所述步骤D,其包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511033483.6/2.html,转载请声明来源钻瓜专利网。