[发明专利]一种声气信号分离与合成的方法及系统有效
申请号: | 201511033483.6 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105679331B | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 滕少华;霍颖翔;张巍 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/028;G10L13/07;G10L25/18 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声气 信号 分离 合成 方法 系统 | ||
1.一种声气信号分离与合成的方法,其特征在于:包括:
A、将采样的人声语音信号由时域转换到频域,得到原始的频谱图;
B、根据原始的频谱图测定人声语音信号的基频;
C、在原始的频谱图上将与基频成整数倍距离的位置标记为峰值的位置,以两峰之间的位置作为谷值的位置;
D、从原始的频谱图中分别将峰值的位置信息和谷值的位置信息提取出来,进而得到峰值的位置信息对应的声音信息频谱图以及谷值的位置信息对应的气音信息频谱图;
E、分别对声音信息频谱图中的声音信息和气音信息频谱图中的气音信息进行处理;
F、将处理后的声音信息和处理后的气音信息频进行合成,得到最终的人声语音信号。
2.根据权利要求1所述的一种声气信号分离与合成的方法,其特征在于:所述步骤A,其具体为:
采用至少0.02322*a点的重叠加窗快速傅里叶变换对采样的人声语音信号进行处理,得到原始的频谱图,其中,a为设定的采样频率。
3.根据权利要求2所述的一种声气信号分离与合成的方法,其特征在于:所述步骤B,其具体为:
通过分片段重叠加窗测定时域信号周期序列的方法,准确测定出人声语音信号的信号流在不同时间点的基频,其中,片段的长度在快速傅里叶变换窗口长度的1到4倍的范围内,重叠加窗的间距小于等于快速傅里叶变换的窗间距。
4.根据权利要求2所述的一种声气信号分离与合成的方法,其特征在于:所述步骤D,其包括:
将峰值的位置信息从原始的频谱图中提取出来,进而得到声音信息频谱图;
将谷值的位置的信息从原始的频谱图中提取出来,进而得到气音信息频谱图。
5.根据权利要求4所述的一种声气信号分离与合成的方法,其特征在于:所述将峰值的位置信息提取出来,得到声音信息频谱图这一步骤,其包括:
D11、计算快速傅里叶变换结果中的理论峰值位置p,所述理论峰值位置p的计算公式为:p=2nz/a*m,其中,2n为快速傅里叶变换的点数,n和m均为正整数,z为快速傅里叶变换窗口对应位置所测定的基频,0<p<2n-1;
D12、判断理论峰值位置p是否为整数,若是,则以理论峰值位置p对应的信息作为提取出的声音信息;反之,则采用四舍五入法或线性插值法进行处理,得到提取出的声音信息。
6.根据权利要求5所述的一种声气信号分离与合成的方法,其特征在于:所述步骤D12中采用四舍五入法或线性插值法进行处理,得到提取出的声音信息这一步骤,其具体为:
若采用四舍五入法,则对理论峰值位置p进行四舍五入,然后以p四舍五入后的结果对应的信息作为提取出的声音信息;
若采用线性插值法,则提取出的声音信息x的计算公式为:x=(1-(p-q))*fq+(p-q)*fp,其中,q为p向下取整的结果,fq和fp分别为快速傅里叶变换结果中位置q和位置p对应的分量。
7.根据权利要求4所述的一种声气信号分离与合成的方法,其特征在于:所述将谷值的位置的信息从原始的频谱图中提取出来,进而得到气音信息频谱图这一步骤,其包括:
D21、计算快速傅里叶变换结果中的理论谷值位置s,所述理论谷值位置s的计算公式为:s=2nz/a*(m-0.5),其中,2n为快速傅里叶变换的点数,n和m均为正整数,z为快速傅里叶变换窗口对应位置所测定的基频,0<s<2n-1;
D22、判断理论谷值位置s是否为整数,若是,则以理论谷值位置s对应的信息作为提取出的气音信息;反之,则采用四舍五入法或线性插值法进行处理,得到提取出的气音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511033483.6/1.html,转载请声明来源钻瓜专利网。