[发明专利]语音信号处理方法、装置及终端有效
申请号: | 201811593104.2 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109697985B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 李敬 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G10L21/013 | 分类号: | G10L21/013 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
地址: | 511442 广东省广州市番禺区南村*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 终端 | ||
本发明提供语音信号处理方法,包括:依据设定帧长度对语音信号分帧得到帧信号,提取每帧帧信号的音频参数;语音信号包括第一语音信号和第二语音信号,音频参数对应第一音频参数和第二音频参数;将第一语音信号的帧信号与对第二语音信号的帧信号对齐匹配;将第一语音信号的帧信号的第一音频参数替换为匹配的第二语音信号的帧信号的第二音频参数,并根据第一语音信号中帧信号的第二音频参数重新合成语音信号。本发明还提供语音信号处理装置和终端。本发明能实现生成特定声音的效果,生成后语音信号仍保留第一语音信号对应原说话人的音调、语速发音特点,兼具第二语音信号对应变声对象声音,克服不能针对特定对象变声和变声效果差的技术缺陷。
技术领域
本发明涉及语音技术领域,具体而言,本发明涉及一种语音信号处理方法、装置及终端。
背景技术
在语音处理中,经常需要对语音进行变声处理,使其声音的特性发生改变。传统的变声方案通常是将语音中的某些参数进行调整,使其偏离原本发声者的语音,比如类似morphvox pro这样的软件,将原始声音变为男声、女声、童声、机器人声音等声音。现有技术方案的基本原理是利用不同人群的基音频率差异(男声、女声、童声的基音频率逐渐升高),直接调整原始语音的基音频率,使得原始语音听起来像是另一类人发出的声音(例如是男声变女声、女声变童声)。
但这些技术方案,只能随机改动的语音的特性,而不能针对特定对象的特性进行改变,变声效果较差。
发明内容
本发明的目的旨在至少能解决上述的技术缺陷之一,特别是不能针对特定对象的特性进行改变,变声效果较差的技术缺陷。
本发明提供一种语音信号处理方法,包括如下步骤:
依据设定帧长度对语音信号进行分帧得到帧信号,并提取每帧帧信号的音频参数;其中,所述语音信号包括第一语音信号和第二语音信号,所述音频参数对应为第一音频参数和第二音频参数;
将第一语音信号的帧信号与对第二语音信号的帧信号进行语音信号对齐匹配;
将第一语音信号的帧信号的第一音频参数替换为相匹配的第二语音信号的帧信号的第二音频参数,并根据第一语音信号中帧信号的第二音频参数重新合成语音信号。
在其中一个实施例中,所述音频参数包括:基音频率、共振峰频谱包络和非周期激励信号。
在其中一个实施例中,所述依据设定帧长度对语音信号进行分帧得到帧信号,并提取每帧帧信号的音频参数的步骤,包括:
依据设定帧长度对语音信号进行分帧得到帧信号;
对每帧帧信号进行基音频率分析,得到对应每帧帧信号的基音频率;
对每帧帧信号的波形和所述基音频率进行频谱包络分析,得到对应每帧帧信号的共振峰频谱包络;
根据每帧帧信号的波形、基音频率以及共振峰频谱包络分析,得到对应每帧帧信号的非周期激励信号。
在其中一个实施例中,所述对每帧帧信号进行基音频率分析,得到对应每帧帧信号的基音频率的步骤包括:
对每帧帧信号进行滤波获得若干候选基音频率及其周期;
根据若干所述候选基音频率在不同周期间的零交点、峰值以及下降间隔,计算得到若干所述候选基音频率的置信度;
选取置信度最高的候选基音频率作为该帧帧信号的基音频率。
在其中一个实施例中,所述对每帧帧信号的波形和所述基音频率进行频谱包络分析,得到对应每帧帧信号的共振峰频谱包络的步骤包括:
根据每帧帧信号的波形和基音频率对应的周期,对语音信号进行汉明窗分割得到时域信号;
对所述时域信号进行傅里叶变换得到功率谱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811593104.2/2.html,转载请声明来源钻瓜专利网。