[发明专利]语音信号处理方法、装置及终端有效

申请号：	201811593104.2	申请日：	2018-12-25
公开（公告）号：	CN109697985B	公开（公告）日：	2021-06-29
发明（设计）人：	李敬	申请（专利权）人：	广州市百果园信息技术有限公司
主分类号：	G10L21/013	分类号：	G10L21/013
代理公司：	北京市立方律师事务所 11330	代理人：	刘延喜
地址：	511442 广东省广州市番禺区南村***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音信号处理方法装置终端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供语音信号处理方法，包括：依据设定帧长度对语音信号分帧得到帧信号，提取每帧帧信号的音频参数；语音信号包括第一语音信号和第二语音信号，音频参数对应第一音频参数和第二音频参数；将第一语音信号的帧信号与对第二语音信号的帧信号对齐匹配；将第一语音信号的帧信号的第一音频参数替换为匹配的第二语音信号的帧信号的第二音频参数，并根据第一语音信号中帧信号的第二音频参数重新合成语音信号。本发明还提供语音信号处理装置和终端。本发明能实现生成特定声音的效果，生成后语音信号仍保留第一语音信号对应原说话人的音调、语速发音特点，兼具第二语音信号对应变声对象声音，克服不能针对特定对象变声和变声效果差的技术缺陷。

技术领域

本发明涉及语音技术领域，具体而言，本发明涉及一种语音信号处理方法、装置及终端。

背景技术

在语音处理中，经常需要对语音进行变声处理，使其声音的特性发生改变。传统的变声方案通常是将语音中的某些参数进行调整，使其偏离原本发声者的语音，比如类似morphvox pro这样的软件，将原始声音变为男声、女声、童声、机器人声音等声音。现有技术方案的基本原理是利用不同人群的基音频率差异(男声、女声、童声的基音频率逐渐升高)，直接调整原始语音的基音频率，使得原始语音听起来像是另一类人发出的声音(例如是男声变女声、女声变童声)。

但这些技术方案，只能随机改动的语音的特性，而不能针对特定对象的特性进行改变，变声效果较差。

发明内容

本发明的目的旨在至少能解决上述的技术缺陷之一，特别是不能针对特定对象的特性进行改变，变声效果较差的技术缺陷。

本发明提供一种语音信号处理方法，包括如下步骤：

依据设定帧长度对语音信号进行分帧得到帧信号，并提取每帧帧信号的音频参数；其中，所述语音信号包括第一语音信号和第二语音信号，所述音频参数对应为第一音频参数和第二音频参数；

将第一语音信号的帧信号与对第二语音信号的帧信号进行语音信号对齐匹配；

将第一语音信号的帧信号的第一音频参数替换为相匹配的第二语音信号的帧信号的第二音频参数，并根据第一语音信号中帧信号的第二音频参数重新合成语音信号。

在其中一个实施例中，所述音频参数包括：基音频率、共振峰频谱包络和非周期激励信号。

在其中一个实施例中，所述依据设定帧长度对语音信号进行分帧得到帧信号，并提取每帧帧信号的音频参数的步骤，包括：

依据设定帧长度对语音信号进行分帧得到帧信号；

对每帧帧信号进行基音频率分析，得到对应每帧帧信号的基音频率；

对每帧帧信号的波形和所述基音频率进行频谱包络分析，得到对应每帧帧信号的共振峰频谱包络；