[发明专利]一种自动声音转换方法在审
申请号: | 201811583082.1 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109712634A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 栾峰;杜中强;张镇荣;黄楚均;潘步年 | 申请(专利权)人: | 东北大学 |
主分类号: | G10L21/01 | 分类号: | G10L21/01;G10L21/013;G10L21/007 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 李晓光 |
地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 源语音 目标语音 自动声音 对齐 平滑 音调 语音 方式修改 幅度包络 匹配算法 时间尺度 时间对齐 手动校正 语音特性 语音转换 音量 转换 算法 逐帧 相加 音色 旋律 歌曲 演讲 娱乐 教学 | ||
本发明公开一种自动声音转换方法,包括以下步骤:1)运用声音中的旋律和语音特性这些共同特征将源语音和目标语音实现语音的平滑对齐;2)根据语音平滑对齐的结果,按照时间长度比例,对源语音进行时间尺度修改,使源语音和目标语音的时间对齐;3)使用音调同步重叠相加算法和简单幅度包络匹配算法以逐帧方式修改源语音的音调和音量。本发明实现了全自动语音转换,不需要手动校正,不需要额外的信息,仅在保持歌曲音色的同时修改歌唱中的表达元素,不仅在歌唱领域具有极大的用途,而且在演讲,教学,娱乐等领域具有极大的用途。
技术领域
本发明涉及一种语音信号处理技术,具体为一种自动声音转换方法。
背景技术
随着生活水平的不断提高,人们的精神生活也越来越丰富。唱歌(卡拉OK)是人们的娱乐方式之一。根据歌唱技巧,通过声音处理软件可以将歌曲渲染成动人的音乐或只是嘈杂的声音。歌唱声音变形,手语语音合成、语音->唱歌-唱歌->语音转换、语音音色转换中使用的以参考录音为对象,获取歌唱声音表达参数的语音转换方法比较普遍。
Autotune,VariAudio和Melodyne等商用人声矫正工具,主要侧重于改变歌声的音调,其中一些能够通过编辑转录的MIDI音符来操纵音符开始时间或其他音乐表达方式。尽管它们在某种程度上提供了自动控制,但为了获得满意的结果,校正过程通常是繁琐且重复的。
以前的一些工作试图最小化手动修改音乐表达中的音频信号。Bryan等人提出了一种变速率时间拉伸方法,允许用户轻松修改拉伸比。给定用户引导的刚度曲线,该方法通过约束优化程序自动计算与时间相关的拉伸速率。Roebel等人提出了一种去除颤音表达式的算法。完全基于光谱包络平滑操作而无需操纵各个部分参数。虽然这些方法在处理歌声信号方面提供了更多便利,但它们仍然在某种程度上需要用户指南或参数控制
发明内容
针对现有技术中语音转换存在校正过程繁琐、需要用户指南或参数控制等不足,本发明要解决的问题是提供一种不需要手动校正、可从一种语音转换为指定语音的自动声音转方法。
为解决上述技术问题,本发明采用的技术方案是:
本发明一种语音自动转换处理方法,包括以下步骤:
1)运用声音中的旋律和语音特性这些共同特征将源语音和目标语音实现语音的平滑对齐;
2)根据语音平滑对齐的结果,按照时间长度比例,对源语音进行时间尺度修改,使源语音和目标语音的时间对齐;
3)使用音调同步重叠相加算法和简单幅度包络匹配算法以逐帧方式修改源语音的音调和音量。
步骤2)中,源语音和目标语音的时间对齐,指对源语音和目标语音进行特征提取,然后使用动态时间规整对这些特征进行对齐。
所述特征提取为最大滤波常数Q变换和从音素分类器中提取的音素分数这两个特征。
步骤2)中,时间长度比例,指使用MATLAB中的sgolayfilt函数将三阶Savitzky-Golay滤波器应用于分段线性对齐路径;将平滑后的结果与所给对齐路径进行比较,使用滤波路径的斜率计算时间拉伸率。
步骤2)中,时间尺度修改,指根据每帧变化的平滑时间拉伸比,将其应用于时间尺度修改TSM算法,以便在时间上对齐语音。
步骤3)中,音调同步重叠相加算法修改,是指通过算法对齐音调,该算法所需音调比计算如下:
其中,β(i)为音调比,f0T(i)和f0ST(i)分别表示目标和源语音的帧级音调序列,asT(i)为在时间对准之后从源获得的非周期性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811583082.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音频编码器和解码器
- 下一篇:一种声音数据处理方法、智能终端及存储介质