[发明专利]语音变速的方法有效

专利信息
申请号: 200610164672.1 申请日: 2006-12-15
公开(公告)号: CN101202048A 公开(公告)日: 2008-06-18
发明(设计)人: 颜铭祥;颜睿余;高光前 申请(专利权)人: 微星科技股份有限公司
主分类号: G10L21/00 分类号: G10L21/00;G10L21/04;G10L19/00;G11B20/10;G09B5/04
代理公司: 隆天国际知识产权代理有限公司 代理人: 郭晓东
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 变速 方法
【说明书】:

技术领域

发明是一种语音变速的方法,别是一种基于语音信号的基本周期的语音变速的方法。

背景技术

具备语言学习功能的电子设备,可以将所欲学习的语言会话预先录制在该设备中,而该电子设备可为便携式,让使用者可以随时随地进行语言的学习。然而,每一位使用者的程度并不相同,造成一段播放速度相同的会话,有些使用者听起来会觉得阅读速度适当而可以听懂,但却有些使用者会觉得阅读速度过快而听不懂。因此变速播放的功能成为语言学习机所具备的功能之一。

所谓变速播放指的是语言学习机在语音播放时,可以依使用者的需求而变更播放的速度,而且当速度变更时音调却不变。因此理想上,不论变速播放是变慢或变快,使用者在聆听上都可以听得清楚,而这一项功能对于语言学习有很大的帮助。

传统语言学习机虽然具有变速播放的功能,但往往经过变速播放后其所播放出来的语音便会失真。由于语音信号是连续性的模拟信号,随着不同人的发声或不同的音源所产生的声纹频率并不相同。一般公知的语音变速的技术的做法是将取样而得的语音数据重复播放,或以间隔的方式跳跃播放,而达到播放速度的变更。这样的做法虽然可以达到播放速度变慢或变快,且与原语音的信号包格线相同,但是会造成回音与机械音。同时造成声纹频率降低,效果就如同将录音机马达转速变慢或变快一样,使得语音明显失真。

因此,如何让使用者在语言学习机上操作变速播放的功能时,语音变速后能维持原音的音调而不失真,为一亟待解决的问题。

发明内容

有鉴于此本发明提出一种语音变速的方法,针对语音信号进行处理,让使用者按照自己的需求加速或减速语音的播放,而语音经过变速后输出到使用者的耳朵,一样能清楚而不失原音调的语音。

本发明所提出的一种语音变速的方法,包含下列步骤:接收一原始语音信号;计算出该原始语音信号的一基本周期;依据该基本周期定义一搜寻范围;在该原始语音信号的每个该搜寻范围内寻找一最大值;依据该最大值将该原始语音信号划分为多个语音区段;依据一变速指令对该原始语音信号的每个该语音区段进行一变速运算,而取得一变速语音信号;及输出该变速语音信号。

如本发明所述的语音变速的方法,其中该基本周期系利用一总和振幅差异函数计算出。

如本发明所述的语音变速的方法,其中该基本周期系利用一平均振幅差异函数计算出。

如本发明所述的语音变速的方法,其中该变速指令为减速时,该变速运算复制部分该语音区段,使该变速语音信号长于该原始语音信号。

如本发明所述的语音变速的方法,其中该变速指令为加速时,该变速运算删除部分该语音区段,使该变速语音信号短于该原始语音信号。

如本发明所述的语音变速的方法,其中该变速运算包含下列步骤:将该原始语音信号的每个该语音区段乘以一比重函数,成为一比重区段;及叠加该比重区段。

如本发明所述的语音变速的方法,其中该变速运算更包含下列步骤:插入叠加后的该比重区段在该语音区段之间。

如本发明所述的语音变速的方法,其中该变速运算更包含下列步骤:以叠加后的该比重区段取代该语音区段。

如本发明所述的语音变速的方法,其中该比重函数在每一该搜寻范围内,在该最大值之前为递增函数,在该最大值之后为递减函数。

如本发明所述的语音变速的方法,其中该比重函数为三角波函数。

如本发明所述的语音变速的方法,其中该语音区段大小不同时,该语音区段的重叠部分乘以该比重函数,未重叠部分不需乘以该比重函数。

本发明一开始先将原始语音信号区分为多个语音区段。所分割的区段并不是如传统技术一般为固定的,而是根据总和振幅差异函数(Sum ofMagnitude Difference Function,SMDF)或平均振幅差异函数(Average ofMagnitude Difference Function,AMDF),先取得原始语音信号的基本周期(pitch period),再根据基本周期左右附近的数据去寻找最大值。接着利用寻找出的最大值将原始语音信号划分为多个语音区段。上述作法的好处是,将语音信号以最细小的基本周期单位进行后续的变速处理。因此,本发明采用更精确的方法来改良相关的语音变速质量。

附图说明

图1是语音变速的方法的流程图。

图2是语音信号的基本周期。

图3是利用总和振幅差异函数(SMDF)计算出基本周期的示意图。

图4是原始语音信号的语音区段划分图。

图5是变速指令为减速时的变速运算示意图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微星科技股份有限公司,未经微星科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200610164672.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top