[发明专利]语音合成无效
申请号: | 95192141.X | 申请日: | 1995-03-17 |
公开(公告)号: | CN1144008A | 公开(公告)日: | 1997-02-26 |
发明(设计)人: | 安德鲁·洛厄里 | 申请(专利权)人: | 英国电讯有限公司 |
主分类号: | G10L5/04 | 分类号: | G10L5/04 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 蹇炜 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 | ||
本发明涉及语音的自动生成(例如从编码文本输入中)。更具体地涉及分析合成法,其中“合成的”语音是从存储的始自来人类说话者导出的语音波形生成的(与“用规则合成”系统对应)。为了产生自然发音的语音,有必要在合成语音中产生与出现在人类语音中的相同种类的上下文相关的(韵律学的)音调变化。本发明包含生成定义要作出的音高变化的韵律学信息,并致力于处理语音信号以达到这种音高变化的问题。
在F.J.Charpentier与MG Stella的“采用语音波形连接的重叠相加技术的复音合成”中描述了音高调节的一种方法,ASSP国际会议会报,IEEE,东京,1986年,2015-2018页。存储了各表示一个复音的语音波型的段,连同在时间上与波形的各音高周期的最大峰值值重合(对于发声的语音)并从而粗略地对应于说话人的声门闭合瞬间;或者对于不发声的语音是随意的音高标记。
利用长度等于三倍音高时段的Hamming窗口将要使用的波形部分分成重叠的段。为波形得出一个全程频谱包络,并利用离散傅立叶变换得出一个短期频谱包络;得出一个用频谱包络去除该短期频谱的“源分量”。然后用线性插入过程修正源分量的音高再将其与包络信息重新组合。用这一方法预处理之后,用重叠相加过程连接这些段以给出所希望的基本音高。
另一种建议免除了频域预处理而使用两倍音程持续时间的Hamming窗口(“基于语音的时域韵律修正的复音合成系统”,C.Hamon、E.Moulines与F.Charpentier,ASSP国际会议,Glasgow,1989年,238-241页)。
作为将时域重叠相加过程应用在一个完整的语音信号上的一种替代,可将它应用在一个激励分量上,例如通过使用LPC(线性预测编码)分析生成一个残留信号(或其参量表示)并在将其通过LPC合成滤波器之前在残留信号上作用重叠相加过程(“使用复音的文本到语音合成的音高同步波形处理技术”,F.Charpentier与E.Moulines,语音通信与技术欧洲会议,巴黎,1989年,卷II,13-19页)。
图1中示出重叠相加过程的的基本原理,其中示出了带有定心在激励峰值上的音高标记P的一个语音信号S;它是通过乘以窗口波形W(只示出其中的两个)而分成重叠的段的。合成的波形是通过将这些段加在一起而生成的,用时间移位来升高或降低音高,其中一个段偶而分别省略或重复。
按照本发明,提供了一种语音合成装置,其中包含可加以控制来改变由其合成的语音信号的音高的装置,具有:
(i)用于将语音信号分成一个频谱分量及一个激励分量的装置;
(ii)用一系列在发声语音的情况中与至少近似地对应于发声激励瞬间的音高定时标记信息同步的重叠窗口函数去乘该激励分量以将其分成开窗口的语音段的装置;
(iii)在这些段上作用可控时间移位并将它们加在一起的装置;以及
(iv)用于重新组合频谱与激励分量的装置,其中乘法装置每一音高时段至少采用两个窗口,各窗口具有小于一个音高时段的持续时间。窗口中最好包括采用定时标记部分的每一音高时段一个的第一窗口,及多个中间窗口,而这些中间窗口各有小于第一窗口的宽度。
另一方面,本发明提供一种语音合成装置,其中包含可加以控制来改变由其合成的语音信号的音高的装置,具有:
(i)用于将语音信号分成一个频谱分量及一个激励分量的装置;
(ii)用于通过插入来自输入信号样本的新信号样本而时间压缩/扩张激励分量的装置;以及
(iii)用于重新组合频谱与激励分量的装置,其中乘法装置每一个音高时段至少采用两个窗口,各窗口具有小于一个音高时段的持续时间。最好该压缩/扩张装置能响应至少近似地对应于发声激励瞬间的定时标记信息进行操作来与之同步地改变压缩/扩张的程度,使得激励信号在定时标记附近压缩/扩张得比在两个连续的这种标记之间的音高时段的中心上要少。
现在参照附图用示例的方式描述本发明的一些实施例附图中:
图2为按照本发明的合成装置的一种形成的方框图;
图3与5为例示两种重叠相加音高调节方法的定时图;以及
图4为展示为频谱分析目的而在语音信号上开窗口的定时图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英国电讯有限公司,未经英国电讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/95192141.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 携带式留言定时播放机-97242844.5
- 张展 - 张展
- 1997-12-08 - 1999-05-19 -
- 本实用新型公开了一种携带式留言定时播放机,其特征为受话器与话筒偏置电路连接,语言录放电路分别与话筒偏置电路、时间常数电路、音量调节功放电路、走时器相连接,走时器还与电源相连,音量调节功放电路还与扬声器相连接。本机使用方便、噪声小、语音逼真清晰,响度可调节语言录入存储掉电可保存数拾年,反复录放可达10万次以上,耗电量小,还具有性能稳定可靠,外形美观、体积小,便于携带的特点。
- 语音合成中的语音规整方法-97116047.3
- 张景嵩;沙海红;徐彬艳 - 英业达股份有限公司
- 1997-08-15 - 1999-02-24 -
- 本发明的方法是针对句子的文字内容,分析其对应的句型、词性、片语群及特殊词等,并自该规则库中检索出对应的每个音节的音节参数,进而求得一音节参数阵列,而该句子经由语音合成装置合成的WAV数据,则通过分音节模块,于其中插入音节标记,再依据上述音节参数阵列与WAV数据间的对应关系,针对所标出的每个音节进行语调类型、能量、时间长度及静音等处理,最后,再将处理后的语音数据重新整合成新的WAV数据,产生更接近自然语言的发音。
- 波形语音合成-96193162.0
- 安德鲁·劳里 - 英国电讯有限公司
- 1996-04-03 - 1998-05-06 -
- 通过在一个语音波形段的末尾和在另一个语音波形段的开头产生外推波形以产生一个具有同步音高标记的重叠区来连接语音波形段,然后求出穿过该重叠区的加权和以提供一个平滑过渡。
- 语音合成器-96192406.3
- 安德鲁·劳里;安德鲁·布林;彼得·杰克逊 - 英国电讯有限公司
- 1996-03-07 - 1998-04-01 -
- 记录的语音波形(例如,对应于语音)的各部分被进行组合,以合成单词。为了提供一种较平滑的传输,一个波形部分的每个发声部分具有调整到一预定参考电平的幅度。所使用的比例因子在每个部分之间和在发声和不发声部分之间的整个过渡区域是逐渐变化的。
- 声音识别方法,信息形成方法,声音识别装置和记录介质-96112292.7
- 南野活树 - 索尼公司
- 1996-07-19 - 1997-06-11 -
- 一种声音识别方法,其中给出多个声音识别目标字,并通过使用事先对于一个未知的输入声音信号计算的参数。向声音识别目标字加分,由此,提取和识别一个相应的声音识别目标字,其特征在于,通过使用声音识别目标字之间的相关值,将声音识别目标字构造成分层结构,并通过使用构造成分层结构的声音识别目标字的字典,对未知的输入声音信号进行分数计算。
- 语音合成-95192141.X
- 安德鲁·洛厄里 - 英国电讯有限公司
- 1995-03-17 - 1997-02-26 -
- 通过将语音信号分成一个频谱分量及一个激励分量而改变合成的语音信号的音高。在发声语音的情况中,将激励分量乘以与至少近似地对应于发声激励瞬间的音高定时标记信息同步的一系列重叠的窗口函数,以将其分成开窗口的语音段,在作用了可控制的时间位移之后重新将它们加在一起。然后重新组合频谱及激励分量。乘法以每一音高时段至少用两个窗口,各有小于一个音高时段的持续时间。作为替代,各窗口具有小于两倍定时标记之间的音高时段的持续时间并相对于定时标记不对称。
- 一种留言器-94232024.7
- 屈惠民 - 屈惠民
- 1994-12-20 - 1996-09-18 -
- 一种留言器,由语言输入电路、语言合成芯片,放大电路、开关电路、电源电路、扬声器、外壳等组成。与现有技术相比、本实用新型具有线路结构简单、体积小、生产成本低、携带使用方便的特点,可方便地应用于家庭或办公室等场所。
- 用于连续汉语语音合成的半音节方法-95101534.6
- 郑元成 - 郑元成
- 1995-03-06 - 1996-07-10 -
- 一种用于连续汉语语音合成的半音节方法,它把汉语音节分割为只包含一个音节的声母和该音节前一部分韵母的前半音节;由当前音节韵母的后一部分与下一个音节的前一部分组成的后半音节。汉语语音音节由构成该音节的前半音节和后半音节拼接而成。连续汉语语句由构成该语句中音节的前半音节和后半音节拼接而成。由汉语前半音节、后半闭音节和后半开音节组成一个包括任意汉语发音情况的汉语语音发音规则库。本发明能够合成出流畅的连续汉语语句。
- 语音合成数据存储器结构及其编码方法-94118981.3
- 萧捷胜;杨建兴;洪宗瑾 - 联华电子股份有限公司
- 1994-11-29 - 1996-06-05 -
- 一种语音合成数据存储器结构及其编码方法,其以多个基本存储器区段贮存基本语音数据,靠触发信号的控制提供起始地址以定址于指针存储器区段和基本存储器区段,使依既定组合输出基本语音数据;而且所述指针存储器区段和基本存储器区段中贮有一结束辨识码,用以提供停止输出的信息。
- 基音同步波形叠加汉语文语转换系统-94107920.1
- 吕士楠;初敏;关定华 - 中国科学院声学研究所
- 1994-08-01 - 1996-03-13 -
- 一种由汉语全部基本音节波形采样值及其基音同步标记构成的语音库,由词调模式、重音模式和句调模式构成的韵律规则库和利用基音同步波形叠加技术,对从语音库中取出的音节波形按韵律规则进行音长、音高和音强调节,然后拼接成清晰、自然的连续语言的基音同步波形叠加汉语文语转换系统如图1所示。该系统具有设备简单;数学运算少,能实时处理;输出语音清晰、流畅,接近自然语言的特点。它适用于机场、码头和车站的自动播音,各种信息自动咨询等。
- 语音合成器-94103582.4
- 李至诚 - 合泰半导体股份有限公司
- 1994-04-12 - 1995-10-25 -
- 本发明涉及一种可程序化的语音合成器,包括有一振荡器及时序产生电路、一选择码电路、一表格码电路、一语音码电路、一数字/模拟转换电路、一控制电路及一写入电路等,以可程序化只读存储器来完成语音数据的存取工作,且结合表格式触发方式发送语音信号,因此具有较高的实用性。
- 用于珠算出题的声音发生装置-90107703.8
- 青木喜彦;林克彦;庄野尚道;若桑昭男 - 可乐丽股份有限公司
- 1990-09-12 - 1994-04-20 -
- 一种珠算问题出题用的声音发生装置,包括储存具有出题开始用音节、出题终了用音节、数值音节及单位音节的声音数据之数据存储媒体;驱动该数据存储媒体而读出声音数据之存储媒体驱动装置;将读出的声音数据储存之存储装置;控制存储媒体驱动装置而从数据存储媒体随意选择读出声音数据并将之储存于存储装置中之控制装置;及将从存储装置中读出的声音数据变换成声音而予以输出之声音输出电路。
- 吉祥语电子礼品-93217731.X
- 张麟祥 - 张麟祥
- 1993-07-06 - 1994-04-06 -
- 一种吉祥语礼品装置,由壳体、线路板、扬声器、电池、开关构成。线路板上有语言集成电路。壳体由上盖和下盖构成,上、下盖均用塑料或金属冲压而成,上盖上有凸状的吉祥文字和图案。本实用新型在打开开关后,可发出祝福性的吉祥语言。
- 承压套筒式拉力试验机-93202116.6
- 崔德山 - 余自强
- 1993-01-14 - 1994-02-02 -
- 本实用新型提供的是一种拉力试验机。它包括加力机构、固定机构和底座。加力机构和固定机构分别安装于底座的两端。加力机构与固定机构之间设置承压套筒,其加力机构包括液压装置、油缸和联于油缸活塞杆上的联接件。固定机构包括支架、安装于支架上的滚筒和滚筒上的手柄、套柱。本实用新型提供的承压套筒式拉力试验机,可以提高试验精度,安全可靠,操作方便。本实用新型由于有承压套筒5,故不需要地基,可移动试验。
- 多用途语音处理器开发及应用板-91223955.7
- 陈凡;罗四维 - 北方交通大学
- 1991-08-31 - 1992-03-18 -
- 一种用于IBM-PC系列微机的多用途语音处理器开发及应用板,它由语音处理器、音频电路、接口电路、语音选择器、语音存储器组成。这种结构可对合成语句的固定段和变化段分别处理,合理存放。并对语音录入、选择播放、分析、编辑、合成提供支持。它有结构简单、成本低、用途多等特点。它既可用于有声系统的开发,又可直接用于语音录入/播放、存储转发及合成的应用场合,如有声检测报告、语音提醒和有声CAI等方面。
- 数字语音音调变换的方法及装置-87100209
- 潘建平;胡南钟;杜根源;曹彬石;黄昭鸣 - 上海工业大学
- 1987-01-10 - 1987-10-21 -
- 本发明是语音音调变换技术。用已有方法变换得的语音会产生音素过渡等失真,这些失真在高倍数时域压缩变换时显得更为严重。本方法先将语音数据帧写入存贮器,在帧内求出语音波形的最相似段和段两端附近的波形匹配点,根据这两点以一定的速率和方式将数据读出存贮器;它克服了已有方法所产生的音素过渡等失真,并得到了良好的听觉效果。本方法及装置能使变调语音的音调得以恢复和提供特殊的语音音调效果。
- 选择和再生语言字符的方法-86101871
- 西奥多·E·拉森 - 英特克系统公司
- 1986-03-24 - 1986-09-24 -
- 一个从语言的语音表示中选择和再生语言字符的方法,本方法特别适用于有大量图形字符的语言。该方法包括显示表示没有语调的语言的所有语音的语音符号的步骤。该方法选择所要的语音以构成一字符,还显示具有所选语音的所有语调的语言字符以及选择具有确定的语音和音调组合以及所需要的具体意义的特定字符。
- 极低数码率汉语识别声码器-85100576
- 陈永彬 - 南京工学院
- 1985-04-01 - 1986-08-06 -
- 汉语识别声码器,属于汉语数字通信设备,目的是为了降低数码率,以使通信增益得到提高。本发明采用了自动分段技术、二级识别技术、建立语音库技术和多讲话者技术。硬件实现是由预处理设备、程序控制器、运算器、程序存储器、数据存储器、系数与表格存储器、语音库、及输入输出设备等组成。本发明可用于汉语数字通信中的信源终端,也可推广用于翻译机、声控打字机及人机对话装置。
- 计算机汉语语音的合成方法-85100092
- 茅于杭;刘伟 - 清华大学
- 1985-04-01 - 1986-07-16 -
- 计算机汉语语音的合成方法,可以使普通的中文计算机获得语音输出的功能,把要告诉人们的信息不仅可以由屏幕用中文的形式显示出来,或用打印机打印出来,也可以用说话的语音表示出来。它的基本内容是采用汉语拼音的方法来实现无限词汇的语音输出。机器里存有全部汉语语音的声母、韵母(包括四声的区分)语音数据,机器根据拼音规则实现拼接,合成语音。该发明可以在IBM—PC型微型机及其它兼容机上迅速实现。
- 专利分类