[发明专利]文本到语音设备有效

专利信息
申请号: 200810127303.4 申请日: 2008-06-27
公开(公告)号: CN101334996A 公开(公告)日: 2008-12-31
发明(设计)人: 西池理香;佐佐木均 申请(专利权)人: 富士通株式会社
主分类号: G10L13/02 分类号: G10L13/02;G10L13/08
代理公司: 隆天国际知识产权代理有限公司 代理人: 张龙哺
地址: 日本神奈*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种文本到语音设备。根据本发明实施例的一个方面,提供一种将文本数据转换为声音信号的设备,该设备包括:音素确定器,用于确定与多个音素相对应的音素数据和与多个停顿相对应停顿数据,其中所述多个停顿待被插入到将被转换为语音信号的文本数据中的一系列音素之间;音素长度调整器,用于分别根据声音信号的速度确定音素的长度,以及选择性地将文本数据中至少一个停顿的长度减小到比与声音信号的速度相对应的停顿长度小的停顿长度,以此调整所述音素数据和所述停顿数据;以及输出单元,用于基于由音素长度调整器所调整的音素数据和停顿数据输出声音信号。
搜索关键词: 文本 语音 设备
【主权项】:
1.一种用于将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据和与多个停顿相对应的停顿数据,其中所述多个停顿待被插入到将被转换为所述声音信号的所述文本数据中的一系列音素之间;音素长度调整器,用于分别根据所述声音信号的速度确定所述音素的长度,以及选择性地将所述文本数据中至少一个停顿的长度减小到比与所述声音信号的速度相对应的停顿长度小的停顿长度,以此调整所述音素数据和所述停顿数据;以及输出单元,用于基于由所述音素长度调整器所调整的音素数据和停顿数据,输出所述声音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810127303.4/,转载请声明来源钻瓜专利网。

同类专利
  • 一种语音PWM输出的系统-201210315008.8
  • 徐功益;杨波 - 杭州晟元芯片技术有限公司
  • 2012-08-30 - 2012-12-19 - G10L13/02
  • 本发明涉及一种语音PWM输出的系统,该系统是SOC集成电路的一个子模块,通过总线与SOC系统连接。该语音PWM输出语音PWM的同时还可以输出普通PWM信号。主要包括寄存器配置模块、采样控制模块、PWM计数输出模块、存储器、FIFO、占空比符号规范化模块、占空比宽度规范化模块。本发明采用DMA的方式来自动更新占空比寄存器,不需要软件干预,只要配置启动语音PWM,在语音PWM输出过程中,CPU都可以被其它事件占用,系统效率大大提高。本发明有益的效果:1.提出了一种语音PWM的系统和方法,该方法输出语音PWM不用CPU干预,应用开发简单;2.提出了针对语音PWM的占空比符号规范化和占空比宽度规范化的方法;3.该语音PWM系统和方法对通用PWM全兼容。
  • 汉语教学语音合成方法及装置-201210207692.8
  • 解焱陆;张劲松 - 北京语言大学
  • 2012-06-18 - 2012-10-10 - G10L13/02
  • 本发明提供一种汉语教学语音合成方法及装置,其中,该方法包括:获取语言学习者语音以及多个标准教师语音;根据语音参数从多个标准教师语音中选择与语言学习者语音最接近的标准教师语音,其中,语音参数包括:声学参数、音高、节奏信息;根据最接近的标准教师语音与语言学习者语音合成声调教学语音。通过本发明,可以使得语言学习者更容易学习发音,从而可以给汉语学习者提供较好的帮助。
  • 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法-201110046580.4
  • 汪曦;楼晓雁;李健 - 株式会社东芝
  • 2011-02-25 - 2012-08-29 - G10L13/02
  • 本发明涉及一种用于合成语音的方法、设备以及用于训练在语音合成中使用的声学模型的方法。所述用于合成语音的方法可以包括:确定文本分析生成的数据为模糊多音字数据;对所述模糊多音字数据进行模糊多音字预测,以输出所述模糊多音字数据的多个候选发音及其概率;基于所述多个候选发音及其概率,生成模糊上下文特征标注;基于具有模糊决策树的声学模型,针对所述模糊上下文特征标注确定模型参数;对所述模型参数生成语音参数;以及将所述语音参数合成为语音。根据本发明的实施例的方法和设备,可以对中文中难以预测的多音字进行模糊化处理,从而改善中文多音字合成的质量。
  • 一种应用于铁道系统的客运信息语音播报服务装置-201210064257.4
  • 俞振利;吴洪;吴梦初 - 上海应用技术学院
  • 2012-03-13 - 2012-08-01 - G10L13/02
  • 本发明涉及一种应用于铁道系统的客运信息语音播报服务装置,系统主控单元通过服务信息获取单元取得需要进行信息播报的服务请求,之后通过需求分析与分类单元进行判别并予以分类,当需要实时信息服务时,系统主控单元从联网客服信息获取单元自动得到所需服务信息,当信息确定时,系统主控单元利用文字脚本数据库检索单元自动进行检索,得到所需服务信息,当信息不确定时,系统主控单元调用实时服务信息编辑单元获取来自操作员的手动输入,接着系统主控单元将各途径得到的服务信息送入文本预处理单元处理后,之后可馈入到语音合成单元合成后送播放单元予以播放。此装置提高播报实时、准确性,对于节约人力成本、提高服务质量具有重大意义。
  • 一种可任意调节的语音自然变声方法及装置-201210039318.1
  • 宁更新;刘元庆;韦岗;杨萃 - 华南理工大学
  • 2012-02-21 - 2012-07-18 - G10L13/02
  • 本发明公开一种可任意调节的语音自然变声方法及装置,所述方法将语音信号在声道中进行建模,随后求出发音的系统模型,即声道的模型,之后再改变声道的模型,最后在新的声道模型中还原出语音信号,这个新输出的语音信号即为变声后的信号。装置包括电源模块、输入输出模块、控制模块和处理模块,控制模块将参数送至处理模块并控制系统运行的起止。由输入输出模块输入声音信号,并转化为数字信号,送入处理模块中,处理模块根据输入的参数对信号进行处理,形成变声信号后送入输入输出模块,再转化为模拟信号,并由音箱输出。本发明使变声后的信号可以有很自然的声音效果,且可任意调节。本发明中装置简单,容易实现,且设备成本低廉,使用方便。
  • 说话人可选的语音合成系统及其实现方法-201010589120.1
  • 吴悦 - 盛乐信息技术(上海)有限公司
  • 2010-12-15 - 2012-07-11 - G10L13/02
  • 本发明公开了一种说话人可选的语音合成系统及其实现方法,该语音合成系统包括:目标说话人数据提取装置、模型自适应装置以及目标说话人语音合成装置。该实现方法包括:(A)目标说话人数据提取装置采集目标说话人的语音数据;(B)模型自适应装置根据目标说话人的语音数据生成目标说话人模型,并存储至目标说话人模型库;(C)当用户激活该语音合成系统后,目标说话人语音合成装置实现语音合成功能。本发明的手机嵌入式版本可以根据用户喜好选择指定目标人阅读短信和手机文本,扩展了手机的功能,并使用户利用手机获取信息的过程更充满趣味性和互动性。另外,本发明的语音合成系统还可应用于除手机外的平台。
  • 导航语音生成方法及系统-201010612506.X
  • 李军;鹿培信 - 上海博泰悦臻电子设备制造有限公司
  • 2010-12-29 - 2012-07-04 - G10L13/02
  • 本发明揭示一种导航语音生成方法及系统,该方法包括:根据当前位置及目的地位置确定当前语音生成条件;获取预置的代码可识别的语音推导规则;所述语音推导规则包括语音生成条件和提示语音的映射关系;将所述当前语音生成条件代入所述代码可识别的语音推导规则,基于所述映射关系确定当前的提示语音。该系统包括:预置单元、导出单元、条件产生单元、执行单元。由于是根据当前语音生成条件在代码可识别的映射关系中查找产生当前的提示语音;而非先前的采用的使用代码对当前语音生成条件和语音推导规则反复判断,从而得出当前的提示语音;加快导航语音的生成速度。由于所述语音推导规则是使用映射关系的方式,因此结构更加简单、清晰,便于更改。
  • 一种用于汉语语音合成的音调修正方法-201110356259.6
  • 那兴宇;王朝民;谢湘;何娅玲 - 北京宇音天下科技有限公司
  • 2011-11-11 - 2012-06-13 - G10L13/02
  • 本发明公开了一种用于汉语语音合成的音调修正方法,由文本分析模块接收待合成的任意文本信息,根据音节和韵律层级结构输出完整的合成标注信息;参数语音合成模块接收文本分析模块的合成标注信息,使用考虑参考音调的参数生成的方法输出合成的语音信号;离线训练模块负责各种隐马尔科夫模型的训练,参考音调模型用于生成单个音节的参考基频包络,合成参数模型用于得到合成的参数序列。依据本发明可以解决基于隐马尔科夫模型的汉语语音合成中音调不稳定的问题,使合成语音的自然度和韵律感得到极大地改善。
  • 语音合成信息编辑设备-201110396819.0
  • 入山达也 - 雅马哈株式会社
  • 2011-12-02 - 2012-06-06 - G10L13/02
  • 本发明提供了语音合成信息编辑设备。在语音合成信息编辑设备中,音素存储单元存储音素信息,所述音素信息指示要合成的语音的每个音素的持续时间。特征存储单元存储特征信息,所述特征信息指示语音的特征的时间变化。编辑处理单元根据扩展/压缩度改变由所述音素信息指示的每个音素的持续时间,所述扩展/压缩度取决于与音素对应的特征信息所指示的特征。
  • 图形码朗读演奏演唱器-201010531118.9
  • 胡力游 - 胡力游
  • 2010-11-04 - 2012-05-23 - G10L13/02
  • 图形码朗读演奏演唱器。由读取模块、解码模块、合成模块和发声模块组成。读取模块将印刷物上的图形码作为数码图像读取,解码模块将读入的数码图像解码复原成语音符号或音乐符号等音频符号,合成模块将音频符号合成为音频数据,发声模块将音频数据以声音播放出去,实现被编码为图形码的语音或音乐的还原和发声。
  • 一种背景音可选的朗读系统及其实现方法-201010281197.2
  • 王玉平 - 盛乐信息技术(上海)有限公司
  • 2010-09-14 - 2012-04-04 - G10L13/02
  • 本发明公开了一种背景音可选的朗读系统,包括:背景音库、语音合成装置、背景音生成模块以及朗读音合成模块。本发明还公开了该朗读系统的实现方法,包括制作背景音库、文本标注、生成文本的合成语音、生成背景音以及合成朗读音等步骤。该朗读系统极富表现力,可以提升用户的体验和对朗读系统的兴趣。当用户使用该朗读系统听取文本朗读时,可以选择系统推荐的或者默认的背景音,也可以指定自己喜欢的背景音,甚至可以向朗读系统上传背景音,从而扩大了背景音的选择范围,提高了文本朗读的效果和用户使用朗读系统的兴趣。
  • 一种游戏对话声音合成方法和系统-201110251459.5
  • 李健;刘畅;武卫东 - 北京捷通华声语音技术有限公司
  • 2011-08-29 - 2012-01-18 - G10L13/02
  • 本申请提供了一种游戏对话声音合成方法和系统,属于游戏声音合成领域。所述的方法包括通过游戏应用端将用户输入的对话文本由接口发送到语音云;根据语音云所得到的对话文本进行自然语言处理,获得与用户输入的对话文本对应的音韵结构信息;针对所获得的音韵结构信息,结合语音云的混搭定制语音库合成与所述对话文本对应的混搭语音数据;将所得到的混搭语音数据由接口发送到游戏应用端;通过应用端将接收到的混搭语音数据进行播放。通过本申请使用户在游戏应用端输入的对话文本能以多种声音风格进行播放,从而使游戏的友好度大大增加。
  • 一种基于加权混合激励的嵌入式语音合成方法-201110145479.4
  • 王朝民;那兴宇;谢湘;何娅玲 - 北京宇音天下科技有限公司
  • 2011-06-01 - 2011-11-02 - G10L13/02
  • 本发明公开了一种基于加权混合激励的嵌入式语音合成方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。在训练端,首先对语音信号提取基频自适应加权谱内插(STRAIGHT谱)系数、基频及非周期成分;在合成端,通过基频及非周期成分构建混合激励,然后通过传统的参数合成器得到合成语音。依据本发明提供的方法在合成端通过混合激励代替原有的二元激励,在保证较低运算速度的同时,提高了合成语音的自然度和音质,达到与STRAIGHT合成器近似的效果。
  • 一种基于自适应加权谱内插系数的嵌入式语音合成方法-201110145478.X
  • 王朝民;那兴宇;谢湘;何娅玲 - 北京宇音天下科技有限公司
  • 2011-06-01 - 2011-10-12 - G10L13/02
  • 本发明公开了一种基于自适应加权谱内插系数的嵌入式语音合成方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。在训练端,首先对语音信号提取基频自适应加权谱内插(STRAIGHT谱),然后对STRAIGHT谱提取声道谱特征系数,进而通过HTS对特征系数建模、训练;在合成端,通过模型得到解算出特征系数序列后,通过传统参数合成器得到合成语音。依据本发明提供的方法可以得到与STRAIGHT合成器相当的合成语音音质,并在合成端通过传统参数合成器代替STRAIGHT合成器大幅提高了合成速度,并使之嵌入式应用成为可能。
  • 合成语音的方法和装置-201080000927.5
  • 汪曦;栾剑;李健 - 株式会社东芝
  • 2010-01-04 - 2011-09-28 - G10L13/02
  • 本发明提供了合成语音的方法和装置。根据本发明的一个方面,提供了一种合成带有信息的语音的装置,包括:输入单元,其输入文本句;文本分析单元,其对上述输入单元输入的文本句进行文本分析,以提取语言学信息;参数生成单元,其利用上述文本分析单元提取的语言学信息和预先训练好的统计参数模型,生成语音参数;嵌入单元,其在上述语音参数中嵌入预定的信息;以及语音合成单元,其将利用上述嵌入单元嵌入了上述信息的上述语音参数合成为带有上述信息的语音。
  • 一种基于TD平台的软内核实现语音播报的方法-201010117543.3
  • 刘敬毅;郑添来 - 厦门敏讯信息技术股份有限公司
  • 2010-03-03 - 2011-09-21 - G10L13/02
  • 本发明公开了一种基于TD平台的软内核实现语音播报的方法,它包括:步骤10,传入要播报的原始语音数据;步骤20,发送语音合成信号,启动语音合成线程,开始语音数据合成;步骤30,将合成的语音数据插入播放队列中;步骤31,合成语音数据;步骤32,当合成的语音数据量达到一定缓存上限时,发送阻塞信号,激活阻塞线程;步骤40,启动TD平台的语音播放软内核,开始播放语音;步骤41,判断播放队列中的语音数据剩余量,当播放队列的语音数据剩余量达到一定缓存下限时,执行步骤42,否则继续执行步骤40;步骤42,发送停止阻塞信号,停止阻塞线程,启动语音合成线程,继续进行语音数据合成,转跳执行步骤20;步骤50,结束语音播放。
  • 一种韵律类和音质类参数相结合的情感语音转换方法-201110122034.4
  • 毛峡;韩林 - 北京航空航天大学
  • 2011-05-12 - 2011-09-14 - G10L13/02
  • 本发明提出了韵律类参数(基频、时长和能量)和音质类参数(共振峰)相结合的情感语音转换方法。其主要步骤包括:步骤一:对BHUDES情感语音样本(包含中性语音以及悲伤、愤怒、高兴和惊奇四种情感语音)进行特征参数的提取分析;步骤二:根据提取的特征参数,制定情感语音转换规则,定义各项转换常数;步骤三:对待转换的中性语音进行特征参数提取和基音同步标注;步骤四:通过步骤二的情感转换规则设定各项转换常数,对基频曲线,时长和能量进行修改,再基音同步叠加合成语音信号。步骤五:对步骤四的语音信号进行LPC分析,通过传递函数的极点对共振峰进行更改。最终得到富有表现力的情感语音。
  • 一种提高语音合成系统表现力的建模方法-201010046519.5
  • 王程程 - 王程程
  • 2010-01-08 - 2011-07-13 - G10L13/02
  • 本发明公布了一种提高语音合成系统表现力的建模方法,本发明的特征是在Trainable TTs中引入了基频和频谱两个声学特征异步建模的概念,保证基频与频谱的音素边界相同的情况下进行独立的模型训练,最后通过参数生成算法各自生成出参数然后进行语音合成,实现了合成语音在音质的表现力方面的提升。
  • 个性化文本语音合成和个性化语音特征提取-201010002312.8
  • 何守春;王庆芳 - 索尼爱立信移动通讯有限公司
  • 2010-01-05 - 2011-07-06 - G10L13/02
  • 本发明涉及个性化文本语音合成和个性化语音特征提取。个性化文本语音合成装置包括:个性化语音特征库创建部,其被设置为,通过对特定讲话人的随意性的语音片断与预先设定的关键字进行比对,识别该特定讲话人的个性化语音特征,由此创建与该特定讲话人相关联的个性化语音特征库,并将该个性化语音特征库与该特定讲话人相关联地存储起来;和文本语音合成部,其被设置为,基于与该特定讲话人相关联的个性化语音特征库,对源于该特定讲话人的文本消息进行语音合成,以生成并输出具有该特定讲话人的发音特点的语音片断。根据本发明,不必通过专门的训练过程,即可建立特定讲话人的个性化语音特征库,从而对文本进行个性化语音合成,以输出带有讲话人的个性化发音特点的语音。
  • 合成声音-200980130638.4
  • 坂本真一 - 株式会社音响设计
  • 2009-02-13 - 2011-06-29 - G10L13/02
  • 本发明为了在电视、收音机等的广告中使用的效果音,用于宣传企业形象的声音标识以及在电影、动画、游戏、玩具、移动电话的铃声等中所使用的声音的内容或拟人音等,提供个性化的且对最终用户具有冲击力的一种合成声音。该合成声音是用于通过收听声音信号让收听者想起该声音信号以外的音信号的影像的合成声音,其特征是,该合成声音是合成振幅包络线分量和频率分量而构成,所述振幅包络线分量是该声音信号的振幅包络线分量,所述频率分量是除去杂音的该声音信号以外的音信号的频率分量。
  • 语音合成方法及系统-200910202013.6
  • 燕鹏举 - 盛大计算机(上海)有限公司
  • 2009-12-21 - 2011-06-22 - G10L13/02
  • 本发明公开了一种语音合成方法,根据高层韵律标注规范,对一文本进行高层韵律标注,得到该文本的高层韵律标注文件;通过语音合成器中的低层韵律标注器根据低层韵律标注模型,对所述文本及其高层韵律标注文件进行低层韵律标注,得到该文本的低层韵律标注文件;所述语音合成器根据该文本及其低层韵律标注文件,通过波形拼接或者参数合成的方式生成语音信号并输出。本发明还公开了一种语音合成系统。本发明的语音合成方法及系统,所生成语音的韵律包含高层韵律信息,韵律丰富自然,表现力强。
  • 一种用于嵌入式语音合成系统的音库压缩及使用方法-201010580790.7
  • 那兴宇;谢湘;何娅玲;何宇新 - 北京宇音天下科技有限公司
  • 2010-12-09 - 2011-05-18 - G10L13/02
  • 本发明公开了一种用于嵌入式语音合成系统的音库压缩及使用方法,用于嵌入式操作系统,将接收到的任意文字转换成语音输出。以汉语中的音节作为合成系统及语音模型库的基本单元;首先创建基于音节的原始语音模型库,然后对所述原始语音模型库进行数据分解和压缩,最后通过数据重组得到最终的压缩模型库。依据本发明提供的方法可以降低合成系统在嵌入式平台下所占用的空间资源,并提高合成速度,同时使合成语音保持良好的自然度和音质。
  • 情感语音合成方法和装置-200910170713.1
  • 栾剑;李健 - 株式会社东芝
  • 2009-09-03 - 2011-04-06 - G10L13/02
  • 本发明提供了情感语音合成方法和装置。根据本发明的一个方面,提供了一种情感语音合成方法,包括以下步骤:输入文本句;利用由第一说话人的中立语音库训练获得的中立特征模型,预测上述文本句在上述第一说话人的第一特征空间中的中立特征向量;利用由上述中立语音库和第二说话人的平行语音库训练获得的说话人规整模型,将上述中立特征向量变换为上述第二说话人的第二特征空间中的规整中立特征向量;利用由上述平行语音库训练获得的情感转换模型,将上述规整中立特征向量转换为上述第二特征空间中的规整情感特征向量;利用上述说话人规整模型,将上述规整情感特征向量逆变换为上述第一特征空间中的情感特征向量;以及利用上述第一特征空间中的情感特征向量合成出第一说话人的情感语音。
  • 一种哼唱合成方法和系统-201010223497.5
  • 李健;张连毅;武卫东 - 北京捷通华声语音技术有限公司
  • 2010-06-30 - 2010-12-01 - G10L13/02
  • 本发明提供了一种哼唱合成方法和系统,其中的方法具体包括:接收用户输入的文本;进行文本分析,获得与所述文本对应的音节序列,以及,该音节序列中每个音节的音节名称;针对所述音节序列中每个音节,根据其音节名称及上下文环境,结合统计参数模型,规划得到相应的时长参数、基频参数和谱参数;依据用户选择的歌曲模板和所述音节序列的音节个数,对所述规划得到的时长参数、基频参数进行调整,其中,所述歌曲模板中存储有音节的时长参数和基频参数;依据调整后的时长参数,对相应音节的谱参数进行插值调整;根据所述音节序列中每个音节的时长参数、基频参数和谱参数,利用合成器得到语音数据。本发明能够输出带有歌曲节奏和旋律的语音数据。
  • 车载用引导装置-200880119249.7
  • 古本友纪;铃木忠;佐藤史尚 - 三菱电机株式会社
  • 2008-11-19 - 2010-11-10 - G10L13/02
  • 本发明的车载用引导装置的特征为,包括:获取车载设备的设定音量的输出声音控制单元;判定设定音量是否比预定的阈值小的音量判定单元;及引导输出控制单元,该引导输出控制单元接受在设定音量变得比所述阈值小的定时来自音量判定单元的判定信号,并指示进行语音引导。
  • 混合型语音合成系统-200910030596.9
  • 韩松 - 韩松
  • 2009-04-24 - 2010-10-27 - G10L13/02
  • 针对现有计算机语音合成系统,计算机发音语音不连续,输出的语音不流畅、不自然的问题,本发明提出一种混合型语音合成系统,包括语音库、语音合成引擎,所述语音库为混合型语音库,包括综合录入的真人发音和计算机处理的非真人发音,其语音库中词语与句子为真人发音,单个字词为非真人发音。语音合成引擎通过对文本中字、词、句的判断,检索调用语音库中已经录制好的真人发音和计算机处理的非真人发音,与传统的文字到语音的自动合成技术对比,本发明合成语音质量高,语音连续,输出的语音流畅、自然,特别适合无线平台的语音合成,如智能手机,手持电子设备平台,导航系统,以及公共场合的广播系统等。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top