[发明专利]语音合成器产生系统与方法有效

专利信息
申请号: 200710137109.X 申请日: 2007-07-19
公开(公告)号: CN101350195A 公开(公告)日: 2009-01-21
发明(设计)人: 郭志忠;沈民新 申请(专利权)人: 财团法人工业技术研究院
主分类号: G10L13/04 分类号: G10L13/04
代理公司: 北京市柳沈律师事务所 代理人: 葛宝成;黄小临
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要: 提供一种语音合成器产生系统与方法。使用者输入语音输出需求规格至语音合成器产生系统,该系统可自动产生符合该需求描述的语音合成器。使用者亦可将此需求规格通过语音合成器产生系统的录音脚本产生器自动产生录音脚本,使用者依此脚本录制客制化或扩充语料。此语料经上传至语音合成器产生系统后,语音合成器产生器可自动产生符合需求的语音合成器。客户端的语音输出即可藉由该语音合成器完成。
搜索关键词: 语音 合成器 产生 系统 方法
【主权项】:
1.一种语音合成器产生系统,包括:一语音输出规格,描述欲合成的句型与词汇、合成器的执行软硬件平台、以及语者条件;一欲合成的目标语言的来源语料库,包含欲合成的语言的所有单音;一语音合成器产生器,用以接收该语音输出规格,并根据该规格从该来源语料库中选择该些语音语料后,产生一能在指定平台上执行的语音合成器,该合成器包含一语音合成单元库与一语音合成引擎。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200710137109.X/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于FPGA的Mel倒谱分析合成仪-201220233638.6
  • 杨鸿武;丁朋程;裴东;王全州;甘振业;郭威彤 - 西北师范大学
  • 2012-05-23 - 2012-12-19 - G10L13/04
  • 本实用新型提供了一种基于FPGA的Mel倒谱分析合成仪,包括分别与LCD显示器、音频芯片、SD卡存储器、FLASH存储器、SRAM存储器和SDRAM存储器相连接的FPGA芯片;FPGA芯片包括Avalon交换架构;NIOSⅡ处理器软核嵌有JTAG调试模块。利用MCC的值调节Mel倒谱逼近滤波器系数,使存储在SD卡中的语音激励源信号通过Mel对数谱逼近滤波器产生语音数据,通过音频芯片将数字音频信号转换成模拟语音信号输出。本倒谱仪不仅能进行大数据量的处理计算,实现语音的分析合成,而且实现了便携化和仪器化。
  • 语音合成设备-201210179123.7
  • 才野庆二郎 - 雅马哈株式会社
  • 2012-06-01 - 2012-12-05 - G10L13/04
  • 本发明提供了一种语音合成设备,其被设计来用于使用多个语音段数据合成语音信号,每个语音段数据表示含有至少两个对应于不同音素的音素片段的语音段。在该设备中,语音段调整器根据第一语音段和第二语音段来形成目标片段,以便将第一语音段和第二语音段相互连接,使得所述目标片段由第一语音段的后部音素片段和第二语音段的前部音素片段形成,并且所述语音段调整部分将所述目标片段扩展到目标时间长度以形成调整片段,使得以比所述目标片段的前部分和后部分的扩展率高的扩展率来扩展所述目标片段的中间部分,从而产生具有所述目标时间长度的调整片段的合成语音段数据。语音合成器根据由所述语音段调整部分产生的合成语音段数据来产生语音信号。
  • 语音合成设备-201210175478.9
  • 若尔迪·博纳达;梅利因·布洛乌;橘诚 - 雅马哈株式会社
  • 2012-05-30 - 2012-12-05 - G10L13/04
  • 本发明提供了语音合成设备和语音合方法。在该语音合成设备中,音素段内插器部分获取音素段的与声音特性的第一值对应的第一音素段数据并获取该音素段的与该声音特性的第二值对应的第二音素段数据。第一音素段数据和第二音素段数据表示音素段的每个帧的频谱。音素段内插器在第一音素段数据的每个帧和与第一音素段数据的每个帧相对应的第二音素段数据的每个帧之间进行内插,从而产生音素段的与声音特性的目标值对应的音素段数据,其中该目标值不同于声音特性的第一值和第二值。语音合成器根据所产生的音素段数据来生成具有声音特性的目标值的语音信号。
  • 用于能够使用语音的工作环境的训练/指导系统-200980138554.5
  • M·B·梅洛特;R·A·贝茨;M·劳赫尔里;J·R·洛根 - 沃科莱特保健系统公司
  • 2009-11-13 - 2011-09-07 - G10L13/04
  • 语音工作系统包括无线网络和配置用于通过无线网络进行通信的至少两个能够使用语音的设备100、200。上述设备操作用于将系统提示转变成语音以及使用语音识别将语音命令转变成系统命令。第一设备100可由用户130选择性地被激活成指导模式,以通过无线网络40建立与第二设备200和另一用户230的连接。一旦以指导模式连接,进行指导的用户130接收来自接受指导的用户230和第二设备200的系统提示。之后进行指导的用户的第一设备100将那些接收到的提示提供给进行指导的用户130。
  • 用于分布式文本到话音合成以及可理解性的系统和方法-201010153291.X
  • 许军;李泰齐 - 创新科技有限公司
  • 2010-04-21 - 2010-10-27 - G10L13/04
  • 本发明提供了用于分布式文本到话音合成以及可理解性的系统和方法。更具体而言,本发明提供了在手持便携式计算设备上的分布式文本到话音合成,其可以被用于例如生成帮助用户与手持便携式计算设备的用户界面进行交互的可理解的音频提示。该文本到话音分布式系统70从客机设备接收文本串,并且包含文本分析器72、韵律分析器74、文本分析器和韵律分析器所参考的数据库14、以及话音合成器80。话音合成器80的元件驻留在主机设备和客机设备上,并且与文本串相关联的音频文件的音频索引表示是在主机设备处生成并被发送到客机设备的,以用于在客机设备处产生音频文件。
  • 自动同步解释系统-200880116632.7
  • J·格雷尼埃尔 - 威廉·博纳东
  • 2008-11-18 - 2010-10-13 - G10L13/04
  • 一种解释系统,包括:源语言的书写语句或发音语句的光学或声音采集装置和声音重建装置;用于基于所述采集装置所采集的输入信号生成源语句的识别装置(30),所述源语句是所述源语言语句的记录;用于生成目标语句的翻译装置(32),所述目标语句是源语句以目标语言的翻译;和用于基于所述目标语句生成能够由所述声音重建装置(3、5)进行重建的输出声音信号的语音合成装置(34)。根据本发明,解释系统包括能够顺序呼叫所述识别装置(30)、所述翻译装置(32)和所述语音合成装置(34)以便实时地生成源语言语句的目标语言解释的平滑装置(40)。
  • 语音合成的方法和系统-200810098474.9
  • 双志伟;孟繁平;施勤;秦勇 - 国际商业机器公司
  • 2008-05-28 - 2009-12-02 - G10L13/04
  • 本发明提供一种用于在客户端对文本内容进行语音合成的方法。该方法包括:基于客户端的语料库中的当前语料单元集合S当前,对文本内容进行语音合成;响应于判断需要更新客户端语料库的当前语料单元集合:分析文本内容,并生成具有相应语境特征的目标单元的列表,基于比客户端语料库的当前语料单元集合S当前更丰富的语料单元集合S,根据语境特征为每个目标单元选择多个候选语料单元,根据多个候选单元为文本内容确定可用于语音合成的语料单元;以及基于所确定的语料单元,更新客户端语料库的当前语料单元集合。本发明还提供相应的系统。根据本发明的技术方案,客户端的TTS系统能够随着用户对该系统的进一步使用自适应的更新语料库,从而获得语音合成质量的有效改善。
  • 语音合成装置、方法、程序、系统以及便携式信息终端-200910134594.4
  • 高塚进 - 索尼爱立信移动通信日本株式会社
  • 2009-04-23 - 2009-10-28 - G10L13/04
  • 本发明涉及语音合成装置、方法、程序、系统以及便携式信息终端。该语音合成装置包括:内容选择单元,选择要被转换成语音的文本内容项目;相关信息选择单元,选择相关信息,所述相关信息能够被至少转换成文本并且与所述内容选择单元选择的文本内容项目相关;数据添加单元,将所述相关信息选择单元选择的相关信息转换成文本,并将所述文本的文本数据添加到所述内容选择单元选择的文本内容项目的文本数据;文本到语音转换单元,将从所述数据添加单元提供的文本数据转换成语音信号;和语音输出单元,输出从所述文本到语音转换单元提供的语音信号。
  • 话音及文本通信系统、方法及设备-200780028278.8
  • 斯蒂芬·莫洛伊;哈利德·希勒米·埃尔-马勒赫 - 高通股份有限公司
  • 2007-07-31 - 2009-07-29 - G10L13/04
  • 本发明涉及用以将语音转换成文本及将文本转换成语音的系统、方法及设备。一种设备包括声码器、语音到文本转换引擎、文本到语音转换引擎及用户界面。所述声码器可操作以将语音信号转换成包及将包转换成语音信号。所述语音到文本转换引擎可操作以将语音转换成文本。所述文本到语音转换引擎可操作以将文本转换成语音。所述用户界面可操作以接收用户从多个模式中对一模式的选择,其中第一模式启用所述语音到文本转换引擎,第二模式启用所述文本到语音转换引擎,且第三模式启用所述语音到文本转换引擎及所述文本到语音转换引擎。
  • 语音合成装置及其方法-200680054679.6
  • 西山修;森田真弘;笼岛岳彦 - 株式会社东芝
  • 2006-10-19 - 2009-06-03 - G10L13/04
  • 一种语音合成装置,包括:从外部获取用于语音合成的文本数据的文本获取装置;对文本数据执行形态分析/解析的语言处理器;根据文本数据的与韵律和语言有关的属性,诸如重音和词性,向语音合成器输出合成单元串的韵律处理器;根据合成单元串产生合成语音的语音合成器;以及在输出合成语音被积累后或者在其被输出时顺序地再现规定量的输出合成语音的语音波形输出装置。
  • 语音处理装置及语音处理方法-200810179911.X
  • 平林刚;徐大威;笼岛岳彦 - 株式会社东芝
  • 2008-10-31 - 2009-05-06 - G10L13/04
  • 本发明涉及语音处理装置及语音处理方法。语音处理装置被配置为将第一语音波形和第二语音波形分别分割为多个频带以产生作为每一频带分量的第一带语音波形和第二带语音波形;确定每一频带的第一带语音波形和第二带语音波形之间的交叠相加位置以获得第一带语音波形和第二带语音波形之间的高互相关;并且以该交叠相加位置为基础,交叠相加每一频带的第一带语音波形和第二带语音波形并且在所有的多个频带上集成该多个频带的交叠相加带语音波形以产生拼接语音波形。
  • 自动分割单字语音信号的装置与方法-200810232545.X
  • 陈淮琰;韩召宁;杨亚冬 - 无敌科技(西安)有限公司
  • 2008-12-02 - 2009-04-29 - G10L13/04
  • 本发明涉及一种自动分割单字语音信号的装置与方法,该装置包含接收模块,用来接收单字语音信号,并将单字语音信号划分为多个音框;分析模块,分析音框,产生对应于每一个音框的语音特征;分割模块,根据语音特征,分割单字语音信号为音节,接收模块接入分析模块,分析模块接入分割模块,本发明完全替代了传统的人工切分单字语音的方式,整个过程不需要人工介入,省时省力,效率高,且大大降低了人为带来的失误率。
  • 自动进行语音转换的方法和装置-200710139735.2
  • 施琴;秦勇;刘义;双志伟 - 国际商业机器公司
  • 2007-07-30 - 2009-02-04 - G10L13/04
  • 本发明提出了一种能够显著改进音色转换的质量,并保证转换的声音相似度的方法和装置。本发明在语音合成库中设置有若干标准说话人,根据不同的角色,本发明选用不同的标准说话人的声音进行语音合成,所述被选中的标准说话人的声音与原始角色之间已经存在一定程度的相似性。然后本发明将这种与原始声音具有一定程度相似性的标准语音进一步进行音色转换,以精确模仿原始说话人的声音,从而使得转换后的声音在保证相似度的同时,更加接近原始的语音特征。
  • 语音合成器产生系统与方法-200710137109.X
  • 郭志忠;沈民新 - 财团法人工业技术研究院
  • 2007-07-19 - 2009-01-21 - G10L13/04
  • 提供一种语音合成器产生系统与方法。使用者输入语音输出需求规格至语音合成器产生系统,该系统可自动产生符合该需求描述的语音合成器。使用者亦可将此需求规格通过语音合成器产生系统的录音脚本产生器自动产生录音脚本,使用者依此脚本录制客制化或扩充语料。此语料经上传至语音合成器产生系统后,语音合成器产生器可自动产生符合需求的语音合成器。客户端的语音输出即可藉由该语音合成器完成。
  • 用于仅文本的应用的娱乐音频-200710107719.5
  • O·基尔克比 - 诺基亚公司
  • 2007-04-28 - 2008-10-29 - G10L13/04
  • 一种针对仅文本的应用生成音频的方法,包括步骤:向输入的文本添加标签,所述标签可用于向生成的音频添加音效,处理所述标签以形成用于生成所述音频的指令,基于所述指令生成带有所述音效的音频,同时呈现文本。本发明向文本应用中添加娱乐值并提供相比较于常规多媒体很紧凑的格式,以及使用娱乐声音以使得例如SMS和电子邮件的仅文本的应用更为有趣和娱乐性。
  • 语音合成系统和语音合成方法-200810096375.7
  • 森田真弘;笼岛岳彦 - 株式会社东芝
  • 2008-03-28 - 2008-10-01 - G10L13/04
  • 在一种语音合成中,选择单元从对应于第一节段序列的第一语音单元串中选择一个串,所述第一节段序列通过将对应于目标语音的音位串分割为节段来获得。选择单元基于对应于第二节段序列的最多W个第二语音单元串,重复实施产生对应于第三节段序列的第三语音单元串,其中所述第二节段序列作为第一序列的部分序列,所述第三节段序列通过对第二序列添加节段来获得,并基于每个第三串的估计值从第三串中选择最多W个串。通过使用每个第三串的惩罚系数来修正每个第三串候选的总成本,来获得该数值。该系数基于涉及语音单元数据获取的速度的限制,并依赖于接近所述限制的程度。
  • 文字文件自动标示时间的装置与方法-200710088627.7
  • 颜铭祥;颜睿余;赵平峡 - 微星科技股份有限公司
  • 2007-03-16 - 2008-09-17 - G10L13/04
  • 一种文字文件自动标示时间的装置与方法;接收模块接收文字文件与语音文件,其中文字文件由多个句子所组成;语音辨识模块将文字文件中的句子转换为语音模型,并依据间隔时间将语音文件划分为多个帧且依序编号,通过语音撷取将帧的语音数据变成特征参数,并计算出帧与语音模型互相匹配的最佳语音路径;标示模块依据最佳语音路径撷取出每一句子的开头所对应的帧的编号,由帧的编号与间隔时间取得每一句子的开头对应于语音文件的起始时间,并标示起始时间于文字文件。通过本发明的方法可将文字文件中的每一个句子自动标示出对应于语音文件的起始时间,不需再如传统技术一样利用人工的方式逐句标示时间,进而节省大量的时间与人力的花费。
  • 单通道多点异步语音自动合成组合装置-200720036980.6
  • 陈战平 - 南京师范大学
  • 2007-05-14 - 2008-03-12 - G10L13/04
  • 单通道多点异步语音自动合成组合装置为利用网络方式实现的远程定点语音播放、控制的装置,该装置以数字信号处理器(1)为中心,数字信号处理器(1)中的TCP/IP数据传输模块(11)与数字信号传输接口(2)相连接,数字信号处理器中的数据存储控制模块(13)与数字信号存储单元(5)相连接,数字信号处理器中的输入输出控制模块(12)的输出端接模拟信号传输接口(3)的输入端,数字信号处理器中的输出语音A/D转换模块(14)及模拟信号传输接口的输出端分别接音频功放输出接口(4)的输入端;音频功放输出接口的输出端扬声器(6),可按现有系统播音方式工作,又能接受数据控制完成单通道多点异步语音自动合成组合。
  • 语音翻译装置和方法-200710139019.4
  • 古贺敏之 - 株式会社东芝
  • 2007-07-23 - 2008-01-30 - G10L13/04
  • 一种语音翻译装置,包括:语音输入单元、语音识别单元、机器翻译单元、参数设置单元、语音合成单元,以及语音输出单元,并且从通过语音识别/机器翻译获得的多个似然确定将被输出的语音数据的语音音量值。对于具有低似然的单词,使得其语音音量值小,从而难以发送给用户,而另一方面,对于具有高似然的单词,使得其语音音量值大,进行特别强调,并发送给所述用户。
  • 一种嵌入式平台语音合成系统及其方法-200710098522.X
  • 徐磊 - 北京中星微电子有限公司
  • 2007-04-19 - 2008-01-30 - G10L13/04
  • 本发明的一种嵌入式平台语音合成系统及其方法,用于在嵌入式平台上进行文语转换,其包括:语音库,用于存储语音数据;算法库,调用与所输入的文本数据相对应的语音数据,并将所述语音数据合成为语音后输出,用于存储所述已合成语音的第一缓存单元和第二缓存单元;以及控制装置,用于控制所述第一缓存单元和所述第二缓存单元中已合成语音的读写。本发明通过设置片内缓冲单元,可以很好地解决在嵌入式平台上合成语音不连续的问题,较好的实现语音的实时播放效果,并且,本发明对于TTS系统的嵌入式环境移植具有良好的通用性。
  • 语音合成装置和方法-200710104617.8
  • 笼岛岳彦 - 株式会社东芝
  • 2007-05-18 - 2007-11-21 - G10L13/04
  • 波形存储器存储多个语音单元波形。信息存储器对应地存储语音单元信息以及所述多个语音单元波形的每一个的地址。选择器通过参考所述语音单元信息,选择对应于所述输入音素序列的语音单元序列。语音单元波形获取单元通过参考所述地址,从所述波形存储器获取对应于所述语音单元序列的各个语音单元的语音单元波形。语音单元连接单元通过连接所述获取的语音单元波形来产生所述语音。所述语音单元波形获取单元在一次访问期间从波形存储器的连续区域获取与包含在所述语音单元序列中的至少两个语音单元相对应的至少两个语音单元波形。
  • 向用户通知媒体内容项目的类别的数据处理设备和方法-200580035689.0
  • D·布拉泽罗维;D·P·凯利 - 皇家飞利浦电子股份有限公司
  • 2005-10-10 - 2007-09-26 - G10L13/04
  • 本发明涉及一种向用户通知媒体内容项目的类别(152)的方法。该方法包括以下步骤:识别该媒体内容项目的类别;以及使得用户能够获得具有依据该媒体内容项目的类别的音频参数(153)的可听信号(156)。本发明还涉及一种能够根据所述方法运作的设备。本发明还涉及包括向用户通知媒体内容项目的类别的可听信号的音频数据、包括多条所述音频数据的数据库以及一种计算机程序产品。在一个推荐器系统中,当与该推荐器系统的用户交互涉及特定类型的媒体内容项目时,所述可听信号可以由该推荐器系统再现。本发明可以用在EPG用户界面中。
  • 一种声音录制存储方法及影音设备-200710073784.0
  • 吴凯庭;吴启楠;梁仲宏;王燕飞 - 深圳万利达电子工业有限公司
  • 2007-03-30 - 2007-09-12 - G10L13/04
  • 本发明适用于影音设备领域,提供了声音录制存储方法及影音设备。所述方法包括以下步骤:接收外界的声音,并转换成模拟电信号;将模拟电信号进行A/D转换,转换成数字信号;将所述数字信号与播放中的数字音乐信号进行混频后进行音频编码压缩处理,转换成音频压缩格式的数据后输出到存储设备进行存储。本发明实施例的声音录制存储方法,将输入的声音信号转换成数字信号后,与播放中的数字音乐信号进行混音后进行编码压缩处理,并进行存储,提供了可以将外界声音进行录制的声音录制存储方法,解决了现有的视盘机等影音设备中没有便利的方法录制存储外界声音的问题。
  • 用于语音到文本的转录系统的错误检测-200480032825.6
  • H·施拉姆 - 皇家飞利浦电子股份有限公司
  • 2004-10-27 - 2006-12-13 - G10L13/04
  • 本发明涉及一种用于在由语音到文本的转录系统产生的文本内错误检测的方法、系统和计算机程序产品。借助于文本到语音的转录系统将转录文本再变换成人工语音信号。原始自然语音信号和人工产生的语音被提供给校对者以比较两个声学信号。在原始语音信号与从转录文本中变换的语音之间的偏差表示在语音到文本的变换过程中可能出现了错误,这不得不人工进行校正。优选地通过使用从所述两个语音信号推导出的比较信号,要比较的语音信号能够在视觉上和/或在听觉上被提供给校对者。在校对过程中能够跳过大部分正确转录的文本,从而节省了时间,并且增强了整个校对过程的有效性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top