[发明专利]语音合成装置，语音合成方法，以及程序无效

申请号：	200680015605.1	申请日：	2006-03-10
公开（公告）号：	CN101171624A	公开（公告）日：	2008-04-30
发明（设计）人：	佐藤宁	申请（专利权）人：	株式会社建伍
主分类号：	G10L13/06	分类号：	G10L13/06;G10L13/08
代理公司：	中原信达知识产权代理有限责任公司	代理人：	谷惠敏;钟强
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：	语音片段编辑部分(5)从语音片段数据库(7)中检索关于语音片段的语音片段数据，其中该语音片段的读音与固定消息中语音片段的读音相匹配，并对该语音片段进行转换，以便于与由该发声速度数据指定的速度相匹配。该语音片段编辑部分(5)预测固定消息的韵律，并根据该韵律预测结果逐个地选择与该固定消息的每个语音片段最匹配的检索到的语音片段数据的项。但是，如果对应于该语音片段数据的被选择的项的部分语音片段没有达到预定值，则取消该选择。关于没有被选择的语音片段，将表示每个单位语音波形的波形数据提供给声音处理部分(41)。将该选择的语音片段数据与提供的波形数据互连，从而生成表示合成语音的数据。这样，就提供了一种语音合成装置，用于迅速地产生合成语音，而这种简单结构不会带来任何不舒服的感觉。
搜索关键词：	语音合成装置方法以及程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音合成装置，其特征在于包括：语音片段存储装置，用于存储多段表示语音片段的语音片段数据；选择装置，用于输入表示句子的句子信息并执行如下处理：从每段所述语音片段数据中选择具有共用语音的语音片段数据的片段以及形成所述句子的读音；缺失部分合成装置，用于对于所述选择装置无法从形成所述句子的语音中选择其语音片段数据的语音，合成表示该语音波形的语音数据；以及用于通过将由所述选择装置选择的语音片段数据与由所述缺失部分合成装置合成的语音数据相互组合来生成表示合成语音的数据的装置；其中所述选择装置还包括确定装置，用于确定具有共用语音的语音数据与形成所述句子的整个语音中由被选择的语音数据表示的读音的比率是否达到了预定值；以及如果确定所述比率没有达到所述预定值，该选择装置取消对于语音片段数据的选择并且进行所述语音片段数据无法被选择的处理。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社建伍，未经株式会社建伍许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200680015605.1/，转载请声明来源钻瓜专利网。

同类专利

话音合成器、话音合成方法和话音合成程序-201180016109.9
发明人：加藤正德 -专利权人：日本电气株式会社
申请日： 2011-03-23 - 公布日： 2012-12-12 - 主分类号： G10L13/06
摘要：归一化谱存储单元(204)预存储基于随机数序列计算的归一化谱。浊音生成单元(201)基于与输入文本相对应的浊音的多个分段以及存储在归一化谱存储单元(204)中的归一化谱来生成浊音波形。清音生成单元(202)基于与输入文本相对应的清音的多个分段来生成清音波形。合成话音生成单元(203)基于由浊音生成单元(201)生成的浊音波形和由清音生成单元(202)生成的清音波形来生成合成话音。

在语音合成中用于融合浊音音素单元的方法和装置-201080001520.4
发明人：栾剑;李健 -专利权人：株式会社东芝
申请日： 2010-06-28 - 公布日： 2012-06-20 - 主分类号： G10L13/06
摘要：本发明提供了在语音合成中用于融合浊音音素单元的方法和装置。本发明的一种用于融合浊音音素单元的装置包括：单元输入模块，其输入用于目标片段的浊音音素的多个单元；单元切分模块，其对多个单元的每个单元进行切分以获得每个单元的基音周期；参考单元选择模块，其基于每个单元的基音周期信息和目标片段的基音周期个数从多个单元中选择一个参考单元；模板创建模块，其基于参考单元和目标片段的基音周期个数创建一个模板；基音周期对齐模块，其利用动态规划算法将多个单元的除了参考单元的每个单元的基音周期与模板的基音周期对齐；基音周期融合模块，其将对齐的基音周期融合；以及基音周期拼接模块，其将融合的基音周期拼接为目标片段的融合单元。

基于HMM的双语(普通话-英语)TTS技术-201110291213.0
发明人： Y·钱;F·K-P·宋 -专利权人：微软公司
申请日： 2008-08-19 - 公布日： 2012-02-22 - 主分类号： G10L13/06
摘要：一种用于基于一种或多种语言的文本来生成语音的示例性方法，该方法包括提供两种或更多语言的音素集、训练包括跨语言状态级共享的多语言HMM、接收该多语言HMM的语言中的一种或多种语言的文本、以及至少部分地基于该多语言HMM来生成对应于所接收到的文本的语音。其他示例性技术包括第一语言的决策树和第二语言的决策树之间的映射和可任选地反方向的映射、以及对多语言文本-语音系统的Kullback-Leibler散度分析。

一种语音基元的编码与合成系统-201010215135.1
发明人：孟智平 -专利权人：上海视加信息科技有限公司
申请日： 2010-06-30 - 公布日： 2012-01-11 - 主分类号： G10L13/06
摘要：本发明公开了一种语音基元的编码与合成系统，可用于低带宽高音质的语音传输。本发明在数字语音传输的基础上，以构建的语音基元为编码对象，建立语音基元模型库，把语音基元用统一的方法和编码进行表示，从而进一步合成语音。该方法首先通过对日常语音的分析，采用聚类算法构建语音基元模型库；然后，利用语音基元自动切分算法，对获得的连续语音流进行语音基元的自动切分，并提取语音基元MFCC特征，通过与语音基元模型库中的语音基元进行匹配识别，获得语音基元所对应的编号，以编号代替语音基元进行编码。在合成语音过程中，通过编号从语音基元模型库中取出该编号所对应的语音基元，并通过数学变换对语音基元的频谱包络进行插值拟合等处理，形成平滑过度的语音。

通过多形式段的生成和连接进行的合成-200880111498.1
发明人： V·波莱;A·布里恩 -专利权人：微差通信公司
申请日： 2008-08-12 - 公布日： 2010-09-08 - 主分类号： G10L13/06
摘要：描述了一种语音合成系统和方法。语音段数据库参考具有各种不同语音表示结构的语音段。语音段选择器从所述语音段数据库选择对应于目标文本的语音段候选的序列。语音段定序器根据所述语音段候选生成对应于所述目标文本的定序的语音段。语音段合成器组合定序的语音段来产生对应于所述目标文本的合成语音信号输出。

声音信号生成方法、声音信号生成装置以及计算机程序-200780100514.2
发明人：渡边一宏 -专利权人：富士通株式会社
申请日： 2007-09-06 - 公布日： 2010-08-04 - 主分类号： G10L13/06
摘要：本发明提供通过对原音信号进行加工生成加工声音信号来合成对噪声感、粗糙感等音质劣化进行了抑制的高质量语音的声音信号生成方法、声音信号生成装置以及计算机程序。本发明按照波形的间距单位分离原音信号，生成多个单位波形信号，针对各单位波形信号，生成重复波形信号，该重复波形信号是使所生成的单位波形信号的波形重复预定次数而得到的，通过按照形成原音信号的顺序以间距为单位使各个重复波形信号移动后进行叠加，来生成加工声音信号。

音质编辑装置及音质编辑方法-200880001664.2
发明人：广濑良文;釜井孝浩 -专利权人：松下电器产业株式会社
申请日： 2008-06-04 - 公布日： 2010-01-06 - 主分类号： G10L13/06
摘要：本发明的音质编辑装置包括：音质特征DB(101)，记忆多个音质特征；讲话者属性DB(106)，关于各个音质特征，记忆用户能够想起的与该音质特征对应的音质的标识符；权重设定部(103)，按每个音质的声特征量设定权重；尺度构成部(105)，关于各个音质特征，根据构成该音质特征的多个声特征量和权重设定部(103)所设定的权重，算出该音质特征的显示坐标；显示部(107)，关于各个音质特征，在算出的显示坐标上显示与该音质特征对应的标识符；位置输入部(108)，接受坐标的输入；音质混合部(110)，关于多个音质特征的一部分或全部的每一个，通过算出该音质特征的显示坐标与所述接受了的坐标之间的距离，并根据算出的距离的比率，混合多个音质特征的一部分或全部的声特征量，生成新的音质特征。

声音合成装置、声音合成方法以及程序-200880005607.1
发明人：加藤正德;近藤玲史;三井康行 -专利权人：日本电气株式会社
申请日： 2008-02-15 - 公布日： 2009-12-30 - 主分类号： G10L13/06
摘要：提供一种能够生成由于韵律变化量的不均匀而导致的音质劣化程度小的合成声音的装置、方法以及程序。声音合成装置具有从候选片段中选择适合目标片段环境的片段的片段选择部(161)，该声音合成装置还包括：韵律变化量计算部(20)，根据目标片段环境和候选片段的韵律信息来计算各候选片段的韵律变化量；选择基准计算部(21)，根据韵律变化量来计算选择基准；候选选择部(22)，根据韵律变化量和选择基准来进行选择候选的缩选；以及最适合片段检索部(14)，从被缩选出的候选片段中检索最适合片段。

声音合成装置-200780020871.8
发明人：广濑良文;加藤弓子;釜井孝浩 -专利权人：松下电器产业株式会社
申请日： 2007-05-11 - 公布日： 2009-07-22 - 主分类号： G10L13/06
摘要：一种声音合成装置，能够高速地进行声音内容的编辑，并可以容易地制作声音内容，其中包括：小规模声音单元DB(101)、小规模声音单元选择部(102)、小规模声音单元连接部(103)、韵律校正部(104)、大规模声音单元DB(105)、使小规模声音单元DB(101)和大规模声音单元DB(105)相对应的对应DB(106)、声音单元候补获得部(107)、大规模声音单元选择部(108)、以及大规模声音单元连接部(109)，该声音合成装置利用小规模声音单元DB(101)来编辑合成音，并通过根据编辑结果，利用大规模声音单元DB(105)进行高音质化，从而能够容易地在移动终端上制作声音内容。

语音合成装置，语音合成方法，以及程序-200680015605.1
发明人：佐藤宁 -专利权人：株式会社建伍
申请日： 2006-03-10 - 公布日： 2008-04-30 - 主分类号： G10L13/06
摘要：语音片段编辑部分(5)从语音片段数据库(7)中检索关于语音片段的语音片段数据，其中该语音片段的读音与固定消息中语音片段的读音相匹配，并对该语音片段进行转换，以便于与由该发声速度数据指定的速度相匹配。该语音片段编辑部分(5)预测固定消息的韵律，并根据该韵律预测结果逐个地选择与该固定消息的每个语音片段最匹配的检索到的语音片段数据的项。但是，如果对应于该语音片段数据的被选择的项的部分语音片段没有达到预定值，则取消该选择。关于没有被选择的语音片段，将表示每个单位语音波形的波形数据提供给声音处理部分(41)。将该选择的语音片段数据与提供的波形数据互连，从而生成表示合成语音的数据。这样，就提供了一种语音合成装置，用于迅速地产生合成语音，而这种简单结构不会带来任何不舒服的感觉。

声音合成装置-200580003367.8
发明人：斋藤夏树;釜井孝浩;加藤弓子 -专利权人：松下电器产业株式会社
申请日： 2005-01-17 - 公布日： 2007-02-14 - 主分类号： G10L13/06
摘要：提供一种从文本数据生成音质的自由度较宽、音质良好的合成声音的声音合成装置。声音合成装置具备：声音合成DB(101a，101z)；声音合成部(103)，取得文本(10)，并且从声音合成DB(101a)生成与包含在文本(10)中的字符对应的音质A的声音合成参数值串(11)，从声音合成DB(101z)生成与包含在文本(10)中的字符对应的音质Z的声音合成参数值串(11)；声音过渡部(105)，从音质A及音质Z的声音合成参数值串(11)生成表示与包含在文本(10)中的文字对应的、音质A及音质Z的中间音质的合成声音的中间声音合成参数值串(13)；扬声器(107)，将生成的中间声音合成参数值串(13)变换为其合成声音并输出。

用于选择话音数据的设备、方法和程序-200480018793.4
发明人：佐藤宁 -专利权人：株式会社建伍
申请日： 2004-06-03 - 公布日： 2006-08-09 - 主分类号： G10L13/06
摘要：本发明提供了一种话音数据选择器等，用于以简单的构成以高速度获得自然的合成语音。在本发明的话音数据选择器中，在提供表示消息模板的数据时，话音元编辑器从话音元数据库中检索读音与消息模板中的话音元一致的话音元的话音元数据。另一方面，话音元编辑器执行消息模板的韵律预测，并且从所检索的话音元数据中，基于评估表达式，确定与消息模板中的每个话音元最适当地一致的话音元数据。该评估表达式具有关于韵律预测结果的变量，即话音元数据之间的音调分量频率的一次回归的结果和发声速度的时间差。这样，相互组合所确定的话音元数据和波形数据，该波形数据是在未成功确定的情况下使声处理器作为它们的替代而提供的，并且生成表示合成语音的数据。

语音合成设备、语音合成方法和程序-200480018265.9
发明人：佐藤宁 -专利权人：株式会社建伍
申请日： 2004-06-03 - 公布日： 2006-08-02 - 主分类号： G10L13/06
摘要：一种简单构成的语音合成设备等，用于以高速度产生自然的合成语音。当提供了表示消息模板的数据时，话音元编辑器(5)搜索话音元数据库(7)，搜索关于声音与消息模板中的话音元匹配的话音元的话音元数据。而且，话音元编辑器(5)预测消息模板的韵律，并且根据韵律预测的结果，以一次一个的方式从已检索出的话音元数据中选择消息模板中的每个话音元的最佳匹配。对于不能选择出其匹配的话音元，指令声处理器(41)提供表示每个单位话音的波形的波形数据。组合所选择的的话音元数据和由声处理器(41)提供的波形数据，以生成表示合成语音的数据。

语音信号压缩设备、语音信号压缩方法和程序-200480008663.2
发明人：佐藤宁 -专利权人：株式会社建伍
申请日： 2004-03-26 - 公布日： 2006-05-03 - 主分类号： G10L13/06
摘要：本发明提供了一种用于去除必然混杂在语音中的噪声的语音信号噪声去除设备和具有类似功能的设备。间距分析部分(2)决定语音间距成分各频率的修正后的移动平均值，该语音是由语音输入部分(1)获得的原始语音信号所表示的。可变滤波器(3)通过从原始语音信号成分中去除由间距分析部分(2)所确定的修正后的移动平均值及其附近之外的成分，以提取该间距成分。绝对值检测部分(4)确定该间距成分的绝对值，并且低通滤波器(5)对表示所获得的绝对值的信号进行滤波以生成增益调整信号。随后，通过由增益调整信号的值所确定的增益，由增益调整部分(7)对由延迟部分(6)调整了时点的原始语音数据进行放大或减弱并输出。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音合成装置，语音合成方法，以及程序无效

专利文献下载