[发明专利]声音合成装置有效
申请号: | 200780020871.8 | 申请日: | 2007-05-11 |
公开(公告)号: | CN101490740A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 广濑良文;加藤弓子;釜井孝浩 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L13/06 | 分类号: | G10L13/06 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 杨 谦;胡建新 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种声音合成装置,能够高速地进行声音内容的编辑,并可以容易地制作声音内容,其中包括:小规模声音单元DB(101)、小规模声音单元选择部(102)、小规模声音单元连接部(103)、韵律校正部(104)、大规模声音单元DB(105)、使小规模声音单元DB(101)和大规模声音单元DB(105)相对应的对应DB(106)、声音单元候补获得部(107)、大规模声音单元选择部(108)、以及大规模声音单元连接部(109),该声音合成装置利用小规模声音单元DB(101)来编辑合成音,并通过根据编辑结果,利用大规模声音单元DB(105)进行高音质化,从而能够容易地在移动终端上制作声音内容。 | ||
搜索关键词: | 声音 合成 装置 | ||
【主权项】:
1. 一种声音合成系统,生成符合声音记号以及韵律信息的合成音,其特征在于,所述声音合成系统包括通过计算机网络而相互连接的制作终端、服务器、以及接收终端;所述制作终端包括:小规模数据库,保持用于生成合成音的合成音生成用数据;以及合成音生成用数据选择机构,从所述小规模数据库选择合成音生成用数据,该合成音生成用数据是指,被生成的合成音最符合声音记号以及韵律信息的合成音生成用数据;所述服务器包括大规模数据库,保持众多数量的声音单元,所保持的这些声音单元比所述小规模数据库所保持的所述合成音生成用数据多,且生成的合成音比所述小规模数据库所保持的所述合成音生成用数据更能够详细表现韵律信息;所述接收终端包括:符合声音单元选择机构,从所述大规模数据库中选择,与所述合成音生成用数据选择机构所选择的所述合成音生成用数据相对应、且生成的合成音最符合所述声音记号以及所述韵律信息的声音单元;以及声音单元连接机构,通过连接在所述符合声音单元选择机构所选择的所述声音单元,而生成合成音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200780020871.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 话音合成器、话音合成方法和话音合成程序-201180016109.9
- 加藤正德 - 日本电气株式会社
- 2011-03-23 - 2012-12-12 - G10L13/06
- 归一化谱存储单元(204)预存储基于随机数序列计算的归一化谱。浊音生成单元(201)基于与输入文本相对应的浊音的多个分段以及存储在归一化谱存储单元(204)中的归一化谱来生成浊音波形。清音生成单元(202)基于与输入文本相对应的清音的多个分段来生成清音波形。合成话音生成单元(203)基于由浊音生成单元(201)生成的浊音波形和由清音生成单元(202)生成的清音波形来生成合成话音。
- 在语音合成中用于融合浊音音素单元的方法和装置-201080001520.4
- 栾剑;李健 - 株式会社东芝
- 2010-06-28 - 2012-06-20 - G10L13/06
- 本发明提供了在语音合成中用于融合浊音音素单元的方法和装置。本发明的一种用于融合浊音音素单元的装置包括:单元输入模块,其输入用于目标片段的浊音音素的多个单元;单元切分模块,其对多个单元的每个单元进行切分以获得每个单元的基音周期;参考单元选择模块,其基于每个单元的基音周期信息和目标片段的基音周期个数从多个单元中选择一个参考单元;模板创建模块,其基于参考单元和目标片段的基音周期个数创建一个模板;基音周期对齐模块,其利用动态规划算法将多个单元的除了参考单元的每个单元的基音周期与模板的基音周期对齐;基音周期融合模块,其将对齐的基音周期融合;以及基音周期拼接模块,其将融合的基音周期拼接为目标片段的融合单元。
- 基于HMM的双语(普通话-英语)TTS技术-201110291213.0
- Y·钱;F·K-P·宋 - 微软公司
- 2008-08-19 - 2012-02-22 - G10L13/06
- 一种用于基于一种或多种语言的文本来生成语音的示例性方法,该方法包括提供两种或更多语言的音素集、训练包括跨语言状态级共享的多语言HMM、接收该多语言HMM的语言中的一种或多种语言的文本、以及至少部分地基于该多语言HMM来生成对应于所接收到的文本的语音。其他示例性技术包括第一语言的决策树和第二语言的决策树之间的映射和可任选地反方向的映射、以及对多语言文本-语音系统的Kullback-Leibler散度分析。
- 一种语音基元的编码与合成系统-201010215135.1
- 孟智平 - 上海视加信息科技有限公司
- 2010-06-30 - 2012-01-11 - G10L13/06
- 本发明公开了一种语音基元的编码与合成系统,可用于低带宽高音质的语音传输。本发明在数字语音传输的基础上,以构建的语音基元为编码对象,建立语音基元模型库,把语音基元用统一的方法和编码进行表示,从而进一步合成语音。该方法首先通过对日常语音的分析,采用聚类算法构建语音基元模型库;然后,利用语音基元自动切分算法,对获得的连续语音流进行语音基元的自动切分,并提取语音基元MFCC特征,通过与语音基元模型库中的语音基元进行匹配识别,获得语音基元所对应的编号,以编号代替语音基元进行编码。在合成语音过程中,通过编号从语音基元模型库中取出该编号所对应的语音基元,并通过数学变换对语音基元的频谱包络进行插值拟合等处理,形成平滑过度的语音。
- 通过多形式段的生成和连接进行的合成-200880111498.1
- V·波莱;A·布里恩 - 微差通信公司
- 2008-08-12 - 2010-09-08 - G10L13/06
- 描述了一种语音合成系统和方法。语音段数据库参考具有各种不同语音表示结构的语音段。语音段选择器从所述语音段数据库选择对应于目标文本的语音段候选的序列。语音段定序器根据所述语音段候选生成对应于所述目标文本的定序的语音段。语音段合成器组合定序的语音段来产生对应于所述目标文本的合成语音信号输出。
- 声音信号生成方法、声音信号生成装置以及计算机程序-200780100514.2
- 渡边一宏 - 富士通株式会社
- 2007-09-06 - 2010-08-04 - G10L13/06
- 本发明提供通过对原音信号进行加工生成加工声音信号来合成对噪声感、粗糙感等音质劣化进行了抑制的高质量语音的声音信号生成方法、声音信号生成装置以及计算机程序。本发明按照波形的间距单位分离原音信号,生成多个单位波形信号,针对各单位波形信号,生成重复波形信号,该重复波形信号是使所生成的单位波形信号的波形重复预定次数而得到的,通过按照形成原音信号的顺序以间距为单位使各个重复波形信号移动后进行叠加,来生成加工声音信号。
- 音质编辑装置及音质编辑方法-200880001664.2
- 广濑良文;釜井孝浩 - 松下电器产业株式会社
- 2008-06-04 - 2010-01-06 - G10L13/06
- 本发明的音质编辑装置包括:音质特征DB(101),记忆多个音质特征;讲话者属性DB(106),关于各个音质特征,记忆用户能够想起的与该音质特征对应的音质的标识符;权重设定部(103),按每个音质的声特征量设定权重;尺度构成部(105),关于各个音质特征,根据构成该音质特征的多个声特征量和权重设定部(103)所设定的权重,算出该音质特征的显示坐标;显示部(107),关于各个音质特征,在算出的显示坐标上显示与该音质特征对应的标识符;位置输入部(108),接受坐标的输入;音质混合部(110),关于多个音质特征的一部分或全部的每一个,通过算出该音质特征的显示坐标与所述接受了的坐标之间的距离,并根据算出的距离的比率,混合多个音质特征的一部分或全部的声特征量,生成新的音质特征。
- 声音合成装置、声音合成方法以及程序-200880005607.1
- 加藤正德;近藤玲史;三井康行 - 日本电气株式会社
- 2008-02-15 - 2009-12-30 - G10L13/06
- 提供一种能够生成由于韵律变化量的不均匀而导致的音质劣化程度小的合成声音的装置、方法以及程序。声音合成装置具有从候选片段中选择适合目标片段环境的片段的片段选择部(161),该声音合成装置还包括:韵律变化量计算部(20),根据目标片段环境和候选片段的韵律信息来计算各候选片段的韵律变化量;选择基准计算部(21),根据韵律变化量来计算选择基准;候选选择部(22),根据韵律变化量和选择基准来进行选择候选的缩选;以及最适合片段检索部(14),从被缩选出的候选片段中检索最适合片段。
- 声音合成装置-200780020871.8
- 广濑良文;加藤弓子;釜井孝浩 - 松下电器产业株式会社
- 2007-05-11 - 2009-07-22 - G10L13/06
- 一种声音合成装置,能够高速地进行声音内容的编辑,并可以容易地制作声音内容,其中包括:小规模声音单元DB(101)、小规模声音单元选择部(102)、小规模声音单元连接部(103)、韵律校正部(104)、大规模声音单元DB(105)、使小规模声音单元DB(101)和大规模声音单元DB(105)相对应的对应DB(106)、声音单元候补获得部(107)、大规模声音单元选择部(108)、以及大规模声音单元连接部(109),该声音合成装置利用小规模声音单元DB(101)来编辑合成音,并通过根据编辑结果,利用大规模声音单元DB(105)进行高音质化,从而能够容易地在移动终端上制作声音内容。
- 专利分类