[发明专利]语音合成器产生系统与方法有效

申请号：	200710137109.X	申请日：	2007-07-19
公开（公告）号：	CN101350195A	公开（公告）日：	2009-01-21
发明（设计）人：	郭志忠;沈民新	申请（专利权）人：	财团法人工业技术研究院
主分类号：	G10L13/04	分类号：	G10L13/04
代理公司：	北京市柳沈律师事务所	代理人：	葛宝成;黄小临
地址：	中国台***	国省代码：	中国台湾;71
权利要求书：	查看更多	说明书：	查看更多
摘要：	提供一种语音合成器产生系统与方法。使用者输入语音输出需求规格至语音合成器产生系统，该系统可自动产生符合该需求描述的语音合成器。使用者亦可将此需求规格通过语音合成器产生系统的录音脚本产生器自动产生录音脚本，使用者依此脚本录制客制化或扩充语料。此语料经上传至语音合成器产生系统后，语音合成器产生器可自动产生符合需求的语音合成器。客户端的语音输出即可藉由该语音合成器完成。
搜索关键词：	语音合成器产生系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音合成器产生系统，包括：一语音输出规格，描述欲合成的句型与词汇、合成器的执行软硬件平台、以及语者条件；一欲合成的目标语言的来源语料库，包含欲合成的语言的所有单音；一语音合成器产生器，用以接收该语音输出规格，并根据该规格从该来源语料库中选择该些语音语料后，产生一能在指定平台上执行的语音合成器，该合成器包含一语音合成单元库与一语音合成引擎。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院，未经财团法人工业技术研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200710137109.X/，转载请声明来源钻瓜专利网。

上一篇：一种减小阈值电压标准方差的方法
下一篇：20英尺后开门标准集装箱散料装卸设备

同类专利

一种基于FPGA的Mel倒谱分析合成仪-201220233638.6
发明人：杨鸿武;丁朋程;裴东;王全州;甘振业;郭威彤 -专利权人：西北师范大学
申请日： 2012-05-23 - 公布日： 2012-12-19 - 主分类号： G10L13/04
摘要：本实用新型提供了一种基于FPGA的Mel倒谱分析合成仪，包括分别与LCD显示器、音频芯片、SD卡存储器、FLASH存储器、SRAM存储器和SDRAM存储器相连接的FPGA芯片；FPGA芯片包括Avalon交换架构；NIOSⅡ处理器软核嵌有JTAG调试模块。利用MCC的值调节Mel倒谱逼近滤波器系数，使存储在SD卡中的语音激励源信号通过Mel对数谱逼近滤波器产生语音数据，通过音频芯片将数字音频信号转换成模拟语音信号输出。本倒谱仪不仅能进行大数据量的处理计算，实现语音的分析合成，而且实现了便携化和仪器化。

语音合成设备-201210179123.7
发明人：才野庆二郎 -专利权人：雅马哈株式会社
申请日： 2012-06-01 - 公布日： 2012-12-05 - 主分类号： G10L13/04
摘要：本发明提供了一种语音合成设备，其被设计来用于使用多个语音段数据合成语音信号，每个语音段数据表示含有至少两个对应于不同音素的音素片段的语音段。在该设备中，语音段调整器根据第一语音段和第二语音段来形成目标片段，以便将第一语音段和第二语音段相互连接，使得所述目标片段由第一语音段的后部音素片段和第二语音段的前部音素片段形成，并且所述语音段调整部分将所述目标片段扩展到目标时间长度以形成调整片段，使得以比所述目标片段的前部分和后部分的扩展率高的扩展率来扩展所述目标片段的中间部分，从而产生具有所述目标时间长度的调整片段的合成语音段数据。语音合成器根据由所述语音段调整部分产生的合成语音段数据来产生语音信号。

语音合成设备-201210175478.9
发明人：若尔迪·博纳达;梅利因·布洛乌;橘诚 -专利权人：雅马哈株式会社
申请日： 2012-05-30 - 公布日： 2012-12-05 - 主分类号： G10L13/04
摘要：本发明提供了语音合成设备和语音合方法。在该语音合成设备中，音素段内插器部分获取音素段的与声音特性的第一值对应的第一音素段数据并获取该音素段的与该声音特性的第二值对应的第二音素段数据。第一音素段数据和第二音素段数据表示音素段的每个帧的频谱。音素段内插器在第一音素段数据的每个帧和与第一音素段数据的每个帧相对应的第二音素段数据的每个帧之间进行内插，从而产生音素段的与声音特性的目标值对应的音素段数据，其中该目标值不同于声音特性的第一值和第二值。语音合成器根据所产生的音素段数据来生成具有声音特性的目标值的语音信号。

用于能够使用语音的工作环境的训练/指导系统-200980138554.5
发明人： M·B·梅洛特;R·A·贝茨;M·劳赫尔里;J·R·洛根 -专利权人：沃科莱特保健系统公司
申请日： 2009-11-13 - 公布日： 2011-09-07 - 主分类号： G10L13/04
摘要：语音工作系统包括无线网络和配置用于通过无线网络进行通信的至少两个能够使用语音的设备100、200。上述设备操作用于将系统提示转变成语音以及使用语音识别将语音命令转变成系统命令。第一设备100可由用户130选择性地被激活成指导模式，以通过无线网络40建立与第二设备200和另一用户230的连接。一旦以指导模式连接，进行指导的用户130接收来自接受指导的用户230和第二设备200的系统提示。之后进行指导的用户的第一设备100将那些接收到的提示提供给进行指导的用户130。

用于提供改进的语音合成的方法、设备和计算机程序产品-200980120201.2
发明人： J·纽尔米南;T·赖蒂奥;A·叙尼;M·瓦伊尼奥;P·阿尔库 -专利权人：诺基亚公司
申请日： 2009-05-19 - 公布日： 2011-05-04 - 主分类号： G10L13/04
摘要：一种用于提供改进的语音合成的设备可以包括处理器和存储可执行指令的存储器。响应于处理器对指令的执行，该设备可以执行：至少部分地基于与真实声门脉冲相关联的性质从一个或多个存储的真实声门脉冲中至少选择真实声门脉冲、将选择的该真实声门脉冲用作生成激励信号的基础并且基于模型生成的谱参数来修改激励信号以提供合成语音。

用于分布式文本到话音合成以及可理解性的系统和方法-201010153291.X
发明人：许军;李泰齐 -专利权人：创新科技有限公司
申请日： 2010-04-21 - 公布日： 2010-10-27 - 主分类号： G10L13/04
摘要：本发明提供了用于分布式文本到话音合成以及可理解性的系统和方法。更具体而言，本发明提供了在手持便携式计算设备上的分布式文本到话音合成，其可以被用于例如生成帮助用户与手持便携式计算设备的用户界面进行交互的可理解的音频提示。该文本到话音分布式系统70从客机设备接收文本串，并且包含文本分析器72、韵律分析器74、文本分析器和韵律分析器所参考的数据库14、以及话音合成器80。话音合成器80的元件驻留在主机设备和客机设备上，并且与文本串相关联的音频文件的音频索引表示是在主机设备处生成并被发送到客机设备的，以用于在客机设备处产生音频文件。

自动同步解释系统-200880116632.7
发明人： J·格雷尼埃尔 -专利权人：威廉·博纳东
申请日： 2008-11-18 - 公布日： 2010-10-13 - 主分类号： G10L13/04
摘要：一种解释系统，包括：源语言的书写语句或发音语句的光学或声音采集装置和声音重建装置；用于基于所述采集装置所采集的输入信号生成源语句的识别装置(30)，所述源语句是所述源语言语句的记录；用于生成目标语句的翻译装置(32)，所述目标语句是源语句以目标语言的翻译；和用于基于所述目标语句生成能够由所述声音重建装置(3、5)进行重建的输出声音信号的语音合成装置(34)。根据本发明，解释系统包括能够顺序呼叫所述识别装置(30)、所述翻译装置(32)和所述语音合成装置(34)以便实时地生成源语言语句的目标语言解释的平滑装置(40)。

语音合成的方法和系统-200810098474.9
发明人：双志伟;孟繁平;施勤;秦勇 -专利权人：国际商业机器公司
申请日： 2008-05-28 - 公布日： 2009-12-02 - 主分类号： G10L13/04
摘要：本发明提供一种用于在客户端对文本内容进行语音合成的方法。该方法包括：基于客户端的语料库中的当前语料单元集合S_当前，对文本内容进行语音合成；响应于判断需要更新客户端语料库的当前语料单元集合：分析文本内容，并生成具有相应语境特征的目标单元的列表，基于比客户端语料库的当前语料单元集合S_当前更丰富的语料单元集合S_总，根据语境特征为每个目标单元选择多个候选语料单元，根据多个候选单元为文本内容确定可用于语音合成的语料单元；以及基于所确定的语料单元，更新客户端语料库的当前语料单元集合。本发明还提供相应的系统。根据本发明的技术方案，客户端的TTS系统能够随着用户对该系统的进一步使用自适应的更新语料库，从而获得语音合成质量的有效改善。

语音合成装置、方法、程序、系统以及便携式信息终端-200910134594.4
发明人：高塚进 -专利权人：索尼爱立信移动通信日本株式会社
申请日： 2009-04-23 - 公布日： 2009-10-28 - 主分类号： G10L13/04
摘要：本发明涉及语音合成装置、方法、程序、系统以及便携式信息终端。该语音合成装置包括：内容选择单元，选择要被转换成语音的文本内容项目；相关信息选择单元，选择相关信息，所述相关信息能够被至少转换成文本并且与所述内容选择单元选择的文本内容项目相关；数据添加单元，将所述相关信息选择单元选择的相关信息转换成文本，并将所述文本的文本数据添加到所述内容选择单元选择的文本内容项目的文本数据；文本到语音转换单元，将从所述数据添加单元提供的文本数据转换成语音信号；和语音输出单元，输出从所述文本到语音转换单元提供的语音信号。

自动分割单字语音信号的装置-200820222733.X
发明人：陈淮琰;韩召宁;杨亚冬 -专利权人：无敌科技(西安)有限公司
申请日： 2008-12-02 - 公布日： 2009-10-07 - 主分类号： G10L13/04
摘要：本实用新型涉及一种自动分割单字语音信号的装置，该装置包含接收单元、分析单元以及分割单元；接收单元接入分析单元，分析单元接入分割单元，本实用新型完全替代了传统的人工切分单字语音的方式，整个过程不需要人工介入，省时省力，效率高，且大大降低了人为带来的失误率。

提供基于语言的交互式多媒体系统的方法、装置和计算机程序产品-200780042946.2
发明人： S·西瓦达斯 -专利权人：诺基亚公司
申请日： 2007-11-09 - 公布日： 2009-09-23 - 主分类号： G10L13/04
摘要：一种用于提供基于语言的交互式多媒体系统的装置，其包括选择元件、比较元件和处理元件。所述选择元件可以被配置以便基于与音素的输入序列相关联的语音处理的类型来选择音素图。所述比较元件可以被配置以便将所述音素的输入序列与所选择的音素图相比较。所述处理元件可以与所述比较元件进行通信，并且可以被配置以便基于该比较来处理所述音素的输入序列。

话音及文本通信系统、方法及设备-200780028278.8
发明人：斯蒂芬·莫洛伊;哈利德·希勒米·埃尔-马勒赫 -专利权人：高通股份有限公司
申请日： 2007-07-31 - 公布日： 2009-07-29 - 主分类号： G10L13/04
摘要：本发明涉及用以将语音转换成文本及将文本转换成语音的系统、方法及设备。一种设备包括声码器、语音到文本转换引擎、文本到语音转换引擎及用户界面。所述声码器可操作以将语音信号转换成包及将包转换成语音信号。所述语音到文本转换引擎可操作以将语音转换成文本。所述文本到语音转换引擎可操作以将文本转换成语音。所述用户界面可操作以接收用户从多个模式中对一模式的选择，其中第一模式启用所述语音到文本转换引擎，第二模式启用所述文本到语音转换引擎，且第三模式启用所述语音到文本转换引擎及所述文本到语音转换引擎。

语音合成装置及其方法-200680054679.6
发明人：西山修;森田真弘;笼岛岳彦 -专利权人：株式会社东芝
申请日： 2006-10-19 - 公布日： 2009-06-03 - 主分类号： G10L13/04
摘要：一种语音合成装置，包括：从外部获取用于语音合成的文本数据的文本获取装置；对文本数据执行形态分析/解析的语言处理器；根据文本数据的与韵律和语言有关的属性，诸如重音和词性，向语音合成器输出合成单元串的韵律处理器；根据合成单元串产生合成语音的语音合成器；以及在输出合成语音被积累后或者在其被输出时顺序地再现规定量的输出合成语音的语音波形输出装置。

提供特征变换的有效评估的方法、装置、移动终端以及计算机程序产品-200780015664.3
发明人： J·田;J·K·尼尔米南;V·波帕 -专利权人：诺基亚公司
申请日： 2007-03-09 - 公布日： 2009-05-13 - 主分类号： G10L13/04
摘要：一种用于提供特征变换的有效评估的装置，包括训练模块和变换模块。训练模块被配置为使用训练源数据和训练目标数据来训练高斯混合模型(GMM)。变换模块与训练模块通信。变换模块被配置为响应于对GMM的训练而产生转换函数。训练模块进一步被配置为通过计算GMM的迹测量，在使用转换函数之前确定转换函数的质量。

语音处理装置及语音处理方法-200810179911.X
发明人：平林刚;徐大威;笼岛岳彦 -专利权人：株式会社东芝
申请日： 2008-10-31 - 公布日： 2009-05-06 - 主分类号： G10L13/04
摘要：本发明涉及语音处理装置及语音处理方法。语音处理装置被配置为将第一语音波形和第二语音波形分别分割为多个频带以产生作为每一频带分量的第一带语音波形和第二带语音波形；确定每一频带的第一带语音波形和第二带语音波形之间的交叠相加位置以获得第一带语音波形和第二带语音波形之间的高互相关；并且以该交叠相加位置为基础，交叠相加每一频带的第一带语音波形和第二带语音波形并且在所有的多个频带上集成该多个频带的交叠相加带语音波形以产生拼接语音波形。

自动分割单字语音信号的装置与方法-200810232545.X
发明人：陈淮琰;韩召宁;杨亚冬 -专利权人：无敌科技（西安）有限公司
申请日： 2008-12-02 - 公布日： 2009-04-29 - 主分类号： G10L13/04
摘要：本发明涉及一种自动分割单字语音信号的装置与方法，该装置包含接收模块，用来接收单字语音信号，并将单字语音信号划分为多个音框；分析模块，分析音框，产生对应于每一个音框的语音特征；分割模块，根据语音特征，分割单字语音信号为音节，接收模块接入分析模块，分析模块接入分割模块，本发明完全替代了传统的人工切分单字语音的方式，整个过程不需要人工介入，省时省力，效率高，且大大降低了人为带来的失误率。

自动进行语音转换的方法和装置-200710139735.2
发明人：施琴;秦勇;刘义;双志伟 -专利权人：国际商业机器公司
申请日： 2007-07-30 - 公布日： 2009-02-04 - 主分类号： G10L13/04
摘要：本发明提出了一种能够显著改进音色转换的质量，并保证转换的声音相似度的方法和装置。本发明在语音合成库中设置有若干标准说话人，根据不同的角色，本发明选用不同的标准说话人的声音进行语音合成，所述被选中的标准说话人的声音与原始角色之间已经存在一定程度的相似性。然后本发明将这种与原始声音具有一定程度相似性的标准语音进一步进行音色转换，以精确模仿原始说话人的声音，从而使得转换后的声音在保证相似度的同时，更加接近原始的语音特征。

语音合成器产生系统与方法-200710137109.X
发明人：郭志忠;沈民新 -专利权人：财团法人工业技术研究院
申请日： 2007-07-19 - 公布日： 2009-01-21 - 主分类号： G10L13/04
摘要：提供一种语音合成器产生系统与方法。使用者输入语音输出需求规格至语音合成器产生系统，该系统可自动产生符合该需求描述的语音合成器。使用者亦可将此需求规格通过语音合成器产生系统的录音脚本产生器自动产生录音脚本，使用者依此脚本录制客制化或扩充语料。此语料经上传至语音合成器产生系统后，语音合成器产生器可自动产生符合需求的语音合成器。客户端的语音输出即可藉由该语音合成器完成。

用于仅文本的应用的娱乐音频-200710107719.5
发明人： O·基尔克比 -专利权人：诺基亚公司
申请日： 2007-04-28 - 公布日： 2008-10-29 - 主分类号： G10L13/04
摘要：一种针对仅文本的应用生成音频的方法，包括步骤：向输入的文本添加标签，所述标签可用于向生成的音频添加音效，处理所述标签以形成用于生成所述音频的指令，基于所述指令生成带有所述音效的音频，同时呈现文本。本发明向文本应用中添加娱乐值并提供相比较于常规多媒体很紧凑的格式，以及使用娱乐声音以使得例如SMS和电子邮件的仅文本的应用更为有趣和娱乐性。

语音合成系统和语音合成方法-200810096375.7
发明人：森田真弘;笼岛岳彦 -专利权人：株式会社东芝
申请日： 2008-03-28 - 公布日： 2008-10-01 - 主分类号： G10L13/04
摘要：在一种语音合成中，选择单元从对应于第一节段序列的第一语音单元串中选择一个串，所述第一节段序列通过将对应于目标语音的音位串分割为节段来获得。选择单元基于对应于第二节段序列的最多W个第二语音单元串，重复实施产生对应于第三节段序列的第三语音单元串，其中所述第二节段序列作为第一序列的部分序列，所述第三节段序列通过对第二序列添加节段来获得，并基于每个第三串的估计值从第三串中选择最多W个串。通过使用每个第三串的惩罚系数来修正每个第三串候选的总成本，来获得该数值。该系数基于涉及语音单元数据获取的速度的限制，并依赖于接近所述限制的程度。

文字文件自动标示时间的装置与方法-200710088627.7
发明人：颜铭祥;颜睿余;赵平峡 -专利权人：微星科技股份有限公司
申请日： 2007-03-16 - 公布日： 2008-09-17 - 主分类号： G10L13/04
摘要：一种文字文件自动标示时间的装置与方法；接收模块接收文字文件与语音文件，其中文字文件由多个句子所组成；语音辨识模块将文字文件中的句子转换为语音模型，并依据间隔时间将语音文件划分为多个帧且依序编号，通过语音撷取将帧的语音数据变成特征参数，并计算出帧与语音模型互相匹配的最佳语音路径；标示模块依据最佳语音路径撷取出每一句子的开头所对应的帧的编号，由帧的编号与间隔时间取得每一句子的开头对应于语音文件的起始时间，并标示起始时间于文字文件。通过本发明的方法可将文字文件中的每一个句子自动标示出对应于语音文件的起始时间，不需再如传统技术一样利用人工的方式逐句标示时间，进而节省大量的时间与人力的花费。

一种用于对多媒体信号执行自动配音的方法和设备-200680019320.5
发明人： A·普罗伊德尔;N·安杰洛瓦 -专利权人：皇家飞利浦电子股份有限公司
申请日： 2006-05-24 - 公布日： 2008-05-28 - 主分类号： G10L13/04
摘要：本发明涉及一种用于对诸如TV或DVD信号的多媒体信号执行自动配音的方法和系统，其中多媒体信号包括关于视频和语音的信号，并进一步包括对应于所述语音的文本信息。初始由接收机接收多媒体信号。然后语音和文本信息分别被提取，其产生所述语音和文本信息。语音被分析以产生至少一个话音特征参数，并基于该至少一个话音特征参数将文本信息转换为新语音。

用于频率调制合成的波形产生-200610064409.5
发明人：阿朗沙多;凯茜·利伯曼－加普;维克托·曼泽拉 -专利权人：开曼群岛威睿电通股份有限公司
申请日： 2006-10-08 - 公布日： 2008-04-09 - 主分类号： G10L13/04
摘要：一种用于从存储在一个或多个存储器表中的至少一个原型波形的一个或多个连续片段中产生一个或多个预定波形的方法和系统，该方法和系统包括重复以下取样处理步骤：读取在预定地址存储的原型波形的至少一个取样，根据预定逻辑修改取样，并且累加所修改的取样，其中通过以上步骤的预定数量的重复，通过累加所修改的取样可形成新的波形的周期。

单通道多点异步语音自动合成组合装置-200720036980.6
发明人：陈战平 -专利权人：南京师范大学
申请日： 2007-05-14 - 公布日： 2008-03-12 - 主分类号： G10L13/04
摘要：单通道多点异步语音自动合成组合装置为利用网络方式实现的远程定点语音播放、控制的装置，该装置以数字信号处理器(1)为中心，数字信号处理器(1)中的TCP/IP数据传输模块(11)与数字信号传输接口(2)相连接，数字信号处理器中的数据存储控制模块(13)与数字信号存储单元(5)相连接，数字信号处理器中的输入输出控制模块(12)的输出端接模拟信号传输接口(3)的输入端，数字信号处理器中的输出语音A/D转换模块(14)及模拟信号传输接口的输出端分别接音频功放输出接口(4)的输入端；音频功放输出接口的输出端扬声器(6)，可按现有系统播音方式工作，又能接受数据控制完成单通道多点异步语音自动合成组合。

语音翻译装置和方法-200710139019.4
发明人：古贺敏之 -专利权人：株式会社东芝
申请日： 2007-07-23 - 公布日： 2008-01-30 - 主分类号： G10L13/04
摘要：一种语音翻译装置，包括：语音输入单元、语音识别单元、机器翻译单元、参数设置单元、语音合成单元，以及语音输出单元，并且从通过语音识别/机器翻译获得的多个似然确定将被输出的语音数据的语音音量值。对于具有低似然的单词，使得其语音音量值小，从而难以发送给用户，而另一方面，对于具有高似然的单词，使得其语音音量值大，进行特别强调，并发送给所述用户。

一种嵌入式平台语音合成系统及其方法-200710098522.X
发明人：徐磊 -专利权人：北京中星微电子有限公司
申请日： 2007-04-19 - 公布日： 2008-01-30 - 主分类号： G10L13/04
摘要：本发明的一种嵌入式平台语音合成系统及其方法，用于在嵌入式平台上进行文语转换，其包括：语音库，用于存储语音数据；算法库，调用与所输入的文本数据相对应的语音数据，并将所述语音数据合成为语音后输出，用于存储所述已合成语音的第一缓存单元和第二缓存单元；以及控制装置，用于控制所述第一缓存单元和所述第二缓存单元中已合成语音的读写。本发明通过设置片内缓冲单元，可以很好地解决在嵌入式平台上合成语音不连续的问题，较好的实现语音的实时播放效果，并且，本发明对于TTS系统的嵌入式环境移植具有良好的通用性。

语音合成装置和方法-200710104617.8
发明人：笼岛岳彦 -专利权人：株式会社东芝
申请日： 2007-05-18 - 公布日： 2007-11-21 - 主分类号： G10L13/04
摘要：波形存储器存储多个语音单元波形。信息存储器对应地存储语音单元信息以及所述多个语音单元波形的每一个的地址。选择器通过参考所述语音单元信息，选择对应于所述输入音素序列的语音单元序列。语音单元波形获取单元通过参考所述地址，从所述波形存储器获取对应于所述语音单元序列的各个语音单元的语音单元波形。语音单元连接单元通过连接所述获取的语音单元波形来产生所述语音。所述语音单元波形获取单元在一次访问期间从波形存储器的连续区域获取与包含在所述语音单元序列中的至少两个语音单元相对应的至少两个语音单元波形。

向用户通知媒体内容项目的类别的数据处理设备和方法-200580035689.0
发明人： D·布拉泽罗维;D·P·凯利 -专利权人：皇家飞利浦电子股份有限公司
申请日： 2005-10-10 - 公布日： 2007-09-26 - 主分类号： G10L13/04
摘要：本发明涉及一种向用户通知媒体内容项目的类别(152)的方法。该方法包括以下步骤：识别该媒体内容项目的类别；以及使得用户能够获得具有依据该媒体内容项目的类别的音频参数(153)的可听信号(156)。本发明还涉及一种能够根据所述方法运作的设备。本发明还涉及包括向用户通知媒体内容项目的类别的可听信号的音频数据、包括多条所述音频数据的数据库以及一种计算机程序产品。在一个推荐器系统中，当与该推荐器系统的用户交互涉及特定类型的媒体内容项目时，所述可听信号可以由该推荐器系统再现。本发明可以用在EPG用户界面中。

一种声音录制存储方法及影音设备-200710073784.0
发明人：吴凯庭;吴启楠;梁仲宏;王燕飞 -专利权人：深圳万利达电子工业有限公司
申请日： 2007-03-30 - 公布日： 2007-09-12 - 主分类号： G10L13/04
摘要：本发明适用于影音设备领域，提供了声音录制存储方法及影音设备。所述方法包括以下步骤：接收外界的声音，并转换成模拟电信号；将模拟电信号进行A/D转换，转换成数字信号；将所述数字信号与播放中的数字音乐信号进行混频后进行音频编码压缩处理，转换成音频压缩格式的数据后输出到存储设备进行存储。本发明实施例的声音录制存储方法，将输入的声音信号转换成数字信号后，与播放中的数字音乐信号进行混音后进行编码压缩处理，并进行存储，提供了可以将外界声音进行录制的声音录制存储方法，解决了现有的视盘机等影音设备中没有便利的方法录制存储外界声音的问题。

用于语音到文本的转录系统的错误检测-200480032825.6
发明人： H·施拉姆 -专利权人：皇家飞利浦电子股份有限公司
申请日： 2004-10-27 - 公布日： 2006-12-13 - 主分类号： G10L13/04
摘要：本发明涉及一种用于在由语音到文本的转录系统产生的文本内错误检测的方法、系统和计算机程序产品。借助于文本到语音的转录系统将转录文本再变换成人工语音信号。原始自然语音信号和人工产生的语音被提供给校对者以比较两个声学信号。在原始语音信号与从转录文本中变换的语音之间的偏差表示在语音到文本的变换过程中可能出现了错误，这不得不人工进行校正。优选地通过使用从所述两个语音信号推导出的比较信号，要比较的语音信号能够在视觉上和/或在听觉上被提供给校对者。在校对过程中能够跳过大部分正确转录的文本，从而节省了时间，并且增强了整个校对过程的有效性。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音合成器产生系统与方法有效

专利文献下载