“语音合成”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果653652个，建议您升级VIP下载更多相关专利

[发明专利]一种在语音合成系统中提升模板句合成效果的方法-CN200610096675.6无效
发明人：王仁华;刘庆峰;吴晓如;严峻;赵志伟;熊厚余;李文兵;于继栋 -专利权人：安徽中科大讯飞信息科技有限公司
申请日： 2006-10-16 - 公布日： 2007-04-11 - 主分类号： G10L13/00 文献下载
摘要：本发明公开了一种在语音合成系统中提升模板句合成效果的方法，从而管理和提高音库效能。本发明包括建立模板音库、模板资源索引、文本合成、语音合成与拼接。本发明根据合成文本类型提炼语音模板，建立模板音库，在语音合成系统中自动识别和调用模板音库，对模板固定成分采用真人语音，对非固定成分采用合成语音，完成文本信息到合成语音的转换。本发明改进了相似文本集的语音合成流程，有效利用定制音库，做到既充分利用真人录音的自然流畅，又减少音库冗余，从而提高语音服务的品质。
一种语音合成系统提升模板效果方法

[发明专利]一种语音合成方法、装置、电子设备及存储介质-CN202110461260.9在审
发明人：张硕 -专利权人：暗物智能科技(广州)有限公司
申请日： 2021-04-27 - 公布日： 2022-11-15 - 主分类号： G10L13/10 文献下载
摘要：本申请提供一种语音合成方法、装置、电子设备及存储介质，该方法包括：获取待合成文本；根据待合成文本中各字符对应的字符类型，确定待合成文本的韵律标识信息；按照韵律标识信息所对应的语音合成标准，将待合成文本转换为对应的语音数据上述方案提供的语音合成方法，使合成的语音更符合正常的说话习惯，提高了语音合成的自然度，改善了用户体验。
一种语音合成方法装置电子设备存储介质

[发明专利]语音合成设备及方法-CN200810084717.3无效
发明人：奥谷泰夫;相泽道雄;深田俊明 -专利权人：佳能株式会社
申请日： 2008-03-14 - 公布日： 2008-09-17 - 主分类号： G10L13/02 文献下载
摘要：本发明提供了一种语音合成设备及方法。语言处理单元通过对从文本保存单元提供的文本进行语言分析，来识别单词。合成选择单元针对从语言分析结果提取的所关注的单词，选择由基于规则合成单元进行的语音合成处理或者由基于预先记录语音合成单元进行的语音合成处理。所选择的基于规则合成单元或基于预先记录语音合成单元对所关注的单词执行语音合成处理。
语音合成设备方法

[发明专利]语音合成模型的训练方法、语音合成方法及相关设备-CN202211128018.0在审
发明人：刘鹏飞;蒋宁;吴海英;刘敏 -专利权人：马上消费金融股份有限公司
申请日： 2022-09-16 - 公布日： 2023-05-16 - 主分类号： G10L13/02 文献下载
摘要：本申请提供了一种语音合成模型的训练方法、语音合成方法及相关设备，通过获取训练数据，训练数据包括目标语音和目标语音对应的音素序列；对目标语音进行预处理，确定目标梅尔频谱；以及将音素序列输入语音合成模型中进行合成处理，得到预测梅尔频谱；按照目标语音的声音规则分别对目标梅尔频谱和预测梅尔频谱进行切分和组对处理，得到N个频谱片段对；利用对抗判别模型中的N个判别器，分别基于N个频谱片段对，对语音合成模型进行对抗生成训练，训练完成的语音合成模型用于将待合成文本合成为合成语音。达到了合成语音吐字清晰、发音更自然、节奏和韵律感更好且更接近真人声音的技术效果。
语音合成模型训练方法相关设备

[发明专利]语音合成方法、系统、电子设备及存储介质-CN202310072854.X有效
发明人：陈杰;康世胤;吴志勇 -专利权人：深圳元象信息科技有限公司;清华大学深圳国际研究生院
申请日： 2023-02-07 - 公布日： 2023-06-02 - 主分类号： G10L13/04 文献下载
摘要：本申请涉及语音合成技术领域，尤其涉及一种语音合成方法、系统、电子设备及存储介质。该语音合成方法基于预训练的语音合成模型实现，语音合成模型包括文本编码器模块、时长预测模块、解码器模块，方法包括：获取音素序列，并输入至语音合成模型；通过文本编码器模块将音素序列转换成均值序列，并输入至时长预测模块；通过时长预测模块将均值序列扩展复制，得到拓展后的均值序列；通过解码器模块将拓展后的均值序列去噪并转换为梅尔谱，以输出合成后的语音。本申请的语音合成方法，可以将语音转换成均值序列并去噪，经过去噪操作后，提高了语音合成速度，加快了解码器的运算速度，使得基于去噪扩散概率模型的语音合成模型能够应用在实际场景中。
语音合成方法系统电子设备存储介质

[发明专利]语音翻译处理方法及装置-CN201711107221.9在审
发明人：刘俊华;魏思;胡国平;柳林;王建社;方昕;李永超;孟廷 -专利权人：科大讯飞股份有限公司
申请日： 2017-11-10 - 公布日： 2018-04-13 - 主分类号： G10L15/26 文献下载
摘要：本发明实施例提供一种语音翻译处理方法及装置，属于语言处理技术领域。该方法包括在对第一合成语音信号进行播报的过程中，若接收到包含有部分第一合成语音信号的混合语音信号，则停止播报第一合成语音信号。从混合语音信号过滤掉部分第一合成语音信号，得到当前轮次待翻译的语音信号，并作为目标语音信号。基于目标语音信号，获取第二合成语音信号，并播报第二合成语音信号。本发明实施例在接收到包含有部分第一合成语音信号的混合语音信号时，停止播报第一合成语音信号，并播报第二合成语音信号。
语音翻译处理方法装置

[发明专利]一种语音处理方法及装置-CN202110813868.3在审
发明人：孙晓辉;王宝勋 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-07-19 - 公布日： 2021-12-21 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例提供了一种语音处理方法及装置，其中方法包括：接收用户终端发送的目标文本；调用语音合成模型对所述目标文本进行处理，生成所述目标文本对应的合成语音数据，其中，所述语音合成模型是根据用户的语音数据、所述语音数据的文本特征信息和所述用户的身份特征信息训练得到的；向所述用户终端发送所述目标文本对应的合成语音数据，可以简化语音合成时用户的操作，并保证良好的语音合成效果。
一种语音处理方法装置

[发明专利]铃声编辑方法及其编辑装置-CN200410102970.9无效
发明人：崔正锡;尹城哲 -专利权人：乐金电子（中国）研究开发中心有限公司
申请日： 2004-12-31 - 公布日： 2005-11-16 - 主分类号： H04M1/00 文献下载
摘要：本发明是关于铃声编辑方法及其编辑装置，使用户使用以目录方式提供的铃声和用户输入的语音信号合成而形成的语音合成铃声。为此，本发明在合成已存储的铃声和语音来编辑铃声的方法上，提供包含有如下几个阶段的铃声编辑方法及装置：语音信号形成阶段，输入并存储要合成的语音；语音合成铃声的形成阶段，合成被选择的一个以上的铃声而形成语音合成铃声
铃声编辑方法及其装置

[发明专利]用于文本到语音合成的用户接口适应的方法和系统-CN202080101685.2在审
发明人： A.纳拉雅南 -专利权人：谷歌有限责任公司
申请日： 2020-06-03 - 公布日： 2023-01-31 - 主分类号： G10L13/033 文献下载
摘要：公开了一种根据用户接口输入使语音合成适应的方法和系统。在采用文本到语音(TTS)系统合成来自文本片段的语音并且同时在显示设备中显示该文本片段时，该系统可以接收跟踪操作输入，该跟踪操作输入跟踪经历合成的文本的一部分并且标识该文本的语境部分，对于该文本的语境部分，先前合成的语音已经以标准的语速合成。跟踪信息可以用于将该部分的TTS合成的语速从标准语速调整为适应的语速，并且该部分的合成语音的语音特性可以通过将语境部分的先前合成语音的适应的语速和合成语音特性两者应用于该部分的TTS合成处理来适应。可以以适应的语速和适应的语音特性输出标识的部分的合成语音。
用于文本语音合成用户接口适应方法系统

[发明专利]用于生成信息的方法和装置-CN201910806660.1有效
发明人：姚锟;洪智滨;韩钧宇;刘经拓 -专利权人：北京百度网讯科技有限公司
申请日： 2019-08-29 - 公布日： 2022-02-25 - 主分类号： G10L13/02 文献下载
摘要：该方法的一具体实施方式包括：获取待处理视频中原始音频对应的原始音素序列，以及待处理视频的原始视频帧序列；根据原始音频对应的文本生成合成语音，并确定合成语音对应的合成音素序列；基于合成音素序列对应的合成语音帧标识序列，对原始音素序列对应的原始语音帧标识序列进行处理，得到处理后语音帧标识序列，其中，处理后语音帧标识序列的长度与合成音素序列对应的合成语音帧标识序列长度相等；根据处理后语音帧标识序列，从原始视频帧序列中提取出视频帧生成处理后视频帧序列；使用合成语音和处理后视频帧序列，生成合成视频。该实施方式保证了合成视频中的合成语音和处理后视频帧序列同步。
用于生成信息方法装置

[发明专利]一种语音合成方法及语音合成模型的训练方法-CN202110925242.1在审
发明人：高占杰;李文杰 -专利权人：北京百度网讯科技有限公司
申请日： 2021-08-12 - 公布日： 2021-12-03 - 主分类号： G10L13/047 文献下载
摘要：本公开提供了一种语音合成方法及语音合成模型的训练方法，涉及人工智能技术领域，具体涉及深度学习、语音技术等领域。具体实现方案为：获取待合成文本和至少两个待合成语音；获取至少两个待合成语音中的第一待合成语音的音色隐向量，以及第二待合成语音的风格隐向量；获取所述待合成文本的文本隐向量；将所述音色隐向量、所述风格隐向量和所述文本隐向量进行拼接，并基于拼接后的隐向量，生成所述待合成文本的目标合成语音。由此，本公开能够针对同一个待合成文本，结合音色隐向量和风格隐向量的多种不同的组合，从而生成多种不同的目标合成语音，实现了风格的迁移，使每一个音色能具备多种风格，提高了语音合成过程中的效率及可靠性。
一种语音合成方法模型训练

[发明专利]语音合成装置、方法、电子设备和存储介质-CN202110634092.9有效
发明人：智鹏鹏;陈昌滨;杨嵩 -专利权人：北京世纪好未来教育科技有限公司
申请日： 2021-06-08 - 公布日： 2022-02-11 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种语音合成装置、方法、电子设备和计算机存储介质，所述语音合成装置包括语音合成处理模块和语音增强模块，所述语音合成处理模块的输出与所述语音增强模块的输入相连；其中，所述语音合成处理模块包括：利用本申请的实施例能够得到携带风格韵律的清晰的合成语音。
语音合成装置方法电子设备存储介质

[发明专利]语音合成方法、装置、计算机设备、存储介质和产品-CN202111302064.3在审
发明人：林诗伦;蒙力;苏文超;李新辉;卢鲤 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-11-04 - 公布日： 2022-04-12 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种语音合成方法、装置、计算机设备、存储介质和产品，通过获取待合成语音的文本，以及确定所要合成的语音类型；将语音类型对应的参考音频特征信息与文本中的文本单元进行融合处理，得到文本语音特征信息；根据语音类型确定目标时长预测网络；根据目标时长预测网络和文本语音特征信息预测文本单元对应的音频时长信息；根据音频时长信息对文本语音特征信息进行时长匹配处理，得到匹配后文本语音特征信息；根据匹配后文本语音特征信息进行语音合成处理，得到目标语音。该方案可以提取准确的文本语音特征信息，且根据语音类型采用对应的时长预测网络，使得合成的目标语音保留语音类型的音色和韵律等信息，提高语音合成效果。
语音合成方法装置计算机设备存储介质产品

[发明专利]基于人工智能的语音合成方法、装置、设备及存储介质-CN202111138984.6在审
发明人：张旭龙;王健宗 -专利权人：平安科技（深圳）有限公司
申请日： 2021-09-27 - 公布日： 2021-12-31 - 主分类号： G10L13/033 文献下载
摘要：本申请涉及人工智能中的语音合成领域，提供了一种语音合成方法，包括：获取移动终端发送的语音数据，其中，所述语音数据为由所述移动终端的用户定制的目标对象的语音数据；根据所述语音数据生成语音样本数据集，获取用于将道路导航信息转化为语音数据的语音合成模型；根据所述语音样本数据集对所述语音合成模型进行迭代训练，得到用于合成与所述目标对象具有相同音色的语音数据的目标语音合成模型；将目标语音合成模型发送给移动终端。本申请实现了地图导航的语音多样化和个性化，使得用户可以定制化导航的播报声音，极大地提高了用户体验。本申请还涉及区块链技术，上述语音样本数据集可存储在区块链中。
基于人工智能语音合成方法装置设备存储介质

[发明专利]混合型语音合成系统-CN200910030596.9无效
发明人：韩松 -专利权人：韩松
申请日： 2009-04-24 - 公布日： 2010-10-27 - 主分类号： G10L13/02 文献下载
摘要：针对现有计算机语音合成系统，计算机发音语音不连续，输出的语音不流畅、不自然的问题，本发明提出一种混合型语音合成系统，包括语音库、语音合成引擎，所述语音库为混合型语音库，包括综合录入的真人发音和计算机处理的非真人发音，其语音库中词语与句子为真人发音，单个字词为非真人发音。语音合成引擎通过对文本中字、词、句的判断，检索调用语音库中已经录制好的真人发音和计算机处理的非真人发音，与传统的文字到语音的自动合成技术对比，本发明合成语音质量高，语音连续，输出的语音流畅、自然，特别适合无线平台的语音合成
混合语音合成系统

首页
«上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
下一页»
尾页
共 100000 条