专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果653652个,建议您升级VIP下载更多相关专利
  • [发明专利]语音合成设备及方法-CN200810084717.3无效
  • 奥谷泰夫;相泽道雄;深田俊明 - 佳能株式会社
  • 2008-03-14 - 2008-09-17 - G10L13/02
  • 本发明提供了一种语音合成设备及方法。语言处理单元通过对从文本保存单元提供的文本进行语言分析,来识别单词。合成选择单元针对从语言分析结果提取的所关注的单词,选择由基于规则合成单元进行的语音合成处理或者由基于预先记录语音合成单元进行的语音合成处理。所选择的基于规则合成单元或基于预先记录语音合成单元对所关注的单词执行语音合成处理。
  • 语音合成设备方法
  • [发明专利]语音合成模型的训练方法、语音合成方法及相关设备-CN202211128018.0在审
  • 刘鹏飞;蒋宁;吴海英;刘敏 - 马上消费金融股份有限公司
  • 2022-09-16 - 2023-05-16 - G10L13/02
  • 本申请提供了一种语音合成模型的训练方法、语音合成方法及相关设备,通过获取训练数据,训练数据包括目标语音和目标语音对应的音素序列;对目标语音进行预处理,确定目标梅尔频谱;以及将音素序列输入语音合成模型中进行合成处理,得到预测梅尔频谱;按照目标语音的声音规则分别对目标梅尔频谱和预测梅尔频谱进行切分和组对处理,得到N个频谱片段对;利用对抗判别模型中的N个判别器,分别基于N个频谱片段对,对语音合成模型进行对抗生成训练,训练完成的语音合成模型用于将待合成文本合成合成语音。达到了合成语音吐字清晰、发音更自然、节奏和韵律感更好且更接近真人声音的技术效果。
  • 语音合成模型训练方法相关设备
  • [发明专利]语音合成方法、系统、电子设备及存储介质-CN202310072854.X有效
  • 陈杰;康世胤;吴志勇 - 深圳元象信息科技有限公司;清华大学深圳国际研究生院
  • 2023-02-07 - 2023-06-02 - G10L13/04
  • 本申请涉及语音合成技术领域,尤其涉及一种语音合成方法、系统、电子设备及存储介质。该语音合成方法基于预训练的语音合成模型实现,语音合成模型包括文本编码器模块、时长预测模块、解码器模块,方法包括:获取音素序列,并输入至语音合成模型;通过文本编码器模块将音素序列转换成均值序列,并输入至时长预测模块;通过时长预测模块将均值序列扩展复制,得到拓展后的均值序列;通过解码器模块将拓展后的均值序列去噪并转换为梅尔谱,以输出合成后的语音。本申请的语音合成方法,可以将语音转换成均值序列并去噪,经过去噪操作后,提高了语音合成速度,加快了解码器的运算速度,使得基于去噪扩散概率模型的语音合成模型能够应用在实际场景中。
  • 语音合成方法系统电子设备存储介质
  • [发明专利]语音翻译处理方法及装置-CN201711107221.9在审
  • 刘俊华;魏思;胡国平;柳林;王建社;方昕;李永超;孟廷 - 科大讯飞股份有限公司
  • 2017-11-10 - 2018-04-13 - G10L15/26
  • 本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括在对第一合成语音信号进行播报的过程中,若接收到包含有部分第一合成语音信号的混合语音信号,则停止播报第一合成语音信号。从混合语音信号过滤掉部分第一合成语音信号,得到当前轮次待翻译的语音信号,并作为目标语音信号。基于目标语音信号,获取第二合成语音信号,并播报第二合成语音信号。本发明实施例在接收到包含有部分第一合成语音信号的混合语音信号时,停止播报第一合成语音信号,并播报第二合成语音信号。
  • 语音翻译处理方法装置
  • [发明专利]一种语音处理方法及装置-CN202110813868.3在审
  • 孙晓辉;王宝勋 - 腾讯科技(深圳)有限公司
  • 2021-07-19 - 2021-12-21 - G10L13/02
  • 本申请实施例提供了一种语音处理方法及装置,其中方法包括:接收用户终端发送的目标文本;调用语音合成模型对所述目标文本进行处理,生成所述目标文本对应的合成语音数据,其中,所述语音合成模型是根据用户的语音数据、所述语音数据的文本特征信息和所述用户的身份特征信息训练得到的;向所述用户终端发送所述目标文本对应的合成语音数据,可以简化语音合成时用户的操作,并保证良好的语音合成效果。
  • 一种语音处理方法装置
  • [发明专利]用于文本到语音合成的用户接口适应的方法和系统-CN202080101685.2在审
  • A.纳拉雅南 - 谷歌有限责任公司
  • 2020-06-03 - 2023-01-31 - G10L13/033
  • 公开了一种根据用户接口输入使语音合成适应的方法和系统。在采用文本到语音(TTS)系统合成来自文本片段的语音并且同时在显示设备中显示该文本片段时,该系统可以接收跟踪操作输入,该跟踪操作输入跟踪经历合成的文本的一部分并且标识该文本的语境部分,对于该文本的语境部分,先前合成语音已经以标准的语速合成。跟踪信息可以用于将该部分的TTS合成的语速从标准语速调整为适应的语速,并且该部分的合成语音语音特性可以通过将语境部分的先前合成语音的适应的语速和合成语音特性两者应用于该部分的TTS合成处理来适应。可以以适应的语速和适应的语音特性输出标识的部分的合成语音
  • 用于文本语音合成用户接口适应方法系统
  • [发明专利]用于生成信息的方法和装置-CN201910806660.1有效
  • 姚锟;洪智滨;韩钧宇;刘经拓 - 北京百度网讯科技有限公司
  • 2019-08-29 - 2022-02-25 - G10L13/02
  • 该方法的一具体实施方式包括:获取待处理视频中原始音频对应的原始音素序列,以及待处理视频的原始视频帧序列;根据原始音频对应的文本生成合成语音,并确定合成语音对应的合成音素序列;基于合成音素序列对应的合成语音帧标识序列,对原始音素序列对应的原始语音帧标识序列进行处理,得到处理后语音帧标识序列,其中,处理后语音帧标识序列的长度与合成音素序列对应的合成语音帧标识序列长度相等;根据处理后语音帧标识序列,从原始视频帧序列中提取出视频帧生成处理后视频帧序列;使用合成语音和处理后视频帧序列,生成合成视频。该实施方式保证了合成视频中的合成语音和处理后视频帧序列同步。
  • 用于生成信息方法装置
  • [发明专利]一种语音合成方法及语音合成模型的训练方法-CN202110925242.1在审
  • 高占杰;李文杰 - 北京百度网讯科技有限公司
  • 2021-08-12 - 2021-12-03 - G10L13/047
  • 本公开提供了一种语音合成方法及语音合成模型的训练方法,涉及人工智能技术领域,具体涉及深度学习、语音技术等领域。具体实现方案为:获取待合成文本和至少两个待合成语音;获取至少两个待合成语音中的第一待合成语音的音色隐向量,以及第二待合成语音的风格隐向量;获取所述待合成文本的文本隐向量;将所述音色隐向量、所述风格隐向量和所述文本隐向量进行拼接,并基于拼接后的隐向量,生成所述待合成文本的目标合成语音。由此,本公开能够针对同一个待合成文本,结合音色隐向量和风格隐向量的多种不同的组合,从而生成多种不同的目标合成语音,实现了风格的迁移,使每一个音色能具备多种风格,提高了语音合成过程中的效率及可靠性。
  • 一种语音合成方法模型训练
  • [发明专利]语音合成方法、装置、计算机设备、存储介质和产品-CN202111302064.3在审
  • 林诗伦;蒙力;苏文超;李新辉;卢鲤 - 腾讯科技(深圳)有限公司
  • 2021-11-04 - 2022-04-12 - G10L13/02
  • 本申请实施例公开了一种语音合成方法、装置、计算机设备、存储介质和产品,通过获取待合成语音的文本,以及确定所要合成语音类型;将语音类型对应的参考音频特征信息与文本中的文本单元进行融合处理,得到文本语音特征信息;根据语音类型确定目标时长预测网络;根据目标时长预测网络和文本语音特征信息预测文本单元对应的音频时长信息;根据音频时长信息对文本语音特征信息进行时长匹配处理,得到匹配后文本语音特征信息;根据匹配后文本语音特征信息进行语音合成处理,得到目标语音。该方案可以提取准确的文本语音特征信息,且根据语音类型采用对应的时长预测网络,使得合成的目标语音保留语音类型的音色和韵律等信息,提高语音合成效果。
  • 语音合成方法装置计算机设备存储介质产品
  • [发明专利]基于人工智能的语音合成方法、装置、设备及存储介质-CN202111138984.6在审
  • 张旭龙;王健宗 - 平安科技(深圳)有限公司
  • 2021-09-27 - 2021-12-31 - G10L13/033
  • 本申请涉及人工智能中的语音合成领域,提供了一种语音合成方法,包括:获取移动终端发送的语音数据,其中,所述语音数据为由所述移动终端的用户定制的目标对象的语音数据;根据所述语音数据生成语音样本数据集,获取用于将道路导航信息转化为语音数据的语音合成模型;根据所述语音样本数据集对所述语音合成模型进行迭代训练,得到用于合成与所述目标对象具有相同音色的语音数据的目标语音合成模型;将目标语音合成模型发送给移动终端。本申请实现了地图导航的语音多样化和个性化,使得用户可以定制化导航的播报声音,极大地提高了用户体验。本申请还涉及区块链技术,上述语音样本数据集可存储在区块链中。
  • 基于人工智能语音合成方法装置设备存储介质
  • [发明专利]混合型语音合成系统-CN200910030596.9无效
  • 韩松 - 韩松
  • 2009-04-24 - 2010-10-27 - G10L13/02
  • 针对现有计算机语音合成系统,计算机发音语音不连续,输出的语音不流畅、不自然的问题,本发明提出一种混合型语音合成系统,包括语音库、语音合成引擎,所述语音库为混合型语音库,包括综合录入的真人发音和计算机处理的非真人发音,其语音库中词语与句子为真人发音,单个字词为非真人发音。语音合成引擎通过对文本中字、词、句的判断,检索调用语音库中已经录制好的真人发音和计算机处理的非真人发音,与传统的文字到语音的自动合成技术对比,本发明合成语音质量高,语音连续,输出的语音流畅、自然,特别适合无线平台的语音合成
  • 混合语音合成系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top