专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果29个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音合成方法、装置、电子设备及存储介质-CN202210513627.1有效
  • 乔宏利;王洪斌;刘敏 - 马上消费金融股份有限公司
  • 2022-05-12 - 2023-09-12 - G10L13/02
  • 本申请提供一种语音合成方法、装置、电子设备及存储介质。方法包括:对语音待合成的目标文本进行文本预处理,得到目标文本的发音序列,发音序列包括目标文本对应的韵律标记;基于目标文本对应的文本类停顿信息和发音序列中韵律标记对应的韵律类停顿信息,对发音序列分别进行句级切分和句内切分,得到句级子发音序列集合和句内子发音序列集合;基于预先设置的序列长度要求,从句级子发音序列集合和句内子发音序列集合中,确定用于语音合成的多个子发音序列,序列长度要求是基于文本转语音模型的输入数据要求确定的;将各子发音序列输入至文本转语音模型进行语音合成,得到对应的语音数据。本申请能够改善发音序列对于文本转语音模型的兼容性。
  • 一种语音合成方法装置电子设备存储介质
  • [发明专利]一种语音的转换方法、装置及设备-CN202210257446.7有效
  • 乔宏利;王洪斌;蒋宁;吴海英;刘敏 - 马上消费金融股份有限公司
  • 2022-03-16 - 2023-08-01 - G10L13/02
  • 本说明书实施例公开了一种语音的转换方法、装置及设备,该方法包括:获取待处理的第一文本信息,对第一文本信息中包含的满足预设条件的词语进行词语转译,以将第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,预设条件至少由词语对应的音素的发音基频和/或由预设词语确定,基于第二文本信息,确定将第二文本信息转换为语音数据的转换参数,该转换参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种,基于该转换参数将第二文本信息转换为语音数据。通过本说明书实施例,可以使得最终转换后的语音数据更易于用户听见和听清,以及对语音内容的理解。
  • 一种语音转换方法装置设备
  • [发明专利]语音合成模型的训练方法、语音合成方法及相关设备-CN202211255577.8在审
  • 乔宏利;夏粉;蒋宁;吴海英;刘敏 - 马上消费金融股份有限公司
  • 2022-10-13 - 2023-05-16 - G10L13/02
  • 本申请公开了一种语音合成模型的训练方法、语音合成方法及相关设备,所述训练方法包括:获取样本文本对应的样本语音数据及音素序列以及音素序列对应的样本韵律序列,语音合成模型包括编码模块、韵律预测模块、声学特征预测模块以及语音合成模块;通过编码模块对音素序列进行编码得到音素表示序列;通过韵律预测模块基于音素表示序列预测音素序列对应的预测韵律序列,以及通过声学特征预测模块基于音素表示序列预测音素序列对应的预测声学特征序列;通过语音合成模块基于音素表示序列、预测韵律序列以及预测声学特征序列进行语音合成处理得到合成语音数据;基于样本语音数据、合成语音数据、样本韵律序列以及预测韵律序列对语音合成模型进行训练。
  • 语音合成模型训练方法相关设备
  • [发明专利]语音识别方法、装置、计算机设备及存储介质-CN202211021458.6在审
  • 乔宏利;蒋宁;吴海英;刘敏 - 马上消费金融股份有限公司
  • 2022-08-24 - 2023-05-16 - G10L15/04
  • 本申请提供一种语音识别方法、装置、计算机设备及存储介质,应用于语音识别领域,该方法包括:获取待识别的语音数据,语音数据包括按序的多个音频时间片段;将语音数据输入语音识别模型进行语音识别处理,得到语音识别结果,语音识别结果用于表征语音数据中的每个音频时间片段对应的拼音音节的分类结果;根据拼音音节掩码表和语音识别结果中每个音频时间片段对应的拼音音节的分类结果,生成语音数据对应的拼音序列;对拼音序列进行转译,生成语音数据对应的文字识别结果。通过该方式,可以提高语音数据的识别和解码的速度更快,进而提高了语音识别速度。
  • 语音识别方法装置计算机设备存储介质
  • [发明专利]语音合成方法及装置、语音合成模型的训练方法及装置-CN202211201911.1在审
  • 乔宏利;蒋宁;吴海英;刘敏 - 马上消费金融股份有限公司
  • 2022-09-29 - 2023-05-16 - G10L13/02
  • 本申请提供了一种语音合成方法及装置、语音合成模型的训练方法及装置,该方法包括:确定语音文本中待重读词语的第一位置信息,并对语音文本进行韵律预测,得到至少一个第一韵律预测结果,第一韵律预测结果包括音调预测结果、音量预测结果以及发音时长预测结果中的至少一种;对至少一个第一韵律预测结果中与第一位置信息对应语音文本的韵律预测结果进行重读调整,以得到至少一个第二韵律预测结果,重读调整包括调高音调、增大音量以及降低发音时长中的至少一种;根据至少一个第二韵律预测结果,生成语音合成结果。本申请能够实现合成语音(即语音合成结果)在指定字、词位置重读,提高了合成语音的表现力,使得合成语音在对话应用中更加自然。
  • 语音合成方法装置模型训练
  • [发明专利]韵律标注方法、声学模型训练方法、语音合成方法及装置-CN202211435105.0在审
  • 乔宏利;刘敏;夏粉;蒋宁;吴海英 - 马上消费金融股份有限公司
  • 2022-11-16 - 2023-05-16 - G10L13/02
  • 本公开提供了一种韵律标注方法、声学模型训练方法、语音合成方法及装置,涉及语音合成技术领域。该方法包括根据文本数据中的多个音素和文本数据对应的第一音频数据之间的对应关系,将第一音频数据划分为多个第二音频数据;对多个第二音频数据的韵律特征进行聚类,得到多个聚类簇;基于多个第二音频数据的韵律特征与多个聚类簇进行确定韵律标记的处理,得到多个音素各自的韵律标记。本公开实施例通过对音素的帧级别韵律特征进行聚类,得到韵律标记,通过这种音素级别的韵律标记来标注用于训练声学模型的训练文本,相较于传统的词句级别的韵律标注方法,能更好地辅助声学模型学习到发音人的情绪,语音风格等特点,从而合成高仿真程度的语音音频。
  • 韵律标注方法声学模型训练语音合成装置
  • [发明专利]声学模型训练方法、语音合成方法及相关装置-CN202211392087.2在审
  • 乔宏利;刘敏;蒋宁;吴海英;夏粉 - 马上消费金融股份有限公司
  • 2022-11-08 - 2023-05-16 - G10L13/02
  • 本公开提供了一种声学模型训练方法、语音合成方法及其相关装置,涉及语音合成技术领域。该方法包括基于第一标注文本,对第一韵律模型进行训练,第一韵律模型用于预测文本中的韵律特征;将训练后的第一韵律模型嵌入第一声学模型,得到第二声学模型,第一声学模型和第二声学模型均用于预测文本中的语音特征;基于第二标注文本以及与第二标注文本对应的音频数据,对第二声学模型进行训练;第一标注文本的数量大于第二标注文本的数量,且第一标注文本的获取成本小于第二标注文本的获取成本。本公开提供的方法在保证声音模型训练效果的同时,降低了内嵌韵律模型的声学模型训练时对音频数据的需求量,从而大幅降低声学模型整体的训练成本。
  • 声学模型训练方法语音合成相关装置
  • [发明专利]消歧方法、消歧模型的训练方法及装置-CN202111493472.1有效
  • 乔宏利;王洪斌;刘敏 - 马上消费金融股份有限公司
  • 2021-12-08 - 2023-05-05 - G06F40/232
  • 本申请公开一种消歧方法、消歧模型的训练方法及装置。该方法包括:获取目标文本;获取目标文本的编码;对目标文本的编码进行处理,得到多个分类项分别对应的第一概率;基于掩码张量对多个分类项分别对应的第一概率进行掩码处理,得到多个分类项分别对应的第二概率;多个分类项中目标对象正确读音对应的第二概率大于目标对象正确读音对应的第一概率,多个分类项中目标对象错误读音对应的第二概率小于目标对象错误读音对应的第一概率。通过上述掩码操作,能排除多个分类项中针对目标对象的明显错误读音,缩小目标对象的预测范围,进而提高预测准确率。
  • 方法模型训练装置
  • [发明专利]文本处理方法、装置、电子设备及存储介质-CN202110417592.7有效
  • 乔宏利;王洪斌;蒋宁;吴海英;何朋 - 马上消费金融股份有限公司
  • 2021-04-19 - 2022-03-25 - G06F40/126
  • 本发明公开了一种文本处理方法、装置、电子设备及存储介质,属于文本转语音技术领域。该方法包括:获取待处理文本,所述待处理文本包含有第一单位符号;确定所述第一单位符号的第一位置信息,所述第一位置信息用于指示所述第一单位符号在所述待处理文本中的位置;确定所述待处理文本中各个字符对应的编码,得到第一编码序列;基于所述第一编码序列、所述第一位置信息和预先训练的拼音预测模型,确定所述第一单位符号对应的拼音。这样,可以基于预先训练的拼音预测模型,直接得到待处理文本中第一单位符号的拼音,无需人为干涉,从而提高了获取第一单位符号拼音的效率,使得文本处理的效率也有所提升。
  • 文本处理方法装置电子设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top