专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果26个,建议您升级VIP下载更多相关专利
  • [发明专利]一种语音识别的方法和装置-CN202310318553.0在审
  • 冯明超;黎陈;王佳;王佳;张政臣;陈蒙;何晓冬 - 京东科技信息技术有限公司
  • 2023-03-28 - 2023-07-21 - G10L15/26
  • 本发明公开了一种语音识别的方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:根据第一文本数据对应的多个语音数据,通过语音识别模型生成多个第二文本数据;对于每一第二文本数据,在第二文本数据与第一文本数据不一致的情况下,通过第一文本数据和第二文本数据生成短语数据对;对所有短语数据对进行数据挖掘处理,生成易错短语对,并利用易错短语对优化语音识别模型;使用优化后的语音识别模型进行语音识别。该实施方式能够通过挖掘异常数据得到高质量的训练数据,降低优化模型所耗费的成本,提高优化模型的效率,并且在使用时可以提高语音识别模型的准确率和效率,从而优化人机语言交互系统的效果,提高用户的使用体验。
  • 一种语音识别方法装置
  • [发明专利]声码器的构建方法、语音处理方法及相关设备-CN202211573321.1在审
  • 吴雨璇;宋伟;张政臣;吴友政 - 京东科技信息技术有限公司
  • 2022-12-08 - 2023-06-23 - G10L13/04
  • 本发明提供一种声码器的构建方法、语音处理方法及相关设备,包括利用样本集对生成器进行训练,确定训练完成的生成器;将生成器和与生成器训练得到的判别器组成作为声码器;训练过程为分别对第一特征向量对应的第一输出音频,及第二特征向量对应的第二输出音频进行处理,确定第一时域损失、第一频域损失、第二时域损失和第二频域损失;对第二特征向量对应的第三输出音频进行处理,确定第三频域损失;进而计算生成器的总损失;基于总损失训练生成器的网络。在本方案中,在对生成器进行训练时,通过计算多分辨率的时域损失和频域损失,进而计算生成器的总损失;通过上述方式能够加快声码器训练的收敛速度,以提高声码器语言处理质量。
  • 声码构建方法语音处理相关设备
  • [发明专利]一种声码器的训练方法、音频合成的方法和装置-CN202310186600.0在审
  • 吴雨璇;宋伟;张政臣;吴友政;何晓冬 - 京东科技信息技术有限公司
  • 2023-03-01 - 2023-05-16 - G10L19/16
  • 本发明公开了一种声码器的训练方法、音频合成的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将训练集样本输入到生成器中,训练集样本包括多个音频特征样本和与每个音频特征样本对应的真实音频;在生成器中,对音频特征样本进行压缩处理,获得压缩后的音频特征样本;对压缩后的音频特征样本进行卷积处理和解压缩处理,获得与音频特征样本对应的生成音频;将与音频特征样本对应的生成音频和真实音频输入到判别器中,基于生成音频和判别音频构造损失函数,基于损失函数训练得到声码器。该实施方式能够增大声码器的感受野,提高了音频质量,并减少了声码器的计算量,提高了声码器的推理速度,从而提升音频的生成效率。
  • 一种声码训练方法音频合成装置
  • [发明专利]语音合成模型的训练方法、语音合成方法及装置-CN202310138459.7在审
  • 宋伟;张雅洁;岳杨皓;张政臣;吴友政 - 京东科技信息技术有限公司
  • 2023-02-14 - 2023-05-02 - G10L13/02
  • 本申请提出一种语音合成模型的训练方法、语音合成方法及装置,涉及深度学习、语音技术等人工智能技术领域,语音合成模型的训练方法包括:获取多个第一样本音频的样本声学特征、对应的第一音素序列以及对应的说话人标识,至少一个同一说话人标识对应的第一样本音频具有单一风格特征;将第一样本音频对应的第一音素序列以及对应的说话人标识输入语音合成模型,得到第一样本音频的预测声学特征;基于各第一样本音频的预测声学特征和样本声学特征对语音合成模型进行训练。实现了对音频中的音色特征和风格特征的解耦,从而可以利用多个说话人各自对应的具有单一风格特征的音频来训练语音合成模型,进而减少了语音合成模型的训练成本。
  • 语音合成模型训练方法装置
  • [发明专利]一种语音合成方法及装置-CN202310148873.6在审
  • 张雅洁;宋伟;岳杨皓;张政臣;吴友政 - 京东科技信息技术有限公司
  • 2023-02-14 - 2023-05-02 - G10L13/08
  • 本公开提供一种语音合成方法及装置,其中,该方法包括:基于预训练的跨句文本编码器,确定待处理的文本数据中目标句子对应的上下文语义表征;基于预训练的跨句声学编码器,确定历史句子对应语音波形的声学表征;其中,所述历史句子为文本数据中待转换目标句子之前的句子;确定所述目标句子对应的音素嵌入序列,将音素嵌入序列输入到语音合成模型,得到所述语音合成模型输出的音素隐状态序列;基于所述音素隐状态序列、所述声学表征以及所述上下文语义表征,确定目标句子对应的语音波形。本公开提供的语音合成方法,能够提高语音合成韵律的连续性和丰富性,及对未见领域的泛化能力,从而提升了合成语音的自然度和表现力。
  • 一种语音合成方法装置
  • [发明专利]一种语音合成方法及装置、存储介质及电子设备-CN202211465063.5在审
  • 岳杨皓;宋伟;张政臣;吴友政 - 京东科技信息技术有限公司
  • 2022-11-22 - 2023-03-24 - G10L13/10
  • 本发明提供一种语音合成方法及装置、存储介质及电子设备,该方法包括:获取待合成文本的音素信息,该音素信息中包含待合成文本中每个文本单元的音素,以及包含该待合成文本中需要调整发音的文本单元的位置信息,文本单元为单词或单字;获取配音人员的身份信息,基于所述身份信息确定音色信息;调用预先训练完成的声学模型对音素信息和音色信息进行处理,得到待合成文本中需要调整发音的文本单元的声学特征;应用声学特征合成待合成文本的拟人化音频。应用本发明可以对待合成文本中的文本单元的发音进行调整,以使得音频中包含丰富的语气,合成的音频更加的拟人化,为用户提供更加优质的服务,提高用户的使用体验。
  • 一种语音合成方法装置存储介质电子设备
  • [发明专利]语音识别模型的训练方法、装置及系统-CN202110772680.9在审
  • 张政臣;资礼波;李萧萧 - 京东科技控股股份有限公司
  • 2021-07-08 - 2023-01-13 - G10L15/06
  • 本发明实施例涉及一种语音识别模型的训练方法,该方法包括:客户端获取目标语言的文本内容,采集用户录入的与文本内容对应的目标语言语音样本,存储该语音样本,并从该语音样本中提取语音特征,响应于用户触发的训练语音识别模型的指令,从服务器获取语音识别模型的第一参数,服务器响应于客户端的请求将第一参数发送给客户端,客户端利用该第一参数对语音识别模型进行初始化,以语音特征作为输入,以文本序列作为输出,对该语音识别模型进行训练,进行参数更新得到第二参数,完成训练后,将上述第二参数发送给服务器,服务器在接收到第二参数后进行整合并将整合结果作为下一轮客户端请求调用的第一参数。
  • 语音识别模型训练方法装置系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top