专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果47个,建议您升级VIP下载更多相关专利
  • [发明专利]一种端到端的口音转换方法-CN202010239586.2有效
  • 刘颂湘;王迪松;曹悦雯;孙立发;吴锡欣;康世胤;吴志勇;刘循英;蒙美玲 - 深圳市达旦数生科技有限公司
  • 2020-03-30 - 2023-10-27 - G10L21/013
  • 本发明公开了一种端到端的口音转换方法,将非地道口音转换为地道口音,属于语音处理技术领域,也可用于将发音障碍的患者的语音转换为标准语音,包括实现口音转换方法的口音转换系统,口音转换系统包括语音识别模块、说话人编码器、语音合成模块、神经网络声码器,语音识别模块用于将输入的非地道口音的声学特征调整为地道口音的信号参数,信号参数仅与非地道口音的说话内容相关;非地道口音的信号参数和说话人向量输入至语音合成模块,经语音合成模块处理过的语音最后通过神经网络声码器即可合成特定说话人的地道口音;有益效果是:在转换过程中无需地道口音参考音频的任何指导,即能够将非地道口音转换为地道口音,并且保持说话人的原本音色。
  • 一种端到端口音转换方法
  • [发明专利]语音合成方法、系统、电子设备及存储介质-CN202310072854.X有效
  • 陈杰;康世胤;吴志勇 - 深圳元象信息科技有限公司;清华大学深圳国际研究生院
  • 2023-02-07 - 2023-06-02 - G10L13/04
  • 本申请涉及语音合成技术领域,尤其涉及一种语音合成方法、系统、电子设备及存储介质。该语音合成方法基于预训练的语音合成模型实现,语音合成模型包括文本编码器模块、时长预测模块、解码器模块,方法包括:获取音素序列,并输入至语音合成模型;通过文本编码器模块将音素序列转换成均值序列,并输入至时长预测模块;通过时长预测模块将均值序列扩展复制,得到拓展后的均值序列;通过解码器模块将拓展后的均值序列去噪并转换为梅尔谱,以输出合成后的语音。本申请的语音合成方法,可以将语音转换成均值序列并去噪,经过去噪操作后,提高了语音合成速度,加快了解码器的运算速度,使得基于去噪扩散概率模型的语音合成模型能够应用在实际场景中。
  • 语音合成方法系统电子设备存储介质
  • [发明专利]一种视频生成方法、存储介质及设备-CN202110474530.X有效
  • 林哲;陀得意;韩欣彤;康世胤 - 广州虎牙科技有限公司
  • 2021-04-29 - 2023-04-25 - G06T13/20
  • 本说明书提供一种视频生成方法、存储介质及设备,该方法中,对初始图片中的初始人脸特征进行解耦合,得到初始人脸形状特征和初始头部姿态特征,并对音频数据进行切分,并得到切分后的音频片段对应的目标表情特征,再利用初始人脸形状特征、初始头部姿态特征和目标表情特征进行组合,构建出音频片段对应的目标图片,最后利用所有音频片段对应的目标图片合并得到目标视频。这样,实现了根据初始图片和音频数据来生成视频,降低了基于单幅人脸图像来制作视频的制作成本,且提高了真实程度。
  • 一种视频生成方法存储介质设备
  • [发明专利]一种情感识别模型的训练方法、情感识别方法及装置-CN202110801470.8有效
  • 曾志平;徐易楠;康世胤 - 广州虎牙科技有限公司
  • 2021-07-15 - 2023-03-21 - G10L25/63
  • 本申请公开了一种情感识别模型的训练方法、情感识别方法及装置,该训练方法包括:获取针对直播场景的音频样本数据集合,所述音频样本数据集合中的各音频样本数据具有预先标注的情感标签以及行为标签;提取各音频样本数据中的音频特征,并对所述音频特征进行数据增强,获得音频特征集合;将所述音频特征集合输入至初始识别模型,采用预设损失函数进行训练,生成情感识别模型,其中,所述初始识别模型是包括隐藏层以及NetVLAD层的深度神经网络模型,丰富了输入至初始识别模型进行训练的特征数据的数量,从而提高了情感识别模型的识别准确率。
  • 一种情感识别模型训练方法装置
  • [发明专利]一种基于人工智能的合成说话表情的方法和相关装置-CN201910745062.8有效
  • 李广之;陀得意;康世胤 - 腾讯科技(深圳)有限公司
  • 2018-11-14 - 2022-12-16 - G06N3/00
  • 本申请实施例公开了一种基于人工智能的合成说话表情的方法和相关装置,至少涉及人工智能中的多种技术,针对终端发送的文本内容,确定文本内容对应的文本特征和所述文本特征所标识发音元素的时长,通过表情模型,获得所述文本特征、所标识发音元素的时长对应的目标表情特征;并向所述终端返回所述目标表情特征。该表情模型可以对该文本特征中具有不同时长的同一发音元素确定出不同的子表情特征,增加了说话表情的变化样式,根据表情模型所确定目标表情特征生成的说话表情与说话人的表情搭配,由于对于同一个发音元素说话表情具有不同的变化样式,从而改善了说话表情变化的过度不自然的情况,提高了用户的沉浸感。
  • 一种基于人工智能合成说话表情方法相关装置
  • [发明专利]一种模型训练方法、合成说话表情的方法和相关装置-CN201811354206.9有效
  • 李廣之;陀得意;康世胤 - 腾讯科技(深圳)有限公司
  • 2018-11-14 - 2022-10-21 - G06N3/00
  • 本申请实施例公开了一种用于合成说话表情的模型训练方法,根据包含了说话人面部动作表情和对应语音的视频得到表情特征、声学特征和文本特征。由于声学特征和文本特征均是根据同一视频得到的,故根据声学特征确定出文本特征所标识发音元素的时间区间和时长。根据文本特征所标识发音元素的时间区间和时长,以及表情特征确定第一对应关系,根据所述第一对应关系训练表情模型。该表情模型可以对该文本特征中具有不同时长的同一发音元素确定出不同的子表情特征,增加了说话表情的变化样式,根据表情模型所确定目标表情特征生成的说话表情,由于对于同一个发音元素说话表情具有不同的变化样式,从而一定程度上改善了说话表情变化的过度不自然的情况。
  • 一种模型训练方法合成说话表情相关装置

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top