专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果56个,建议您升级VIP下载更多相关专利
  • [发明专利]一种对语音信息的训练方法及装置-CN202011577644.9有效
  • 张旭;殷昊;陈云琳;江明奇;杨喜鹏 - 出门问问(武汉)信息科技有限公司
  • 2020-12-28 - 2023-08-01 - G06V10/44
  • 本发明公开了一种对语音信息的训练方法及装置,本发明实施例首先获取语音信息数据;并针对所述语音信息数据中的任一语音信息:对所述语音信息进行处理,得到梅尔频谱图序列;对所述梅尔频谱图序列进行语义特征提取,得到语义特征信息;对所述语义特征信息进行时序特征提取,得到时序特征信息;之后对多个所述时序特征信息进行模型训练,得到面部关键点模型。由此,通过对语音信息进行语义特征提取的学习,以及时序特征提取的学习,从而提升面部关键点模型的性能,使得面部关键点模型能够准确合成面部关键点序列,进而提高说话人视频的合成效果,从而解决现有技术中模型输出说话人画面出现的抖动问题。
  • 一种语音信息训练方法装置
  • [发明专利]视频生成方法及装置-CN202310121040.0在审
  • 李永源;唐旻杰;李梅;孙瑜博;陈云琳 - 上海墨百意信息科技有限公司
  • 2023-02-14 - 2023-06-27 - G10L25/03
  • 本发明实施例公开了一种视频生成方法及装置,在根据图像文件确定第一人脸特征点和第二人脸特征点并根据音频数据获取至少两个不同说话人的语音数据后,对所述人脸特征点和语音数据进行对应匹配,基于匹配后的至少两个对应的人脸特征点和语音数据,分别生成相应的人脸特征点的偏移序列,进而合成至少两个人脸图像序列,并基于所述人脸图像序列生成双人对话视频。由此,降低了身份信息分离和读取的难度,从而合成双人对话视频,同时使生成的双人对话视频具有生动的姿态表达能力。
  • 视频生成方法装置
  • [发明专利]语音合成模型的训练方法、装置、电子设备及存储介质-CN202211580535.1在审
  • 殷昊;陈云琳;李媛媛 - 上海墨百意信息科技有限公司
  • 2022-12-09 - 2023-05-09 - G10L13/02
  • 本公开提供了一种语音合成模型的训练方法、装置、电子设备及存储介质,所述方法包括:将文本音素样本对应的文本样本特征输入至语音合成模型包括的生成器中,输出文本样本特征对应的多维预测语音子信号;其中,多维预测语音子信号中每一维度的预测语音子信号的子频带均不同;将多维预测语音子信号输入至子频带编码模块中,获得全部维度的预测语音子信号对应的预测语音信号;将预测语音信号输入至判别器中,确认判别器的输出为预测语音信号的预测属性标识;基于文本音素样本对应的全部维度的标注语音子信号、全部维度的预测语音子信号、预测语音信号的预测属性标识和标注语音标识,调整生成器和/或判别器的参数。
  • 语音合成模型训练方法装置电子设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top