|
钻瓜专利网为您找到相关结果 1035524个,建议您 升级VIP下载更多相关专利
- [发明专利]一种配音方法和相关装置-CN202310645662.3在审
-
杨智涵;李旭;刘山松;单瀛;吴志勇;贾珈
-
腾讯科技(深圳)有限公司
-
2023-06-01
-
2023-10-27
-
H04N21/439
- 本申请公开了一种配音方法和相关装置,获取待配音视频中包括待配音的目标对象的视频帧序列,并对目标对象进行三维重建,得到每个目标视频帧分别对应的三维目标对象。基于从每个目标视频帧分别对应的三维目标对象中获取的视觉风格特征,可以生成视频帧序列对应的视觉风格序列,其中,视觉风格序列中的视觉风格特征会基于对应的目标视频帧在待配音视频中的顺序进行排列。根据视觉风格序列和用于配音的音素序列,能够确定音频特征序列,并能够通过该音频特征序列对待配音视频进行配音来得到已配音视频。通过三维目标对象能够得到在视觉角度体现待配音视频的表现风格的视觉风格序列,进而能够得到实现视觉和听觉上表现风格的相统一的已配音视频。
- 一种配音方法相关装置
- [发明专利]视觉问答的方法、装置、设备及介质-CN202210688112.5在审
-
王俊
-
平安科技(深圳)有限公司
-
2022-06-17
-
2022-09-02
-
G06F16/332
- 本发明涉及人工智能技术领域,公开了一种视觉问答的方法、装置、设备及介质,包括:获取视觉问答任务对应的目标问句和目标图像;对目标问句进行特征提取得到目标问句对应的句向量和词向量,和,对目标图像进行特征提取得到目标图像对应的图像向量和图像块向量;将句向量和图像块向量同时输入视觉问答模型的多模态交互学习部分,得到目标问句对应的问句交互向量;和,将图像向量和词向量同时输入视觉问答模型的多模态交互学习部分,得到目标图像对应的图像交互向量;通过视觉问答模型的分类单元,根据图像交互向量和问句交互向量,得到视觉问答任务的答案。提升视觉问答任务的答案的准确率。
- 视觉问答方法装置设备介质
|