专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果47个,建议您升级VIP下载更多相关专利
  • [发明专利]说话头视频合成方法、装置、终端设备及可读存储介质-CN202210611253.7有效
  • 丁万;黄东延;颜霖煌;杨志勇 - 深圳市优必选科技股份有限公司
  • 2022-05-31 - 2023-10-24 - H04N21/81
  • 本申请适用于终端技术领域,尤其涉及说话头视频合成方法、装置、终端设备及计算机可读存储介质。该方法中,终端设备获取目标文本和目标图像后,确定目标文本对应的声学特征和目标图像对应的副语言特征,以根据目标文本对应的声学特征和目标图像对应的副语言特征得到目标文本对应的合成语音。另外,终端设备确定目标文本对应的目标嘴部动作序列,并根据目标嘴部动作序列和目标图像得到目标用户对应的脸部动作视频。最后,终端设备对合成语音和脸部动作视频进行同步处理,得到目标用户对应的说话头视频。即本申请可以结合目标用户对应的副语言特征,得到目标文本对应的合成语音,使得说话头视频中包含符合用户期望的副语言信息,提升用户体验。
  • 话头视频合成方法装置终端设备可读存储介质
  • [发明专利]说话头视频合成方法、装置、电子设备及存储介质-CN202310764110.4在审
  • 丁万;黄东延;杨显杰;郑泽鸿;李鹏辉 - 深圳市优必选科技股份有限公司
  • 2023-06-26 - 2023-10-20 - G10L25/57
  • 本申请公开了一种说话头视频合成方法、说话头视频合成装置、电子设备及存储介质。该方法包括:获取待合成的语音数据及观测数据,所述观测数据为除语音数据之外的通过观测所得的数据;对所述语音数据进行特征提取,得到所述语音数据所对应的语音特征,以及,对所述观测数据进行特征提取,得到所述观测数据所对应的非语音特征;对所述语音特征及第一非语音特征进行时序建模,得到低维表征,其中,所述第一非语音特征为:对时序变化敏感的非语音特征;基于所述低维表征及第二非语音特征进行视频合成,得到说话头视频,其中,所述第二非语音特征为:对时序变化不敏感的非语音特征。通过本申请方案,可以降低说话头视频合成时的复杂度,减少合成耗时。
  • 话头视频合成方法装置电子设备存储介质
  • [发明专利]说话头视频合成方法、装置、终端设备及可读存储介质-CN202210612090.4有效
  • 丁万;黄东延;颜霖煌;杨志勇 - 深圳市优必选科技股份有限公司
  • 2022-05-31 - 2023-09-22 - H04N21/81
  • 本申请适用于终端技术领域,尤其涉及一种说话头视频合成方法、装置、终端设备及计算机可读存储介质。该方法在获取目标文本和目标图像后,确定目标文本对应的目标音素序列;根据目标音素序列,获取目标文本对应的声学特征,并根据声学特征,得到目标文本对应的合成语音;根据目标音素序列,确定目标文本对应的第一目标嘴部动作序列,并根据声学特征,确定目标文本对应的第二目标嘴部动作序列;根据第一目标嘴部动作序列、第二目标嘴部动作序列和目标图像,得到目标用户对应的脸部动作视频;对合成语音和脸部动作视频进行同步处理,得到目标用户对应的说话头视频,以通过文本和文本对应的声学特征来预设嘴部动作,降低嘴部动作预测的复杂度。
  • 话头视频合成方法装置终端设备可读存储介质
  • [发明专利]语音识别方法、装置、终端设备及计算机可读存储介质-CN202310629147.6在审
  • 杨显杰;黄东延 - 深圳市优必选科技股份有限公司
  • 2023-05-30 - 2023-08-15 - G10L15/18
  • 本申请适用于终端技术领域,尤其涉及一种语音识别方法、装置、终端设备及计算机可读存储介质。该方法中,终端设备获取待识别语音后,可以利用端到端的语音识别模型对待识别语音进行语音识别,得到识别结果。其中,对于语音识别模型的每一次解码,终端设备可以根据N‑gram语言模型,确定候选解码结果对应的第一概率,以使得语音识别模型可以根据候选解码结果对应的第一概率确定下一次解码得到的候选解码结果。即本申请中,在通过端到端的语音识别模型进行语音识别时,可以根据N‑gram语言模型,确定候选解码结果对应的第一概率,使得解码结果符合语法结构,降低口音等发音不准确造成的解码错误,提高语音识别的准确率,提升用户体验。
  • 语音识别方法装置终端设备计算机可读存储介质
  • [发明专利]多音字预测方法及消歧方法、装置、设备及计算机可读存储介质-CN201980003196.0有效
  • 白洛玉;李贤;张皓;黄东延;丁万;熊友军 - 深圳市优必选科技股份有限公司
  • 2019-12-24 - 2023-08-04 - G10L13/10
  • 一种多音字预测方法及消歧方法、装置、设备及计算机可读存储介质,该多音字预测方法包括如下步骤:获取待预测文本中的多音字文本、以及多音字文本在待预测文本中的上文文本和/或下文文本(S20);构建多音字文本、上文文本、下文文本各自对应的一个或多个特征向量(S30);将上文文本的特征向量、多音字文本的特征向量、下文文本的特征向量输入多音字预测模型获得多音字预测结果;多音字预测模型包括第一神经网络模块、第二神经网络模块和第三神经网络模块;第一神经网络模块输入上文文本的特征向量并得到第一输出向量,第二神经网络模块输入多音字文本的特征向量并得到第二输出向量,第三神经网络模块输入下文文本的特征向量并得到第三输出向量;多音字预测结果包括多音字的每种读音的发音概率,通过将第一输出向量、第二输出向量和第三输出向量进行拼接来获得(S40);基于多音字的每种读音的发音概率来确定多音字在待预测文本中的读音(S50)。有利于提高对多音字读音预测的准确度,有效避免分类干扰,编解码实现容易。
  • 多音字预测方法装置设备计算机可读存储介质
  • [发明专利]情感识别方法、智能装置和计算机可读存储介质-CN201980003314.8有效
  • 丁万;黄东延;李柏;邵池;熊友军 - 深圳市优必选科技股份有限公司
  • 2019-12-30 - 2023-07-18 - G06F40/30
  • 本发明实施例公开了一种情感识别方法,该情感识别方法包括:获取包括视频数据、音频数据和/或文本数据中的至少两个的待识别多模态数据组;提取视频数据的视频语义特征序列,提取音频数据的音频语义特征序列,和/或提取文本数据中的文本语义特征序列;将文本语义特征序列向音频数据的时间维度对齐处理,生成文本语义时序序列;将视频语义特征序列、音频语义特征序列和/或文本语义时序序列按照时间维度融合,生成多模态语义特征序列;将多模态语义特征序列输入预训练的情感识别神经网络,将情感识别神经网络的输出结果作为待识别数据组待识别多模态数据组对应的目标情感。本发明还公开了智能装置和计算机可读存储介质。本发明可以有效提升情感识别的准确性。
  • 情感识别方法智能装置计算机可读存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top