专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果12个,建议您升级VIP下载更多相关专利
  • [发明专利]模型训练方法、动作姿态生成方法、装置、设备及介质-CN202110455733.4有效
  • 亢祖衡;彭俊清;王健宗 - 平安科技(深圳)有限公司
  • 2021-04-26 - 2023-09-26 - G06V10/774
  • 本发明实施例公开了一种模型训练方法、动作姿态生成方法、装置、设备及介质。本发明涉及生物识别技术领域,该方法包括:训练动作姿态生成模型,获取机器人生成动作姿态所对应的语音信息并进行特征提取及特征融合以生成多个融合特征向量;对每个融合特征向量与机器人初始姿态自回归向量进行特征融合以生成控制输入向量;将随机生成的潜在输入向量及控制输入向量输入动作姿态生成模型以生成机器人姿态动作向量;更新预设初始姿态动作向量集中的机器人姿态动作向量,并将预设初始姿态动作向量集作为目标姿态动作向量集,根据目标姿态动作向量集生成机器人动作姿态。本发明实施例可节约动作姿态生成的成本及提高动作姿态生成的效果。
  • 模型训练方法动作姿态生成装置设备介质
  • [发明专利]钢琴弹奏视频生成方法、装置、计算机设备及存储介质-CN202310638047.X在审
  • 亢祖衡;彭俊清;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2023-05-31 - 2023-08-29 - G10L21/10
  • 本发明涉及语音分析领域,尤其涉及一种钢琴弹奏视频生成方法、装置、计算机设备及存储介质。其方法包括:获取音频流数据;将音频流数据输入音频编码器进行编码处理,得到音频编码;通过钢琴视频代码转换模型对音频编码进行代码转换,得到钢琴视频代码薄序列;通过钢琴视频代码薄解码器对钢琴视频代码薄序列进行解码处理,得到钢琴视频流数据;钢琴视频流数据是指人手在钢琴上弹奏与音频编码对应的音乐的视频流;将钢琴视频流数据和音频流数据进行合并,得到钢琴弹奏视频。本发明将音频流数据转换为具有人手弹奏钢琴的画面的视频流数据,并最终生成既包含音频又包含人手在钢琴上弹奏该音频的视频,使视频效果和质量更好,提高用户体验感。
  • 钢琴弹奏视频生成方法装置计算机设备存储介质
  • [发明专利]声纹识别模型的优化方法、装置、计算机设备及存储介质-CN202110733702.0有效
  • 亢祖衡;彭俊清;王健宗 - 平安科技(深圳)有限公司
  • 2021-06-30 - 2023-05-23 - G10L17/04
  • 本申请公开了声纹识别模型的优化方法、装置、计算机设备及存储介质,涉及人工智能技术领域,用于针对线上用户进行实时优化,提高了模型的准确率。方法包括:将预置的初始声纹识别模型分别部署到多个终端;获取目标终端发送的待识别语音数据;通过预置的历史存量数据对待识别语音数据进行声纹核身操作;当待识别语音数据通过声纹核身操作时,将多个匿名声纹向量确定为负样例数据并发送至目标终端,以使得目标终端进行梯度计算;获取多个关联终端发送的多个关联模型梯度,并采用联邦聚合平均算法对多个关联模型梯度和目标模型梯度进行聚合,得到聚合梯度;将聚合梯度发送到多个终端,以使得每个终端根据聚合梯度对初始声纹识别模型进行优化。
  • 声纹识别模型优化方法装置计算机设备存储介质
  • [发明专利]语音情绪转换方法、语音情绪转换装置、设备和存储介质-CN202210906391.8在审
  • 亢祖衡;彭俊清;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2022-07-29 - 2022-11-01 - G10L25/63
  • 本申请实施例提供了一种语音情绪转换方法、语音情绪转换装置、设备和存储介质,属于人工智能技术领域。该方法包括:获取初始情绪音频的初始频谱数据和初始情绪标签;根据音频代码簿模型对初始频谱数据进行编码,得到第一编码数据;根据音高提取算法对初始频谱数据进行音高提取,得到目标音高信息;获取目标情绪标签,并根据第一编码数据、目标音高信息、初始情绪标签和目标情绪标签进行编码合成,得到第二编码数据;将第二编码数据输入至预训练的翻译模型进行编码翻译,得到目标代码簿序列信息;根据目标代码簿序列信息生成目标频谱数据;对目标频谱数据进行声码还原,得到目标情绪音频。本申请实施例能够提高语音情绪转换的效率和准确性。
  • 语音情绪转换方法装置设备存储介质
  • [发明专利]语音情绪识别模型训练方法、装置、计算机设备及介质-CN202210897694.8在审
  • 亢祖衡;彭俊清;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2022-07-28 - 2022-09-23 - G10L15/02
  • 本发明公开了一种语音情绪识别模型训练方法,获取音素语音特征、性别语音特征和情绪语音特征;音素语音特征关联音素语音标签,性别语音特征关联性别语音标签,情绪语音特征关联情绪坐标标签;输入至包含初始参数的预设识别模型中;获取预设识别模型的输出特征向量;基于第一特征向量,获取预测音素标签;基于输出特征向量,获取预测性别标签和预测情绪标签;根据预测音素标签、预测性别标签、预测情绪标签、音素语音标签、性别语音标签和情绪坐标标签,确定预测损失值;在预测损失值未达到预设收敛条件时,迭代更新预设识别模型中的初始参数,直至预测损失值达到收敛条件时,记录为语音情绪识别模型。本发明提高了语音情绪识别的准确率。
  • 语音情绪识别模型训练方法装置计算机设备介质
  • [发明专利]一种超分辨率音频生成方法、计算机设备及存储介质-CN202210043395.8在审
  • 亢祖衡;彭俊清;王健宗 - 平安科技(深圳)有限公司
  • 2022-01-14 - 2022-04-26 - G10L21/007
  • 本申请实施例提供一种超分辨率音频生成方法、计算机设备及存储介质,涉及信号处理技术领域,其中超分辨率音频生成方法包括:将低分辨率音频输入包括生成器和判别器的生成对抗网络的音频样本生成模型,输出超分辨率音频样本,基于超分辨率音频的频谱特征集合和低分辨率音频的频谱特征集合,进行特征融合,得到目标全频带频谱,通过频域变换的逆变换得到目标全频带频谱对应的音频,即超分辨率音频,由于本方案中,将原始的低分辨率音频的频谱特征集合与通过音频样本生成模型生成的超分辨率音频样本的频谱特征集合进行融合,进而基于特征融合得到的目标全频带频谱得到超分辨率音频,避免了原始音频的特征信息丢失,提高了生成音频的质量。
  • 一种分辨率音频生成方法计算机设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top