专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果138个,建议您升级VIP下载更多相关专利
  • [发明专利]一种数字人的训练方法、系统及驱动系统-CN202311166705.6在审
  • 司马华鹏;姜皓;范宏伟;屈奇勋;李佳斌;栾锦泰 - 南京硅基智能科技有限公司
  • 2023-09-12 - 2023-10-20 - G06V40/20
  • 本申请提供一种数字人的训练方法、系统及驱动系统。所述方法通过提取训练数据中的人体姿态估计数据,并将人体姿态估计数据输入至优化姿态估计网络以得到人体姿态优化数据。根据优化姿态估计网络的损失函数,计算人体姿态优化数据中的位置优化数据与加速度优化数据的生成损失,以最小化位置估计数据、加速度估计数据与真实值的误差。以驱动优化姿态估计网络更新网络参数,以得到基于优化姿态估计网络的最优驱动模型。通过最小化位置估计数据、加速度估计数据与真实值的误差,降低因训练数据中样本任务身体各部位遮挡引起的抖动,以提高识别人体姿态数据的准确度。
  • 一种数字训练方法系统驱动
  • [发明专利]合成音频的输出方法及装置、存储介质、电子装置-CN202311160940.2在审
  • 司马华鹏;吴海娥;姚奥;蒋达;汤毅平 - 南京硅基智能科技有限公司
  • 2023-09-11 - 2023-10-17 - G10L13/10
  • 本申请实施例提供了一种合成音频的输出方法及装置、存储介质、电子装置,所述方法包括:将输入文本和指定的目标身份标识输入音频输出模型,通过所述身份识别模型提取所述目标身份的身份特征序列,通过所述语音合成模型的编码层提取所述输入文本对应的音素特征序列,将所述目标身份的身份特征序列和所述输入文本对应的音素特征序列叠加并输入所述语音合成模型的变量适配器,通过所述变量适配器对所述音素特征序列进行时长预测和对齐、能量预测以及音高预测后,然后经过语音合成模型的解码层并输出与所述输入文本对应的目标梅尔谱特征,将所述目标梅尔谱特征输入声码器,通过所述声码器输出符合所述目标身份说话风格的合成音频。
  • 合成音频输出方法装置存储介质电子
  • [发明专利]一种动作迁移模型的训练方法及动作迁移方法-CN202111209167.5有效
  • 司马华鹏;屈奇勋;范宏伟;李佳斌 - 南京硅基智能科技有限公司
  • 2021-10-18 - 2023-09-19 - G06T7/246
  • 本申请提供了一种动作迁移模型的训练方法及动作迁移方法,所述训练方法包括将源图像和驱动图像输入至待训练动作迁移模型,以使该模型根据初始模型参数获取源图像的源关键点坐标组和驱动图像的驱动关键点坐标组,并根据源关键点坐标组和驱动关键点坐标组,获取由源关键点坐标组变换至驱动关键点坐标组的光流图和重绘图,获取源图像的隐层特征图,根据隐层特征图、光流图和重绘图,获取目标图像,目标图像是将驱动图像中与驱动关键点坐标相关联的待迁移动作迁移至源关键点坐标后得到的图像;根据目标图像、源图像以及驱动图像,计算损失函数,并根据损失函数优化初始模型参数,直至达到模型收敛条件,完成训练,得到目标动作迁移模型。
  • 一种动作迁移模型训练方法
  • [发明专利]一种动作捕捉和重定向方法-CN202111253389.7有效
  • 司马华鹏;汪圆;王培雨 - 南京硅基智能科技有限公司
  • 2021-10-27 - 2023-09-05 - G06V40/20
  • 本发明公开了一种动作捕捉和重定向方法,所述方法包括:获取视频数据;基于第一神经网络模型,提取所述每一帧图像中待捕捉人物的边框坐标数据;基于第二神经网络模型,根据所述待捕捉人物的边框坐标数据,获取所述每一帧图像中的待捕捉人物的关键点二维坐标数据;将所述二维坐标数据输入至三维动作方向预测模型,获取所述每一帧图像中的待捕捉人物的三维方向向量预测数据;根据所述关键点二维坐标数据、所述三维方向向量预测数据以及基于动作参数的人物结构模型拟合人体动作参数,获取所述每一帧图像中待捕捉人物的质心位移信息与欧拉角信息;将所述质心位移信息与所述欧拉角信息直接重定向到任意人物结构模型,进行相应动画。
  • 一种动作捕捉定向方法
  • [发明专利]跟踪显示方法及提词器、电子设备、存储介质-CN202210293071.X有效
  • 司马华鹏;李慧水;汤毅平;汪成;张亚萍 - 南京硅基智能科技有限公司
  • 2022-03-23 - 2023-08-29 - H04N5/222
  • 本申请提供一种跟踪显示方法及提词器、电子设备、存储介质。解决了相关技术中提词器在工作过程中无法实现理想语音跟踪的技术问题。本申请提出的跟踪显示方法,适用于不同的语言及语境场景。通过判断确定对应的跟踪显示方案以及语言逻辑。具体采用定位与语音跟踪的方式,通过候选位置的筛选与相似度的比较方法实现语音跟踪。一方面令语音跟踪与定位的过程并不严格依赖于语音识别的效果。另一方面,在定位过程中是基于迭代的思路对可能的位置进行筛选并完成定位,其比较的对象不是待跟踪全部文本。进而缩短了处理时间,并可在语音识别错误以及用户口误的情况下,仍可根据用户的实际发言内容实现精准定位。从而实现快速而精准的语音跟踪。
  • 跟踪显示方法提词电子设备存储介质
  • [发明专利]一种智能人物复刻终端的系统实现方法-CN202210773471.0有效
  • 司马华鹏;刘杰;周雪兰 - 南京硅基智能科技有限公司
  • 2022-07-01 - 2023-08-22 - G10L13/08
  • 本申请实施例提供了一种智能人物复刻终端的系统实现方法,包括:获取用户所要缅怀的逝者对应的过往图像,并根据所述过往图像生成逝者面部视频;所述过往图像包括所述逝者的面部图像,所述逝者面部视频用于指示所述面部图像按照预设方式进行表情变化;根据所述逝者过往的语言片段训练预设的语言模型以获取目标语言模型;将目标缅怀主题输入至所述目标语言模型中,获取与所述目标缅怀主题对应的目标文本内容;根据所述逝者过往的音频片段训练预设的语音合成模型以获取目标语音合成模型;将所述目标文本内容输入至所述目标语音合成模型中,生成目标音频;根据所述逝者面部视频中所述逝者的面部表情变化同步输出所述目标音频至用户。
  • 一种智能人物终端系统实现方法
  • [发明专利]一种基于社交账户的数字人生成方法及系统-CN202310581987.X在审
  • 司马华鹏;汤毅平 - 南京硅基智能科技有限公司
  • 2023-05-22 - 2023-08-18 - G06T13/40
  • 本申请提供一种基于社交账户的数字人生成方法及系统,所述方法通过获取目标人物的社交账户信息,并基于社交账户信息中的视频平台社交动态以及非视频平台社交动态获取社交动态素材,社交动态素材可以包括图片素材、音频素材以及文本素材。然后从带有目标人物形象的图片素材中提取人像特征,以及从音频素材中音频特征。最后根据所述人像特征、所述音频特征与所述文本素材,以及预设的数字人生成模型,得到目标人物对应的目标数字人。本申请可以通过在目标人物中的社交账户中获取社交账户信息,并通过社交账户信息中的社交动态素材提取各项用于生成数字人的特征,便于获取生成数字人的素材,从而提高数字人的生成效率。
  • 一种基于社交账户数字人生成方系统

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top