[发明专利]仿真角色的动作生成及其模型的训练方法和装置在审
| 申请号: | 202211214486.X | 申请日: | 2022-09-30 |
| 公开(公告)号: | CN115908652A | 公开(公告)日: | 2023-04-04 |
| 发明(设计)人: | 姚贺源;刘利斌;宋振华;陈宝权 | 申请(专利权)人: | 北京大学 |
| 主分类号: | G06T13/40 | 分类号: | G06T13/40;G06N20/00;G06N3/08 |
| 代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 尹倩倩 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 仿真 角色 动作 生成 及其 模型 训练 方法 装置 | ||
1.一种仿真角色的动作生成方法,其特征在于,所述方法包括:
获取仿真角色对应的当前时刻的仿真姿态数据以及用于控制仿真角色的当前控制信号;
基于所述仿真角色对应的当前时刻的仿真姿态数据、所述当前控制信号、预训练好的仿真角色的关节力矩生成模型和仿真环境,生成目标仿真姿态数据;所述目标仿真姿态数据为与所述当前控制信号对应的下一时刻仿真角色的仿真姿态数据;
其中,所述仿真角色的关节力矩生成模型用于确定仿真角色每个关节的力矩;所述仿真角色的关节力矩生成模型通过和环境模型联合训练得到;所述环境模型用于基于所述仿真角色每个关节的力矩生成预测的仿真姿态数据,所述预测的仿真姿态数据用于所述仿真角色的关节力矩生成模型和所述环境模型的自回归训练。
2.如权利要求1所述的仿真角色的动作生成方法,其特征在于,所述仿真角色的关节力矩生成模型中包括策略模型,所述策略模型基于仿真角色对应的历史仿真姿态数据以及历史控制信号确定,所述策略模型用于确定编码空间中的偏移,所述历史控制信号g中包括用户输入的朝向di以及速度vi,相应地,所述策略模型的训练过程,包括:
获取仿真角色对应的历史仿真姿态数据st以及历史控制信号g;
基于所述仿真角色对应的历史仿真姿态数据以及历史控制信号,根据第一预设损失函数和第二预设损失函数确定仿真角色的策略模型;其中,所述第一预设损失函数和所述第二预设损失函数共同用于控制仿真角色前进的方向和速度;其中,第一预设损失函数为:第二预设损失函数为:lr=|Md(st,vt,dt)|;其中,d'i、vi'分别为环境模型生成的下一时刻仿真角色的仿真姿态数据s't+1的根节点朝向和根节点速度,Md为策略模型,h为常数,表示输入的朝向di以及速度vi的总个数,vt,dt分别与vi,di对应,分别表示某个时刻用户输入朝向以及速度。
3.如权利要求2所述的仿真角色的动作生成方法,其特征在于,所述历史控制信号g中还包括仿真角色的姿态类别j,相应地,所述策略模型的训练过程,包括:
根据第一预设损失函数、第二预设损失函数以及第三预设损失函数确定目标损失函数;其中,所述第三预设损失函数用于区分历史仿真姿态数据的姿态类别,所述第三预设损失函数为:其中,第一部分用于对动作捕捉目标姿态数据进行分类,第二部分(1+D(st,st+1,j))2用于对仿真姿态数据进行分类;其中,mj为预设的参考动作;
基于目标损失函数以及第三预设损失函数,基于对抗学习确定仿真角色的策略模型;其中,目标损失函数为:其中Cross为交叉熵函数,ej为只有x=j为1的概率分布x。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211214486.X/1.html,转载请声明来源钻瓜专利网。





