[发明专利]一种基于元学习的机器人行为示教方法有效

申请号：	202011483927.7	申请日：	2020-12-16
公开（公告）号：	CN112509392B	公开（公告）日：	2022-11-29
发明（设计）人：	胡梓烨;李伟;甘中学;王旭升;胡林强	申请（专利权）人：	复旦大学
主分类号：	G09B5/02	分类号：	G09B5/02;G06V20/40;G06V10/82;G06N20/00;G06N3/04
代理公司：	上海德昭知识产权代理有限公司 31204	代理人：	郁旦蓉
地址：	200433 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于学习机器人行为方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于元学习的机器人行为示教方法，用于对机器人获取的示教视频进行学习从而完成多种任务，其特征在于，包括如下步骤：

步骤S1，获取所述示教视频；

步骤S2，利用预先训练好的神经网络模型对所述示教视频进行学习从而完成多种所述任务，

其中，所述神经网络模型的训练过程包括如下步骤：

步骤T1，采集包含对比视频V_comparison的训练示教视频V_demo、机器人运动视频V_robot以及轨迹动作V_action；

步骤T2，利用预定的数据归一化方法对所述对比视频V_comparison、所述训练示教视频V_demo以及所述机器人运动视频V_robot进行归一化处理得到预处理对比视频V'_comparison、预处理示教视频V'_demo以及预处理运动视频V'_robot，并统一时长；

步骤T3，构建初始神经网络模型θ；

步骤T4，将所述预处理示教视频V'_demo输入所述初始神经网络模型θ得到演示动作D_action，并计算演示动作损失L_demo：

步骤T5，根据所述演示动作损失L_demo对所述初始神经网络模型θ进行参数更新得到更新后的神经网络模型作为更新后模型θ'：

式中，λ为超参数学习率；

步骤T6，将所述预处理示教视频V'_demo输入更新模型θ'得到预测的演示轨迹动作P_action-demo以及对应的演示语义E_demo、将所述预处理对比视频V'_comparison输入更新模型θ'得到预测的对比轨迹动作P_{action-comparison}以及对应的对比语义E_comparison、将所述预处理运动视频V'_robot输入更新模型θ'得到预测的机器人轨迹动作P_action-robot以及对应的机器人目标语义E_target，其中，我们用取值为实数集的N维向量来表示每一个演示语义E_demo、对比语义E_comparison以及机器人目标语义E_target：