[发明专利]一种基于语境翻译的机器人模仿学习方法在审
申请号: | 201710927010.3 | 申请日: | 2017-10-09 |
公开(公告)号: | CN107622311A | 公开(公告)日: | 2018-01-23 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06N99/00 | 分类号: | G06N99/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语境 翻译 机器人 模仿 学习方法 | ||
技术领域
本发明涉及模仿学习领域,尤其是涉及了一种基于语境翻译的机器人模仿学习方法。
背景技术
随着科学技术的发展,机器人学已经成为人工智能领域研究的热点问题之一,它体现了目前研究的机器控制水平。在机器人控制中,机器人的模仿学习是自动系统获取控制策略的有效方法。模仿学习是使机器通过观察人类工具使用的视频来学习涉及工具使用的机器人技能。通过学习,机器人可以进一步学习各种技能,如完成扫地、拖地、洗碗、叠衣服等家务工作,又如完成传送和取回物品、开门关门等能够在未来减少人类工作量,给人们带来便利,提高人们幸福感的工作。然而,现有的模拟学习方法不能实现在高维度的观察和学习,而且不能处理语境改变的情况。
本发明提出了一种基于语境翻译的机器人模仿学习方法,先从一个未知的语境中学习新的演示,再在这些演示中学习一个语境翻译模型,模型从目标环境中观察单个结果,并且通过从源语境翻译演示来预测在该语境中将来的观察,接着用于特征追踪的奖励功能惩罚已翻译特征的偏差,从而产生观察结果,最后加强学习算法的特征追踪,在学习环境中学习控制策略,可以用于加强学习算法,计算图像特征。本发明通过学习语境翻译模型,实现在高维度的观察和学习,也能处理语境改变的情况;此外,实现有效地语境翻译和学习,还能够应用于机器人的模仿学习中。
发明内容
针对不能处理语境改变的问题,本发明的目的在于提供一种基于语境翻译的机器人模仿学习方法,先从一个未知的语境中学习新的演示,再在这些演示中学习一个语境翻译模型,模型从目标环境中观察单个结果,并且通过从源语境翻译演示来预测在该语境中将来的观察,接着用于特征追踪的奖励功能惩罚已翻译特征的偏差,从而产生观察结果,最后加强学习算法的特征追踪,在学习环境中学习控制策略,可以用于加强学习算法,计算图像特征。
为解决上述问题,本发明提供一种基于语境翻译的机器人模仿学习方法,其主要内容包括:
(一)学习语境翻译;
(二)用于特征追踪的奖励功能;
(三)加强学习算法的特征追踪。
其中,所述的模拟观察算法,它是基于学习可以将演示从一个语境(例如,第三人视点和人类演示者)转换到另一语境(例如,第一人视点和机器人)的语境翻译模型;通过训练一个模型来执行这种转换,从而获得一个适合追踪演示行为的特征。
其中,所述的学习语境翻译,由于每个演示Dk都是从一个未知的语境ωk生成的,所以学习者不能在自己的语境ωl中直接跟踪这些演示;然而,由于有来自多个未知但不同背景的演示,所以可以在这些演示中学习一个语境翻译模型;只假设在特定语境ωk中演示的第一帧可以用于隐含地提取关于语境ωk的信息。
进一步地,所述的翻译模型,翻译模型是通过对演示和进行训练的,其中,Di来自未知语境ωi(源语境),Dj来自未知语境ωj(目标语境);该模型必须学习输出Dj条件下的观测值Di和目标语境ωj中的第一个观测值因此,模型从目标环境中观察单个结果,并且通过从源语境翻译演示来预测在该语境中将来的观察;一旦被训练,这个模型可以提供任何演示Dk,将其转化为学习者的语境ωl进行跟踪。
进一步地,所述的翻译,通过学习整体翻译函数使得其输出对于所有t和每对训练演示Di和Dj都紧密匹配也就是说,该模型将来自Di的观察结果转化为语境ωj,仅限于Dj中的第一个观察
进一步地,所述的模型的组件,该模型由四个组件组成:组件一为源观测编码器表示为z1;组件二为将观测值编码为源和目标特征的目标初始观测编码器表示为z2;组件三为转换器z3=T(z1,z2),其将特征z1转换为z2的语境的特征,表示为z3;组件四为将目标语境解码的解码器Dec(z3),解码为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710927010.3/2.html,转载请声明来源钻瓜专利网。