[发明专利]基于B-M2M的设备模仿学习方法、MEC及存储介质有效
申请号: | 202111130456.6 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113837396B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 李希金;李红五;安岗;周晓龙 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06N3/045;G06N3/048;G06N3/063;G06F9/50 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 罗建民;杜丹丹 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 m2m 设备 模仿 学习方法 mec 存储 介质 | ||
本公开提供一种基于B‑M2M的设备模仿学习方法、MEC及计算机可读存储介质,所述方法应用于移动边缘计算服务器MEC,包括:分别生成各个学习设备的模仿学习策略;以及,基于B‑M2M信道将所述模仿学习策略广播至各个学习设备,以使各个学习设备基于其各自的模仿学习策略执行模仿学习任务。本公开实施例利用MEC强大的数据处理能力,在MEC中生成工业现场各学习设备需要的模仿学习策略,并结合B‑M2M信道实现模仿学习策略的广播通信,降低通信时延提高广播通信效率,进而提高学习设备的模仿效率,有效解决了目前模仿学习算法部署在设备侧所产生的机械设备生产成本高以及模仿效果差等问题。
技术领域
本公开涉及机器学习技术领域,尤其涉及一种基于B-M2M的设备模仿学习方法、一种MEC以及一种计算机可读存储介质。
背景技术
模仿是人类和其他生物获取运动技能最直接、最有效的学习方式。模仿学习(Imitation Learning,IL)就是基于这一思想而进行的工作。在IL中,专家示教提供了有效信息,从而提高了学习效率,并且适用于复杂任务,IL赋予机械设备、机器人模仿的能力,可以使机械设备、机器人通过模仿示教者的动作实现快速学习,从而有效地避免复杂的编程而赋予机械设备、机器人操作技能。
目前模仿学习的学习算法和控制网络通常部署在设备侧,因此工业环境中的机械设备需要有较大的数据处理能力才能实现模仿行为的再现,而随着生产多样性和技术升级,机械设备也需要不断重新构建更为复杂的模仿学习算法,在这种模式下,无形之中增加了企业生产成本,且不能达到良好的模仿学习效果。
发明内容
本公开提供了一种基于B-M2M的设备模仿学习方法、MEC及计算机可读存储介质,以至少解决目前模仿学习算法部署在设备侧所产生的的机械设备生产成本高以及模仿效果差等问题。
为实现上述目的,本公开提供一种基于B-M2M的设备模仿学习方法,应用于移动边缘计算服务器MEC,包括:
分别生成各个学习设备的模仿学习策略;以及,
基于B-M2M信道将所述模仿学习策略广播至各个学习设备,以使各个学习设备基于其各自的模仿学习策略执行模仿学习任务。
在一种实施方式中,在基于所述B-M2M信道将所述模仿学习策略广播至各个学习设备之前,还包括:
基于预设频段的信道资源划分公共信道资源池,所述公共信道资源池包括B-M2M信道。
在一种实施方式中,所述生成各个学习设备各自的模仿学习策略,包括:
建立各个学习设备的模仿学习神经网络;
基于所述B-M2M信道接收示教设备的示教数据以及各个学习设备基于所述示教数据进行同步操作的预期数据;
将所述示教数据分别作为所述各个学习设备的模仿学习神经网络的输入数据,获得各个学习设备的输出结果;
分别基于各个学习设备的预期数据及其输出结果对各个学习设备的模仿学习神经网络进行训练;以及,
基于经过训练的各个学习设备的模仿学习神经网络分别获取各个学习设备的模仿学习策略。
在一种实施方式中,所述建立各个学习设备的模仿学习神经网络,包括:
采用径向基函数RBF建立各个学习设备的模仿学习神经网络,所述模仿学习神经网络包括输入层、隐含层及输出层。
在一种实施方式中,所述分别基于各个学习设备的预期数据及其输出结果对各个学习设备的模仿学习神经网络进行训练,包括:
分别计算各个学习设备的预期数据和其输出结果之间的各个误差值;
分别判断各个误差值是否小于预设值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130456.6/2.html,转载请声明来源钻瓜专利网。