[发明专利]基于B-M2M的设备模仿学习方法、MEC及存储介质有效
申请号: | 202111130456.6 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113837396B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 李希金;李红五;安岗;周晓龙 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06N3/098 | 分类号: | G06N3/098;G06N3/045;G06N3/048;G06N3/063;G06F9/50 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 罗建民;杜丹丹 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 m2m 设备 模仿 学习方法 mec 存储 介质 | ||
1.一种基于B-M2M的设备模仿学习方法,其特征在于,应用于移动边缘计算服务器MEC,包括:
分别生成各个学习设备的模仿学习策略;以及,
基于广播机器对机器B-M2M信道将所述模仿学习策略广播至各个学习设备,以使各个学习设备基于其各自的模仿学习策略执行模仿学习任务;
所述生成各个学习设备各自的模仿学习策略,包括:
建立各个学习设备的模仿学习神经网络;
基于所述B-M2M信道接收示教设备的示教数据以及各个学习设备基于所述示教数据进行同步操作的预期数据;
将所述示教数据分别作为所述各个学习设备的模仿学习神经网络的输入数据,获得各个学习设备的输出结果;
分别基于各个学习设备的预期数据及其输出结果对各个学习设备的模仿学习神经网络进行训练;以及,
基于经过训练的各个学习设备的模仿学习神经网络分别获取各个学习设备的模仿学习策略。
2.根据权利要求1所述的方法,其特征在于,在基于所述B-M2M信道将所述模仿学习策略广播至各个学习设备之前,还包括:
基于预设频段的信道资源划分公共信道资源池,所述公共信道资源池包括B-M2M信道。
3.根据权利要求1所述的方法,其特征在于,所述建立各个学习设备的模仿学习神经网络,包括:
采用径向基函数RBF建立各个学习设备的模仿学习神经网络,所述模仿学习神经网络包括输入层、隐含层及输出层。
4.根据权利要求3所述的方法,其特征在于,所述分别基于各个学习设备的预期数据及其输出结果对各个学习设备的模仿学习神经网络进行训练,包括:
分别计算各个学习设备的预期数据和其输出结果之间的各个误差值;
分别判断各个误差值是否小于预设值;
若存在某个误差值不小于所述预设值,则基于所述误差值对其对应的学习设备的模仿学习神经网络进行训练,得到对应学习设备经过训练后的模仿学习神经网络;
基于所述对应学习设备经过训练后的模仿学习神经网络获取各个学习设备经过训练后的模仿学习神经网络;
将所述示教数据分别作为所述各个学习设备经过训练后的模仿学习神经网络的输入数据,得到各个学习设备更新后的输出结果,并返回分别计算各个学习设备的预期数据和其输出结果之间的各个误差值的步骤,直到所有误差值小于预设值,输出各个学习设备经过训练的模仿学习神经网络。
5.根据权利要求4所述的方法,其特征在于,基于所述误差值对其对应的学习设备的模仿学习神经网络进行训练,得到对应学习设备的训练后的模仿学习神经网络,包括:
基于所述误差值调整其对应学习设备的模仿学习神经网络中各神经元之间的连接权值;
基于调整后的所述连接权值获取所述学习设备的模仿学习神经网络的映射关系;以及,
基于所述映射关系获取所述学习设备的训练后的模仿学习神经网络。
6.根据权利要求1所述的方法,其特征在于,所述将所述示教数据分别作为所述各个学习设备的模仿学习神经网络的输入数据,获得各个学习设备的输出结果,根据以下公式得到:
式中,yj表示某个学习设备的输出结果所对应的第j个输出层神经元的输出向量,j、i分别表示某个学习设备的模仿学习神经网络第j个输出层神经元和第i个隐含层神经元,其中j=1,2,…,n,i=1,2,…,h,wij表示第i个隐含层神经元与第j个输出层神经元之间的连接权值,xp表示教数据对应的输入向量,ci表示第i个隐含层神经元的中心向量,σ表示方差,cmax表示各个隐含层神经元的中心向量之间的最大距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130456.6/1.html,转载请声明来源钻瓜专利网。