[发明专利]一种多代理合作场景下的通信协议学习和迁移的方法在审
申请号: | 201911207985.4 | 申请日: | 2019-11-30 |
公开(公告)号: | CN111181919A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 谭哲越;尹建伟;尚永衡;张鹿鸣;李莹;邓水光 | 申请(专利权)人: | 浙江大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林松海 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多代理合作情景下的通信协议学习和迁移的方法,包括:每个执行代理独立观测环境,使用神经网络将环境进行编码,生成需要分享给其他代理的信息特征向量;所述执行代理将各自的信息发送给信道代理(通信通道),所述信道代理使用通信协议为各执行代理生成消息向量并进行分发;所述执行代理接收到新的消息,整合已有的信息,然后使用策略网络进行动作决策;所述执行代理和所述信道代理的网络参数的梯度是分开进行计算的;在源任务上学习到通信协议后,迁移到目标任务时,复用通信协议参数,并限制学习率。该方法能够独立学习指定任务上的连续通信协议,并具有良好的鲁棒性。 | ||
搜索关键词: | 一种 代理 合作 场景 通信协议 学习 迁移 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911207985.4/,转载请声明来源钻瓜专利网。