[发明专利]一种基于强化学习的水声通信自适应调制方法有效
申请号: | 201910813009.7 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110519013B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 张育芝;李萍;王安义;孙彦景;王斌;刘洋 | 申请(专利权)人: | 西安科技大学 |
主分类号: | H04L1/00 | 分类号: | H04L1/00;H04B13/02;G06N20/00 |
代理公司: | 西安维赛恩专利代理事务所(普通合伙) 61257 | 代理人: | 刘春 |
地址: | 710054 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习的水声通信自适应调制方法,解决了现有水声自适应通信系统中的反馈信道状态信息过时问题引起的系统性能下降的问题。本发明的方法基于水声自适应调制系统,步骤1、建立并初始化系统Q表;在初始时刻采取动作,计算奖励值;步骤2、下一时刻更新Q表,选择下一动作执行;步骤3、发送端将信号经水声信道发送至接收端;步骤4、接收端接收信号,反馈相关信息到发送端;步骤5、发送端将获取的信息送入强化学习模块,计算并更新奖励值,为下一时刻的更新Q表做好准备;步骤6、重复步骤2—步骤5,直至信号发送结束,最终可得经过强化学习优化自适应调制的系统吞吐量。 | ||
搜索关键词: | 一种 基于 强化 学习 通信 自适应 调制 方法 | ||
【主权项】:
1.一种基于强化学习的水声通信自适应调制方法,其特征在于,所述方法基于水声自适应调制系统,所述系统包含发送端和接收端,发送端包含自适应调制模块和强化学习模块,接收端包括接收解调模块和反馈模块;/n具体包括以下步骤:/n步骤1、设定水声自适应调制系统的Q表三要素:状态集S、动作集A和奖励集R,建立并初始化水声自适应调制系统Q表;/n在初始时刻,采用随机选择策略,从动作集A中选取a作为初始时刻状态st下所采取的动作;发送端的自适应调制模块执行所述动作a,在时变水声信道中发送信号给接收端,接收端的接收解调模块解调信号并通过反馈模块反馈数据包给发送端,发送端根据接收的数据包计算得到状态st下动作a的奖励值rt;/n步骤2、下一时刻,系统从状态st到达状态st+1,根据所述状态st+1、以及奖励值rt,更新状态st中的水声自适应调制系统Q表作为状态st+1的Q表,并在状态st+1下根据更新后的水声自适应调制系统Q表选择最佳调制方式,即采用贪婪算法来选择下一动作a'执行;/n步骤3、发送端使用所述步骤2中选择的最佳调制方式调制信号,通过自适应调制模块将信号经水声信道发送至接收端;/n步骤4、接收端的接收解调模块接收所述步骤3中经过水声信道传输来的信号,解调获得相关信息,送入反馈模块并以数据包的形式反馈相关信息到发送端;/n步骤5、发送端根据接收到的数据包,将获取的信息送入强化学习模块,计算并更新执行动作a'所获得的奖励值rt+1,更新参数,将st+1赋值给st,将rt+1赋值给rt,为下一时刻的更新Q表做好准备;/n步骤6、重复步骤2—步骤5,直至信号发送结束,最终可得经过强化学习优化自适应调制的系统吞吐量。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安科技大学,未经西安科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910813009.7/,转载请声明来源钻瓜专利网。