[发明专利]基于元强化学习的非正交多址系统物理层安全通信方法在审
申请号: | 202310259528.X | 申请日: | 2023-03-16 |
公开(公告)号: | CN116405930A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 万城瑞;周小林;王涵 | 申请(专利权)人: | 复旦大学 |
主分类号: | H04W12/033 | 分类号: | H04W12/033;H04W52/26 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 正交 系统 物理层 安全 通信 方法 | ||
本发明属于通信技术领域,具体为一种基于元强化学习的非正交多址系统物理层安全通信方法。本发明包括:构建最大化系统物理层安全和速率为目标的功率分配优化目标函数,其中考虑存在多个窃听者窃听信息的情况;采用元强化学习网络对系统物理层进行安全加密,实现非正交多址系统物理层安全通信;本发明克服了现有基于深度强化学习的功率分配方法的缺陷,解决现有技术不能应用于变化的信道环境因而难以实际应用问题,提升了非正交多址系统物理层的安全性。
技术领域
本发明属于通信技术领域,具体涉及一种基于元强化学习的非正交多址系统物理层安全通信方法。
背景技术
通信技术的发展带来了多种新型传输技术,其在提升合法用户性能的同时,也存在被恶意用户窃听的情况,这带来了新的安全挑战。面对潜在的物理层安全威胁,将物理层安全技术结合到,保障信息传输的安全性,成为最近的研究热点。同时,多用户通信问题中,功率分配一直是优化系统整体通信质量的重要环节,引起人们的广泛关注。随着实际情况中通信系统物理层安全问题的日益显现,为了提升通信安全性,减少因被窃听而引起的损失,针对通信系统的物理层加密方法越来越重要。在具体的通信系统模型建模下,系统的物理层加密方法可以归结为最大化系统的和速率,同时让窃听端的速率尽可能的小。这样,对物理层进行加密的方法可以简化为优化系统的功率分配或资源分配策略,以达到增强系统物理层安全性和物理层进行加密的目的。目前,采用深度强化学习技术来进行通信系统功率分配的方法逐渐增多,深度强化学习是深度学习与强化学习的结合,这种方法能够基于智能体与环境的交互学习到特定的功率分配策略,但是这种方法的前提假设是环境是不变的、静态的。在实际情况下,信道特性是动态的,这意味着深度强化学习方法学习到的静态环境功率分配策略难以应用到动态的环境中。
元强化学习是一种结合了元学习与强化学习的优点的方法。元学习算法是一种学习深度学习模型初始化参数的算法,在学习到的初始化参数下,模型仅用少量训练数据即可达到收敛,适应新的环境特性,快速部署到全新的环境中去。结合了元学习算法的强化学习方法,解决了原有方法泛化能力弱,需要大量训练数据的缺点。
发明内容
本发明的目的在于提出一种泛化能力,不能适应动态环境基于元强化学习的非正交多址系统物理层安全通信方法。并提出了功率分配的优化目标函数。
本发明提供的基于元强化学习的非正交多址系统物理层安全通信方法,包括构建最大化系统物理层安全和传输速率为目标的功率分配优化目标函数;采用元强化学习网络,对系统物理层进行安全加密,实现非正交多址系统物理层安全通信。
(一)构建最大化系统物理层安全和传输速率为目标的功率分配优化目标函数
本发明涉及的非正交多址(无线通信)系统,包含无线系统发送端用户、接收端基站,以及恶意窃听端,参见图1所示。
设发送端第i个用户发送信号Si表示为:
其中,Ptotal为发送端的发射总功率,αi为第i个用户的功率分配因子(系数),Xi为第i个用户的信息信号,i=1,2...n,n为用户数;用户-基站、用户-窃听端以及基站-窃听端的信道分别用信道系数表示:hsd,hse,hde,信道系数为服从瑞利分布的随机变量,即h~Rayleigh(σr2),σr2为瑞利分布的方差;噪声信号为服从高斯分布的高斯噪声,即n~N(0,σg2),σg2为高斯分布的方差。
设接收端基站处的接收信号yl表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310259528.X/2.html,转载请声明来源钻瓜专利网。