[发明专利]一种面向用户隐私保护的高能效V2X资源分配方法在审
申请号: | 202210516466.1 | 申请日: | 2022-05-12 |
公开(公告)号: | CN114827956A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 柴新越;程梦倩;陈权;宋晓勤 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | H04W4/44 | 分类号: | H04W4/44;H04W4/46;H04W72/04;G06N3/00;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210016*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 用户 隐私 保护 能效 v2x 资源 分配 方法 | ||
1.一种面向用户隐私保护的高能效V2X资源分配方法,具体包括以下步骤:
步骤1:在满足C-V2X保密率的前提下,以提高车联网网络的频谱效率和能量效率为目的,定义状态空间为信道状态信息;动作空间为智能体选择的子信道和V2V传输功率;
步骤2:在考虑保密率及其门限值大小的情况下,定义V2X链路的综合效率为奖励函数;
步骤3:智能体v从环境中观察状态st,作为目标Q网络的输入,基于ε贪心策略执行动作at,并将训练数据存入记忆回放池;
步骤4:从记忆回放池选取一小批样本,通过最小化Q网络和学习目标间的平方和误差训练Q网络,使用随机梯度下降法计算更新后的网络参数,若训练回合数达到最大训练回合数E,则进入步骤5,否则跳转至步骤3开始新一回合训练;
步骤5:根据训练完成的DQN网络,得到最优的V2V和V2I链路的频谱和传输功率分配方案;
进一步,所述步骤2包括如下具体步骤:
步骤2-1:第m条V2X链路的传输速率可表示为
其中,PV2X为V2X链路的传输功率,hm,hm,j为第m条V2X链路对应信道的信道增益和第j条V2X链路对第m条V2X链路的干扰增益,amn表示子信道多路复用分配因子,Im表示对第m个V2X链路的干扰,σ2为噪声功率;
步骤2-2:类似地,对于窃听者来说,在V2X链路上的窃听速率可表示为
其中,hm,e和hj,e为窃听其他V2X链路的信道功率增益和第j条V2X链路的干扰功率增益,Ieve为对窃听者的干扰;
步骤2-3:定义V2X链路的频谱效率为占用的频谱带宽与总功耗之比,即
其中,Bn为每个V2X链路占用的频谱带宽,PC为电路功率;
步骤2-4:奖励函数定义为V2X链路的频谱效率,表示为
其中,ζV2X为V2X链路的频谱效率,引入负奖励是为了使DQN选择更好的策略,该奖励函数由每个智能体共享,在每个智能体与环境的交互过程中,不断更新相应的动作,以获得最大的累计奖励;RT为V2V保密率的阈值,是正奖励和负奖励的边界,保证智能体在具有一定保密率的情况下可以获得更多的正奖励,Rm,security为保密率,定义为
Rm,security=[Rm-Rm,e]+
其中,Rm表示第m条V2X链路的传输速率,Rm,e表示第m个V2X链路上的窃听速率,y=[x]+表示x的非负值,即
进一步,所述步骤4包括如下具体步骤:
步骤4-1:在记忆回放池中选取一小批训练样本数据(st,at,rt,st+1)构成数据集;
步骤4-2:计算Q估计为
yt=rt+γmaxQ(st+1,at+1;θ′t)
其中γ为折扣率,该值越接近1,表示对未来长期奖励越重视,越接近0,对未来奖励越不敏感,θ′t为目标网络的参数;
步骤4-3:定义损失函数为
Lt(θ)=∑D(yt-Q(st,at;θ))2
其中D为采样集合,即步骤4-1中选取的数据集,yt为表达式4定义的Q估计;
步骤4-4:利用随机梯度下降法计算θt更新后的值为
其中α为迭代步长,Lt(θt)为表达式7定义的损失函数,更新θt使得Q(st,at;θt)尽可能接近于Q估计yt;
步骤4-5:若满足t<T,T为每一回合的总时间步,t为当前时间步,则t=t+1,跳转至
步骤3,否则令t=0,跳转至步骤4-6;
步骤4-6:若满足e<E,E为训练总回合数,e为当前回合数,则e=e+1,跳转至步骤3,否则跳转至步骤5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210516466.1/1.html,转载请声明来源钻瓜专利网。