[发明专利]一种基于改进强化免疫算法的农业物联网资源调配方法有效
申请号: | 201711082820.X | 申请日: | 2017-11-07 |
公开(公告)号: | CN107730393B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 郝矿荣;蒋益敏;丁永生 | 申请(专利权)人: | 东华大学 |
主分类号: | G06Q50/02 | 分类号: | G06Q50/02;G06Q10/08;G06N3/12 |
代理公司: | 上海统摄知识产权代理事务所(普通合伙) 31303 | 代理人: | 金利琴 |
地址: | 201620 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 强化 免疫 算法 农业 联网 资源 调配 方法 | ||
1.一种基于改进强化免疫算法的农业物联网资源调配方法,其特征是:采用物联网技术获取农业中各资源需求点和供应点的相关信息,利用改进强化免疫算法实现各供应点通过调配车辆对各需求点进行资源高效调配;
所述改进强化免疫算法是指利用强化学习思想对免疫算法进行改进后得到的算法,所述改进的算法为:首先根据车辆所在的资源供应点与需求点之间的距离初始化Q表,然后在每一次迭代中根据当前适应度值最小的抗体更新Q表,并在变异阶段用当前Q表指导其变异,同时,当Q表出现连续在相同位置更新时,调整Q表跳出局部最优;
利用改进强化免疫算法实现资源高效调配的过程是以调配方案为抗体并以最大迭代次数MAXGEN为终止条件的改进强化免疫算法的优化过程;
利用改进强化免疫算法实现资源高效调配的具体步骤如下:
(1)初始化资源调配所需要的数据和改进强化免疫算法所需要的必要参数;
所述资源调配所需要的数据包括:资源需求点总数H及各个资源需求点对N种资源的需求量、资源供应点总数T及各个资源供应点的N种资源的储备量、运输车辆总数C、车辆最大承载量P、各资源需求点和供应点的位置信息;
所述改进强化免疫算法所需要的必要参数包括:抗体群规模W、记忆库容量w、优势抗体保留个数s、最大迭代次数MAXGEN、多样性评价参数ps、交叉概率pc、变异概率pm、强化学习行动探索概率ε和基因选择概率μ;
(2)初始化Q表;
先生成一个(H×N)×C的矩阵代表强化学习的行动策略准则Q表,Q表中的每一个元素Qin,k表示资源需求点i中的资源n选用车辆k调配所对应的行为分数,in=11,21,...,H1,12,22,...,H2,...,1N,2N,...,HN,k=1,2,...,C,再按照优先原则初始化Q表,即根据车辆所在的资源供应点与需求点之间的距离来初始分配行为分数;
(3)初始化抗体群;
随机生成一个大小为(W+w)×(H×N)的矩阵作为抗体群,矩阵的行向量表示抗体群中的一个抗体,即一个调配方案,中的每个元素的值表示负责为资源需求点i调配资源n的车辆序号,i=1,...,H,n=1,...,N,b表示抗体序号,b∈{1,…,W+w},G表示当前迭代序数,G∈{1,…,MAXGEN};
(4)抗体群多样性评价,即分别计算抗体群中的抗体适应度值、抗体间的相似度、抗体浓度和抗体期望繁殖概率;
(4.1)适应度函数为:
两个约束条件为:
根据抗体:
中每一位的取值提取出每一辆车为需求点调配资源的服务序列其中,i=1,...,H,n=1,...,N,iu∈{1,…,H},iu表示该车辆经过的第u个需求点序号,u=1,...,q,nuv∈{1,…,N},nuv表示该车辆经过的第u个需求点需要的第v种资源序号,v=1,...,Zu,q表示该车辆经过需求点总数,Zu表示第u个需求点所需资源种类总数;
提取规则为:对抗体进行逐位判断,若的抗体位取值为k,则将服务序号in加入到对应的车辆k的服务序列Uk,b,G中;在Uk,b,G的基础上,提取每一辆车的服务需求点序列Sk,b,G={i1,i2,…,iq},提取规则为:将Uk,b,G中的每一个iunuv,根据u值把u相同的iunuv合并为iu;
抗体适应度值为:
其中:dij是指需求点i到j的距离,下标为0代表对应的供应点;Rin是指需求点i对资源n的需求量;pk是指车辆k的实际承载资源量;mtn是指资源供应点t中资源n的实际调配量;Mtn是指资源供应点t中资源n的资源储备量;
两个决策变量如下:
当xijk=1时,i,j∈Sk,b,G;
当yiktn=1时,in∈Uk,b,G;
(4.2)抗体间的相似度的计算公式为:
其中:b,l代表每次迭代初始时抗体群中两个不同的抗体sameb,l为抗体含有相同数值的位数,H×N为抗体长度;
(4.3)抗体浓度的计算公式为:
其中,
(4.4)抗体期望繁殖概率的计算公式为:
(5)记录当前最优适应度值、计算平均适应度值并更新Q表;
记录当前最优适应度值并计算平均适应度值,当前最优适应度值即为当前适应度值的最小值;以当前适应度值最小的抗体作为最优抗体如最优抗体是可行解,则根据它更新Q表中的行为分数:根据最优抗体中的每一个元素
若Q表出现连续在相同位置更新时,需要随机更换同一供应点中任意两辆车所对应Q表的分数,以此来更新Q表跳出局部最优;若Q表在某次更新后,优先原则遭到破坏,则将破坏优先原则的元素位置重置为优先位,更新优先原则并重置Q表;
(6)更新记忆库,形成父代群;
先根据优势抗体保留个数s的值,将按抗体适应度值升序排列的前s个抗体取出进行精英保留,再将剩余抗体按照抗体期望繁殖概率进行降序排列,取前w-s个抗体与精英保留的s个抗体一同存入并更新抗体记忆库,取前W-s个抗体与精英保留的s个抗体形成W个抗体,判断最优抗体中每个基因位的值是否等于Q表中对应行为分数最大的值,若符合,则将这W个抗体形成父代群,若不符合,则将次优抗体替换成最优抗体,次优抗体为当前适应度值次小的抗体,同时将次优抗体根据Q表更新,再将W个抗体形成父代群;
(7)抗体进化,即对父代群中每一个抗体进行免疫操作进化,具体包括选择、交叉和强化变异操作;
(7.1)选择;根据抗体繁殖概率,通过轮盘赌的方式选择父代群中的抗体,每次轮盘操作选择出一个抗体,W次轮盘操作选择W个抗体,抗体繁殖概率越大则被选择的几率就越大;
(7.2)交叉;随机选择两个父代抗体,判断是否超过预先设定的交叉概率pc,若超过,则不进行交叉操作;若没超过则进行交叉操作:在抗体长度H×N范围内随机选择任意两个位置的两段等长基因片段,在两个位置上交叉互换基因片段,形成新的两个抗体;W次交叉操作后,得到新的抗体群;
(7.3)强化变异;从上述交叉操作产生的新抗体群中随机选择一个抗体,判断是否超过预先设定的变异概率pm,若超过,则不进行强化变异操作;若没超过则进行强化变异操作:该抗体以1-ε的概率根据Q表变异,即抗体中每个基因片段以基因选择概率μ随机根据Q表选择到目前为止最好的行动策略,同时以ε的概率选择行动策略空间中的任一行动策略,即将抗体中的某个基因随机突变;对产生变异动作的抗体进行再检验操作,即将这些抗体的每个基因位按序搜索其他可选值,在上述步骤的基础上执行最优变异动作;W次强化变异操作后,得到新的抗体群;
(8)判断终止条件;
判断是否达到最大迭代次数MAXGEN,若否,则将存储在记忆库中的w个抗体添加至经过免疫操作产生的W个抗体组成的抗体群中,形成下一次迭代的W+w个抗体,继续进行新一轮迭代,跳转至步骤(4)进行抗体群多样性评价;若是,则输出最优抗体即最优调配方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711082820.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种释义方法及一种释义装置
- 下一篇:获取数据集的方法和装置