[发明专利]奖惩机制演化博弈模型构建方法、系统及应用在审
申请号: | 202110105123.1 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112801299A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 赵楠;杨棋;陈南;易运晖;张兴才 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q50/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 何畏 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 奖惩 机制 演化 博弈 模型 构建 方法 系统 应用 | ||
1.一种奖惩机制演化博弈模型构建方法,其特征在于,所述奖惩机制演化博弈模型构建方法采用外部事件信息流入机制和基于态度行为的奖惩机制;
该模型个体自身声望值的大小即衡量用户间行为态度博弈的收益大小的依据;而用户所拥有的信息量大小和其态度行为策略会直接影响该个体的自身声望值,其自身声望值的变动和与邻居声望值的大小的对比又会反过来影响该个体与其他个体链接权重的变化和适应度的变动;
在计算中心个体的自身所拥有信息量能否促使中心个体选择合作时所使用的公式符合随着信息量的增加,合作概率增加同时合作概率增加速率减缓的一般意义,且利用对数函数特性保证模型不会出现随着大量信息渗入社会群体直接快速全合作;
利用声望值直接作为奖惩机制量化标准,在有数理推导的依托下分析社交网络稳定性条件并运用至仿真。
2.如权利要求1所述的奖惩机制演化博弈模型构建方法,其特征在于,所述外部事件信息流入机制考虑网络中个体的自主性和博弈个体的有限理性性:
3.如权利要求1所述的奖惩机制演化博弈模型构建方法,其特征在于,所述奖惩机制演化博弈模型构建方法基于态度行为的奖惩机制下的策略收益矩阵为:
通过计算中心个体选择不同行为策略的期望和行为策略平均期望,得出中心个体选择合作行为策略的复制动态方程并对其求偏导得出:当Δ2-Δ3<0且p<p0时,fq(p,q1)<0,故q1=0为稳定平衡状态,即中心个体会选择在行为上背叛策略;当Δ2-Δ3<0且p>p0时,fq(p,q2)<0,故q2=1为稳定平衡状态,中心个体会选择在行为上合作的策略;当Δ2-Δ3>0时,而1-p>0,所以满足fq(p,q2)<0,q2=1为稳定平衡状态,中心个体也会在行为上选择合作策略,得出社交网络的平衡稳定状态要求,确定仿真时各参数的关系,其中p、q分别为中心个体在态度和行为策略上选择合作的人数频率。
4.如权利要求1所述的奖惩机制演化博弈模型构建方法,其特征在于,所述奖惩机制演化博弈模型构建方法包括以下步骤:
第一步,建立的规则网格网络,进行多轮次的循环演化博弈;
第二步,记录每个个体的行为和态度,对网络中的中心个体的行为选择根据个体邻居态度和自身态度进行适应性调整;
第三步,根据邻居态度对受压力个体行为进行更新;根据中心个体自身态度对知行不合一个体进一步做个体态度策略更新;
第四步,构建基于态度行为的奖惩机制模型收益矩阵。
5.如权利要求4所述的奖惩机制演化博弈模型构建方法,其特征在于,所述奖惩机制演化博弈模型构建方法建立一个大小为L*L的规则网格网络,L根据需模仿的网络规模设定为100、200或400,网络中每一个网格代表一个社交网络中的用户个体;每一个个体都被赋予其特有的属性值,包括(1)初始行为s,初始行为包括合作和背叛;(2)初始声望值R;(3)初始信息量I;(4)初始链接权重w及其上下限[w-e,w+e];(5)链接权重变化值u;
设定博弈收益矩阵M、其主要取决于所采用的博弈模型,采用囚徒困境PDG时,收益矩阵为:
根据个体的初始行为和博弈收益矩阵计算每一个个体的初始博弈收益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110105123.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防爆风机
- 下一篇:一种基于自校准卷积网络的行人检测方法