[发明专利]奖惩机制演化博弈模型构建方法、系统及应用在审
申请号: | 202110105123.1 | 申请日: | 2021-01-26 |
公开(公告)号: | CN112801299A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 赵楠;杨棋;陈南;易运晖;张兴才 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q50/00 |
代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 何畏 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 奖惩 机制 演化 博弈 模型 构建 方法 系统 应用 | ||
本发明属于网络信息数据处理技术领域,公开了一种奖惩机制演化博弈模型构建方法、系统及应用,采用外部事件信息流入机制和基于态度行为的奖惩机制;在计算中心个体的自身所拥有信息量能否促使中心个体选择合作时所使用的公式符合随着信息量的增加,合作概率增加同时合作概率增加速率减缓的一般意义,且利用对数函数特性保证模型不会出现随着大量信息渗入社会群体直接快速全合作;利用声望值作为奖惩机制量化标准,在有数理推导的依托下分析社交网络稳定性条件并运用至仿真。本发明对社交网络稳定状态的条件做了探究同时在外界信息流入和对博弈个体的奖励惩罚机制上做了改进。
技术领域
本发明属于网络信息数据处理技术领域,尤其涉及一种奖惩机制演化博弈模型构建方法、系统及应用。
背景技术
目前:“合作行为如何演化”被Science列为未来需要解决的25个最重要的科学问题之一。合作行为也是最普遍的群体行为之一,广泛地存在于各层次的生命系统之中。在演化生物研究领域中,合作常常被认为是除了变异和自然选择之外的第三个基本法则。关于社交网络上的外部信息的流入、扩散继而影响该网络的过程是收到网络内部个体的策略、态度、行为和社会关系的影响的,基于以上因素来探究社交网络的性质以及通过对特定参与者进行奖惩来适度控制群体中的合作行为占比显得尤为重要。而博弈论为研究多个个体之间的合作行为提供了有力的理论框架,其也是研究理性个体在交互过程中做出最优决策的一门重要学科。博弈论主要描述了参与方的个体们在面对利益和目标存在竞争性潜在冲突的背景下理性地选择合作或背叛的行为方式。随着自然选择和变异理论被引入博弈论,博弈论又被分为经典博弈理论和演化博弈理论。其主要区别是参与方的个体们在做决策时的理性程度:所有参与博弈的个体都是完全理性的决策者构成的即为经典博弈理论;基于群体中的参与个体在进行决策抉择的背景为非完全理性个体的研究则被称为演化博弈理论。随着基于博弈论对现实生活中各个体所处的社交网络的研究,研究者们发现以经济学因素作为博弈参与者之间的策略变化因素和行为选择因素的经典博弈理论所考虑的影响因子较少;演化博弈考虑了个体生物特性,在参与者、策略和收益上都和经典博弈理论有着较大的转变,构建的参与博弈的个体最重要的特点是个体的理性程度是有限的,可以更好地体现现实生活中实际参与博弈的个体的特点,更加贴近社会现实情况,其研究结果也更具有现实意义。
而基于复杂网络的演化博弈理论更是扩大了博弈论在现实生活中的应用范围,复杂网络上的合作演化和博弈动力学研究也越来越多。一次完整的经典博弈需要包含四个部分:(1)博弈参与者个体;(2)策略空间;(3)收益函数及交互规则;(4)博弈均衡。而基于复杂网络的社交演化博弈主要考虑的决定性影响因素包括博弈模型和策略更新规则。常见的博弈模型有囚徒困境、雪堆博弈、性别战博弈和智猪博弈等。常见的行为策略的更新规则有:灭生更新过程、生灭更新过程、对比较更新和模仿更新规则等。社交网络上的演化博弈的研究主要集中在三点:(1)研究不同的博弈模型在特定网络中不同演化策略的不同,进而找到稳定演化策略;(2)探究不同网络中、不同模型下可以促进社交网络中博弈个体合作行为的涌现和整个种群合作占比的机制;(3)探究动态可变的复杂网络模型下博弈个体的行为演化特点和影响因素。
奖励和惩罚机制对于重复性博弈中的合作演化的作用也是近年来直接互惠理论和实验研究的重要课题。通过对搭便车的背叛者的惩罚可以在多人公共品博弈中有较好效果,促进多人博弈中的合作涌现,而基于两人囚徒困境的博弈则需要将奖励和惩罚结合在一起,这样既可以避免“搭便车”现象和“二阶搭便车”的现象,也可以通过较低的代价对整个社交网络中的合作行为起到较大的促进推动效果。
从已有的关于社交网络上的内部信息传播、外界信息流入现状以及基于个体与种群态度行为演化的奖惩机制模型可以发现,现有的技术存在的主要问题有:大多只研究了博弈对网络内个体的合作行为单一因素的影响,考虑因素过于简单没有综合考虑外部事件因素、环境态度、个体自身态度对于个体行为的影响,相对来说不够符合现实实际情况;同时为了促进合作行为涌现而构建的奖励惩罚模型缺少更符合现实的探究和解释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110105123.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防爆风机
- 下一篇:一种基于自校准卷积网络的行人检测方法