加 入 年 龄 和 学 习 因 素 的 囚 徒 困 境 的 网 格 演 化 模 型 王 金 龙 范 国 龙 朱 晓 丹 李 庆 媛
囚 徒 困 境 模 型 已 经 广 泛 应 用 于 研 究 利 他 和 自 私 个 体 之 间 的 相 互 作 用 囚 徒 困 境 是 一 种 有 两 个 个 体 参 与 的 博 弈, 个 体 持 有 两 种 策 略 中 的 一 种 策 略 :C: 合 作 或 者 D: 背 叛, 两 个 个 体 进 行 一 次 博 弈 后 的 收 益 (payoff) 矩 阵 如 下 表 : R:reward( 双 方 都 合 作 时, 双 方 的 收 益 都 为 R,R=1.00); P:punishment( 双 方 都 背 叛 时, 双 方 的 收 益 都 为 P,P=0.00); T: temptation( 一 方 背 叛, 一 方 合 作 时, 合 作 方 的 收 益 为 T, R<T<2R); S: sucker( 一 方 背 叛, 一 方 合 作 时, 背 叛 方 的 收 益 为 S, S=0.00)
囚 徒 困 境 模 型 的 空 间 演 化 博 弈 [1] Martin.A.Nowak & Robert.M.May 将 囚 徒 困 境 引 入 空 间 演 化 博 弈 (Spatial Evolutionary Games) 中, N 个 体 被 放 置 在 二 维 的 L L的 方 格 图 中, 方 格 图 是 周 期 边 界 的, 每 个 个 体 等 概 率 随 机 赋 予 一 种 策 略 :C 或 者 D, 演 化 以 离 散 时 间 步 进 行 每 一 时 间 步 内 : 个 体 和 与 自 己 最 近 的 四 个 邻 居 以 及 自 身 进 行 囚 徒 困 境 博 弈, 累 积 每 次 博 弈 的 收 益 (offspring) 相 邻 两 个 时 间 步 之 间 : 每 个 个 体 在 一 个 时 间 步 后 选 择 四 个 邻 居 和 自 己 中 五 个 人 中 收 益 最 高 的 个 体 的 策 略, 学 习 该 个 体 的 策 略 然 后 所 有 个 体 收 益 归 0, 进 行 下 一 个 时 间 步 最 终 的 结 果 与 初 始 化 的 形 态 和 参 数 T 的 选 取 有 关 系
Szabó and Tőke 通 过 在 Martin.A.Nowak & Robert.M.May 的 空 间 演 化 博 弈 的 框 架 中 引 入 蒙 特 卡 罗 方 法, 将 确 定 模 型 变 为 一 个 随 机 模 型 [2]: 首 先 一 个 从 L L 个 个 体 中 随 机 抽 取 的 个 体 x 与 四 个 邻 居 博 弈 获 得 收 益 P x, 然 后 从 四 个 邻 居 中 随 机 抽 取 一 个 邻 居 y 并 计 算 其 收 益 P y 个 体 x 将 自 己 的 策 略 传 播 给 邻 居 y 的 概 率 为 : 1 W( sx sy) = 1 + exp(( P P) / K) y x 概 率 W 与 两 个 体 收 益 差 Py Px有 关,K 为 一 个 可 调 参 数, 代 表 噪 音 幅 度 一 个 完 整 的 蒙 特 卡 罗 步 骤 包 括 所 有 个 体 平 均 拥 有 一 次 机 会 向 邻 居 传 递 策 略 群 体 中 合 作 者 的 比 例 P c 经 过 n 个 蒙 特 卡 罗 步 骤 后 稳 定,n 大 小 由 参 数 K 和 参 数 T 决 定
Pc 作 为 T 的 函 数 当 T < T, P 恒 等 于 1, 当 T > T 时, 恒 等 c 1 c c 2 P c 于 0 当 k=0.1 时, P c 作 为 T 的 函 数 图 像 如 下 :
K=0.5, 函 数 的 图 像 如 下 : P c 如 图 所 示 函 数 P 在 P c c 1和 Pc 0 时 呈 现 出 指 数 函 数 的 特 征 [2]
复 杂 网 络 上 囚 徒 困 境 的 演 化 博 弈 后 来 人 们 将 复 杂 网 络 引 入 来 研 究 囚 徒 困 境 的 空 间 演 化 博 弈, 发 现 个 体 之 间 的 拓 扑 结 构 对 合 作 的 产 生 有 影 响 [][] 在 各 种 复 杂 网 络 中 : 无 标 度 网 络 (SF) 最 有 利 于 合 作 的 产 生 [3] 在 复 杂 网 络 的 研 究 中, 人 们 注 意 到 异 质 (heterogeneous) 在 促 进 合 作 产 生 的 过 程 中 起 到 重 要 作 用 所 谓 异 质 性 在 一 些 复 杂 网 络 中 表 示 不 同 个 体 的 度 (degree) 不 相 同, 即 他 们 的 邻 居 数 量 不 相 同 [4 7] 而 不 同 网 络 的 模 拟 结 果 显 示, 异 质 性 越 大 的 网 络 越 有 利 于 合 作 的 产 生 [4]
为 进 一 步 研 究 异 质 性 对 合 作 产 生 的 影 响, 并 且 考 虑 到 真 实 社 会 中 某 些 人 影 响 力 大 某 些 人 影 响 力 小, 人 们 在 Szabó and Tőke 的 模 型 中 引 入 新 的 参 数, 我 们 称 之 为 策 略 传 输 的 能 力 或 者 称 之 为 影 响 力 A [8 11] 任 意 时 刻 两 个 个 体 之 间 的 影 响 力 通 常 是 不 对 称 的, 即 t 时 刻 个 体 i 对 个 体 j 的 影 响 力 不 等 于 个 体 j 对 个 体 i 的 影 响 力 : A () t A () t ij ji 在 第 t 个 蒙 特 卡 罗 步 骤 中 个 体 i 传 输 策 略 给 个 体 j 的 概 率 为 : 1 W( si sj) = Aij( t) 1 + exp(( P P )/ K ) 影 响 力 A 也 随 步 骤 增 加 而 演 化 j i
由 于 现 实 社 会 中, 个 体 的 知 识 和 智 慧 随 年 龄 的 上 升 而 积 累, 人 们 将 年 龄 引 入 囚 徒 困 境 的 演 化 博 弈 中, 将 其 作 为 衡 量 个 体 策 略 传 输 能 力 的 一 个 参 数 [12] 于 是 在 蒙 特 卡 罗 步 骤 中 个 体 x 传 输 策 略 给 个 体 y 的 概 率 表 达 式 表 示 为 : W( s s ) = w x y x 1 1+ exp(( P P)/ K) y x 其 中 wx 为 个 体 x 传 输 策 略 的 能 力, wx 与 个 体 x 的 能 力 有 ex α 关 w, x = ( ) e emax ex max, 为 最 大 年 龄, 定 为 99, 为 个 体 x 的 当 前 年 龄
Impact of aging on the evolution of cooperation in the spatial prisoner s dilemma game L*L 格 子 的 群 体, 每 个 格 子 内 存 放 一 个 个 体, 每 个 个 体 都 与 四 个 邻 居 相 连 初 始 时 候, 随 机 决 定 每 个 个 体 的 策 略 (C: 合 作 or D: 背 叛 ); 每 轮 游 戏 重 复 进 行 L*L 次 蒙 特 卡 洛 模 拟 这 样 每 轮 游 戏 中, 每 个 个 体 平 均 都 有 一 次 机 会 被 选 中
随 机 选 择 个 体 x, 依 次 与 四 个 邻 居 进 行 游 戏, 收 益 为 p x ; 随 机 选 择 x 的 一 个 邻 居 y,y 与 其 四 个 邻 居 进 行 游 戏, 收 益 为 p y ; 个 体 x 试 图 将 自 己 的 策 略 传 授 给 个 体 y, 其 可 能 性 为 W = w ( s > s ) x x y 1 1+ exp[( p p)/ K] y x
K: 噪 声 的 振 幅 ; 1/K: 选 择 强 度 ; w x : 个 体 x 传 递 自 己 策 略 的 能 力, 这 种 能 力 与 个 体 的 年 龄 相 关 W x =[e x /e max ] α, e x =0, 1, e max,α=0,1 or 2; 每 次 游 戏 以 后,x 和 y 的 收 益 都 清 零 ;
Quenched Age Model 中 每 轮 游 戏 以 后 个 体 的 年 龄 不 变 ; Evolving Age Model 中 每 轮 游 戏 以 后 个 体 的 年 龄 均 加 1( 超 过 e max 的 年 龄 归 零 ), 但 是 Model A 中, 接 受 邻 居 策 略 的 个 体 年 龄 不 改 变 ; Model B 中, 接 受 邻 居 策 略 的 个 体 年 龄 归 零
Quenched Age Model α=1 α=2 α=0
No Age Model Model A Quenched Age Model Model B Evolving Age Model
Model B Quenched Age Model/Model A
EFFECTS OF LEARNING ACTIVITY ON COOPERATION IN EVOLUTIONARY PRISONER'S DILEMMA GAME 构 建 WS model(a typical model of smallworld network) 和 the BA model(a typical model of scale free network) 的 网 络, 网 络 的 每 个 结 点 放 置 一 个 个 体, 随 机 为 其 安 排 策 略 (C: 合 作 or D: 背 叛 );
每 轮 游 戏 中, 每 个 个 体 都 要 和 他 的 所 有 邻 居 进 行 一 次 游 戏 游 戏, 收 益 为 P = S A S T x x y y Ω x S = (1, 0) T (0,1) T C S = R S A= ( T= br, = 1, P= S= 0) T P D
每 个 个 体 随 机 选 择 一 个 邻 居, 以 一 定 的 概 率 学 习 邻 居 的 策 略, 学 习 邻 居 的 概 率 为 W ( s < s ) = x y w 1 1+ exp[( p / k p / k ) / K] x x y y W: learning rate( 所 有 个 体 一 致 ) p: 个 体 的 收 益 ; k: 个 体 的 连 接 度 ; K: 噪 声 的 振 幅 ; 1/K: 选 择 强 度 ;
模 型 规 则 L*L 格 子 的 群 体, 每 个 格 子 内 存 放 一 个 个 体, 每 个 个 体 都 与 四 个 邻 居 相 连 初 始 时 候, 随 机 决 定 每 个 个 体 的 策 略 (C: 合 作 or D: 背 叛 ); 每 轮 游 戏 重 复 进 行 L*L 次 蒙 特 卡 洛 模 拟 这 样 每 轮 游 戏 中, 每 个 个 体 平 均 都 有 一 次 机 会 被 选 中
随 机 选 择 个 体 x, 依 次 与 四 个 邻 居 进 行 游 戏, 收 益 为 p x ; 随 机 选 择 x 的 一 个 邻 居 y,y 与 其 四 个 邻 居 进 行 游 戏, 收 益 为 p y ; 个 体 x 试 图 将 自 己 的 策 略 传 授 给 个 体 y, 其 可 能 性 为 W = w w ( s > s ) x y x y 1 1+ exp[( p p ) / K] y x
K: 噪 声 的 振 幅 ; 1/K: 选 择 强 度 ;( 模 拟 时, 取 K=1) w x : 个 体 x 传 递 自 己 策 略 的 能 力, 这 种 能 力 与 个 体 的 年 龄 相 关 W x =[e x /e max ] α, e x =0, 1, e max,α=0,1 or 2; W y : 个 体 y 接 受 邻 居 策 略 的 能 力, 这 种 能 力 与 个 体 的 年 龄 相 关 W y =[ (e max e y )/e max ] β, e y =0, 1, e max,β=0,1 or 2; 每 次 游 戏 以 后,x 和 y 的 收 益 都 清 零 ;
Quenched Age Model 中 每 轮 游 戏 以 后 个 体 的 年 龄 不 变 ; Evolving Age Model 中 每 轮 游 戏 以 后 个 体 的 年 龄 均 加 1( 超 过 e max 的 年 龄 归 零 ), 但 是 Model A 中, 接 受 邻 居 策 略 的 个 体 年 龄 不 改 变 ; Model B 中, 接 受 邻 居 策 略 的 个 体 年 龄 归 零
α=2,β=0 1.2 Frequency of Cooperators 1 0.8 0.6 0.4 0.2 No Age Model Quenched Age Model Model A Model B 0 1 1.02 1.04 1.06 1.08 1.1 1.12 1.14 1.16 1.18 1.2 1.22 1.24 1.26 1.28 b
α=0,β=2 1.2 Frequency of Cooperators 1 0.8 0.6 0.4 0.2 No Age Model Quenched Age Model Model A Model B 0 1 1.02 1.04 1.06 1.08 1.1 1.12 1.14 1.16 1.18 1.2 1.22 1.24 1.26 1.28 b
α=2,β=2 1.2 Frequency of Cooperators 1 0.8 0.6 0.4 0.2 No Age Model Quenched Age Model Model A Model B 0 1 1.02 1.04 1.06 1.08 1.1 1.12 1.14 1.16 1.18 1.2 1.22 1.24 1.26 1.28 b
Quenched Age Model 1.2 Frequency of Cooperators 1 0.8 0.6 0.4 0.2 No Age Model α=2,β=0 α=0,β=2 α=2,β=2 0 1 1.02 1.04 1.06 1.08 1.1 1.12 1.14 1.16 1.18 1.2 1.22 1.24 1.26 1.28 b
Evolving Age Model(Model A) 1.2 Frequency of Cooperators 1 0.8 0.6 0.4 0.2 No Age Model α=2,β=0 α=0,β=2 α=2,β=2 0 1 1.02 1.04 1.06 1.08 1.1 1.12 1.14 1.16 1.18 1.2 1.22 1.24 1.26 1.28 b
Evolving Age Model(Model B) 1.2 Frequency of Cooperators 1 0.8 0.6 0.4 0.2 No Age Model α=2,β=0 α=0,β=2 α=2,β=2 0 1 1.02 1.04 1.06 1.08 1.1 1.12 1.14 1.16 1.18 1.2 1.22 1.24 1.26 1.28 b
引 用 : [1] M. A. Nowak and R. M. May, Nature London 359, 826 (1992). [2] G. Szabó and C. Tőke, Phys. Rev. E 58, 69 (1998). [3] F. C. Santos and J. M. Pacheco, Phys. Rev. Lett. 95, 098104 (2005). [4] F. C. Santos and J. M. Pacheco, J. Evol. Biol. 19, 726 (2006). [5] M. Tomassini, L. Luthi, and E. Pestelacci, Int. J. Mod. Phys. C 18, 1173 (2007). [6] N. Masuda, Proc. Jpn. Acad., Ser. B: Phys. Biol. Sci. 274,1815 (2007). [7] A. Szolnoki, M. Perc, and Z. Danku, Physica A 387, 2075 (2008). [8] B. J. Kim, A. Trusina, P. Holme, P. Minnhagen, J. S. Chung, and M. Y. Choi, Phys. Rev. E 66, 021907 (2002). [9] Z. X. Wu, X. J. Xu, Z. G. Huang, S. J. Wang, and Y. H. Wang,Phys. Rev. E 74, 021107 (2006).
[10] A. Szolnoki and G. Szabó, EPL 77, 30004 (2007). [11] J. Y. Guan, Z. X. Wu, and Y. H. Wang, Phys. Rev. E 76, 056101 (2007). [12] Attila Szolnoki, Matjaž Perc, György Szabó, and Hans Ulrich Stark, Phys. Rev. E 80, 021901 (2009)