博弈论学习 | 第七章 Evolutionary Game Theory
Chapter 7 Evolutionary Game Theory
1. Fitness as a Result of Interaction
Evolutionary game theory進(jìn)化博弈論
結(jié)合進(jìn)化思想的博弈游戲與之前的區(qū)別在于,決策不是由選擇決定的,而是由基因gene決定,所以需要考慮在更長(zhǎng)的時(shí)間尺度上的變化,反饋的payoff也是由種群適應(yīng)度來表示fitness。
fitness:類比前面的payoff
gene:類比前面的可選策略。
甲殼蟲例子:由于天生基因決定出現(xiàn)了兩種甲蟲——大甲蟲和小甲蟲。甲蟲互相爭(zhēng)奪食物,當(dāng)相同大小的甲蟲競(jìng)爭(zhēng)會(huì)獲得相同的食物份額,當(dāng)一只大甲蟲與一只小甲蟲競(jìng)爭(zhēng)時(shí),大甲蟲會(huì)得到大部分的食物。當(dāng)兩個(gè)大甲蟲相遇時(shí),由于競(jìng)爭(zhēng)必須消耗額外的能量,所以不能獲得全部fitness。
2. Evolutionarily Stable Strategies(ESS)
Evolutionarily Stable Strategies定義
一種由基因決定的策略,一旦在種群中流行,它往往會(huì)持續(xù)存在。如果當(dāng)整個(gè)種群使用該策略時(shí),任何使用不同策略的最終會(huì)在多代人中消亡,我們說一個(gè)給定的策略是進(jìn)化Evolutionarily Stable的。
ESS在甲蟲種群的例子
對(duì)小甲蟲的種群來說:
假設(shè)存在極小值$\varepsilon 在種群發(fā)生突變得到大甲蟲,則有1?在種群發(fā)生突變得到大甲蟲,則有1-在種群發(fā)生突變得到大甲蟲,則有1?\varepsilon $得到小甲蟲。那么小甲蟲的預(yù)期payoff為:
5(1?ε)+1?ε=5?4ε5(1-\varepsilon )+1 \cdot \varepsilon =5-4 \varepsilon 5(1?ε)+1?ε=5?4ε
大甲蟲的預(yù)期payoff為:
8(1?ε)+3?ε=8?5ε8(1-\varepsilon )+3 \cdot \varepsilon =8-5 \varepsilon 8(1?ε)+3?ε=8?5ε
對(duì)于足夠小的$\varepsilon $,大甲蟲的預(yù)期適應(yīng)度超過了小甲蟲的預(yù)期適應(yīng)度。因此,小甲蟲種群并不是進(jìn)化穩(wěn)定的。
對(duì)大甲蟲的種群來說:
假設(shè)存在極小值$\varepsilon 在種群發(fā)生突變得到小甲蟲,則有1?在種群發(fā)生突變得到小甲蟲,則有1-在種群發(fā)生突變得到小甲蟲,則有1?\varepsilon $得到大甲蟲。那么小甲蟲的預(yù)期payoff為:
(1?ε)+5?ε=1+4ε(1-\varepsilon)+5 \cdot \varepsilon=1+4 \varepsilon (1?ε)+5?ε=1+4ε
大甲蟲payoff:
3(1?ε)+8?ε=3+5ε3(1-\varepsilon)+8 \cdot \varepsilon=3+5 \varepsilon 3(1?ε)+8?ε=3+5ε
小甲蟲的預(yù)期payoff為:
對(duì)于足夠小的$\varepsilon $,大甲蟲的預(yù)期適應(yīng)度超過了小甲蟲的預(yù)期適應(yīng)度,因此大甲蟲種群在進(jìn)化上是穩(wěn)定的。
3. A General Description of Evolutionarily Stable Strategies
開始討論更加一般化的雙人對(duì)稱進(jìn)化博弈。
對(duì)S種群來說,存在變異體T物種的入侵,同樣假設(shè)存在極小值$\varepsilon ,種群的,種群的,種群的\varepsilon 部分變異成為使用T物種,種群的1?部分變異成為使用T物種,種群的1?部分變異成為使用T物種,種群的1?\varepsilon $部分仍然為S物種。
S的payoff:
a(1?ε)+bεa(1-\varepsilon)+b \varepsilon a(1?ε)+bε
T的payoff:
c(1?ε)+dεc(1-\varepsilon)+d \varepsilon c(1?ε)+dε
因此,如果對(duì)于ε\varepsilonε>0的所有足夠小的值,則S是進(jìn)化穩(wěn)定的條件是:
a(1?ε)+bε>c(1?ε)+dεa(1-\varepsilon)+b \varepsilon>c(1-\varepsilon)+d \varepsilon a(1?ε)+bε>c(1?ε)+dε
所以得到需要滿足的條件是:
4. Relationship Between Evolutionary and Nash Equilibria
結(jié)論:ESS一定是納什均衡,納什均衡不一定是ESS。
對(duì)上面的例子,納什均衡(NE)的條件是:
a≥ca \geq c a≥c
進(jìn)化穩(wěn)定策略(ESS)的條件是:
(i)?a>c,?or?(ii)?a=cand?b>d,?\text { (i) } a>c \text {, or (ii) } a=c \text { and } b>d \text {, } ?(i)?a>c,?or?(ii)?a=c?and?b>d,?
所以存在a=c,但b<d的情況使得(S,S)不是進(jìn)化穩(wěn)定的。
同理對(duì)嚴(yán)格納什均衡(Strict NE)的條件:
a>ca \gt c a>c
最終結(jié)論:
StrictNE?ESS?NEStrict \ NE \subseteq ESS \subseteq NE Strict?NE?ESS?NE
5. Evolutionarily Stable Mixed Strategies
現(xiàn)在考慮如何處理沒有策略是進(jìn)化穩(wěn)定的情況。用混合策略來描述進(jìn)化穩(wěn)定性,實(shí)際擴(kuò)大了可能的策略集,每個(gè)策略相比純策略是對(duì)應(yīng)一個(gè)特定概率的策略。
進(jìn)化穩(wěn)定混合策略可以從兩個(gè)角度理解:
可能是每個(gè)人都天生會(huì)玩純策略,但一部分人玩一種策略,而其余的人玩另一種策略。
可能是每個(gè)人都在玩一種特定的混合策略,他們的基因指定他們會(huì)在特定概率的特定選項(xiàng)中隨機(jī)選擇。
對(duì)雙人對(duì)稱博弈來說:
動(dòng)物有p概率成為S,有1-p概率成為T,q同理。所以對(duì)一個(gè)動(dòng)物的期望收益為:
V(p,q)=pqa+p(1?q)b+(1?p)qc+(1?p)(1?q)dV(p, q)=p q a+p(1-q) b+(1-p) q c+(1-p)(1-q) d V(p,q)=pqa+p(1?q)b+(1?p)qc+(1?p)(1?q)d
Evolutionarily Stable Mixed Strategies定義:
對(duì)混合策略來說,存在一種均衡狀態(tài)使得原物種和入侵者能夠共同生存。在這種均衡狀態(tài)下,原物種和入侵者分別以某種種群比率不斷繁衍遺傳,從而達(dá)到混合ESS。
特別的是,S是一個(gè)進(jìn)化穩(wěn)定的純策略,但在p=1的新定義下,它也不一定是一個(gè)進(jìn)化穩(wěn)定的混合策略。
混合納什均衡的條件:
(1?x)V(p,p)+xV(p,q)≥(1?x)V(q,p)+xV(q,q)(1-x) V(p, p)+x V(p, q)\geq(1-x) V(q, p)+x V(q, q) (1?x)V(p,p)+xV(p,q)≥(1?x)V(q,p)+xV(q,q)
混合ESS的條件:
(1?x)V(p,p)+xV(p,q)>(1?x)V(q,p)+xV(q,q)且q≠p(1-x) V(p, p)+x V(p, q)>(1-x) V(q, p)+x V(q, q) 且 q \neq p (1?x)V(p,p)+xV(p,q)>(1?x)V(q,p)+xV(q,q)且q?=p
總結(jié)
以上是生活随笔為你收集整理的博弈论学习 | 第七章 Evolutionary Game Theory的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [react] 说说你喜欢react的原
- 下一篇: 【AtCoder】ARC095 E -