All-Pay Contests 论文定理推导(博弈论+机制设计)
生活随笔
收集整理的這篇文章主要介紹了
All-Pay Contests 论文定理推导(博弈论+机制设计)
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
All-Pay Contests 論文定理推導(dǎo)(博弈論+機(jī)制設(shè)計(jì))
- 一、Theorem 1 證明過程
- 二、Theorem 2 證明過程
- 三、Corollary 1 證明過程
- 四、存在的問題
- 本文針對(duì)于全支付競(jìng)賽(準(zhǔn)確來說是標(biāo)準(zhǔn)競(jìng)賽)提出兩大結(jié)論:Theorem 1有關(guān)標(biāo)準(zhǔn)競(jìng)賽中參賽者的均衡收益情況;Theorem 2有關(guān)標(biāo)準(zhǔn)競(jìng)賽中參賽者的均衡參與情況。 Theorem1、2需依賴于均衡存在性定理(原文中Corollary 1)。因此本文證明大體分為三部分。
- 三部分的證明之間存在聯(lián)系。Corollary 1證明獨(dú)立,是Theorem1,2成立的基礎(chǔ)。Theorem 1證明依賴于Generic Condition。Theorem 2證明依賴于Generic Condition與Theorem 1。
一、Theorem 1 證明過程
- 總體來說:Theorem 1的證明分為四部分,提出四個(gè)Lemma并分別證明,四個(gè)Lemma組合可推出Theorem 1的內(nèi)容。(基于Generic Condition+均衡存在性)
- Theorem 1內(nèi)容:在標(biāo)準(zhǔn)競(jìng)賽的任意均衡中,每個(gè)參賽者的期望收益都等于其power值與0之間的較大值。(NWN_WNW?中參賽者期望收益為power,NLN_LNL?中參賽者期望收益為0。)
- 選擇一個(gè)標(biāo)準(zhǔn)競(jìng)賽以及一個(gè)競(jìng)賽的均衡G=(G1,...,GN)G=(G_1,...,G_N)G=(G1?,...,GN?)。(任意標(biāo)準(zhǔn)競(jìng)賽均衡存在+任意競(jìng)賽的任意均衡滿足定理1→\rightarrow→定理1得以證明)
- LEAST LEMMA:參賽者在任意均衡GGG中的期望收益至少等于其power與0之間的較大值。
證明:初始分?jǐn)?shù)的存在使得每位參賽者的收益都大于等于0(NLN_LNL?中參賽者iii選擇分?jǐn)?shù)si∈[ai,ri)s_i\in[a_i,r_i)si?∈[ai?,ri?),如果獲勝那么期望收益為正,如果失敗那么不如選擇初始分?jǐn)?shù)保證收益為0)。參賽者劃分為NW,NLN_W,N_LNW?,NL?兩部分,NLN_LNL?中參賽者power小于0故已滿足引理。NWN_WNW?中任意參賽者選擇分?jǐn)?shù)max{ai,T+?},?>0max\{a_i,T+\epsilon\},\epsilon>0max{ai?,T+?},?>0都可以打敗NLN_LNL?中所有n?mn-mn?m位參賽者而獲勝(NLN_LNL?中參賽者reach<T,因此不會(huì)出價(jià)大于等于T)。由此可得:(參賽者iii百分百選擇最高的分?jǐn)?shù)獲勝,伴隨著最大的代價(jià),因此是期望收益的下界)
ui≥vi(max{ai,T+?})→?→0vi(max{ai,T})=wiu_i\ge v_i(max\{a_i,T+\epsilon\})\rightarrow_{\epsilon\rightarrow0}v_i(max\{a_i,T\})=w_i ui?≥vi?(max{ai?,T+?})→?→0?vi?(max{ai?,T})=wi?
由上式可得NWN_WNW?中參賽則期望收益大于等于其power(NWN_WNW?中參賽則的power>0)。綜上,LEAST LEMMA得證。
作用:證明了任意均衡中所有參賽者期望收益都至少為power與0之間的較大值(定理1的下界部分)。
- TIE LEMMA:假設(shè)在均衡GGG中兩個(gè)以上的參賽者為分?jǐn)?shù)xxx分配了概率,也就是說以嚴(yán)格正值概率選擇xxx。那么為分?jǐn)?shù)xxx分配了概率的參賽者們?nèi)绻x擇xxx要么一定一起獲勝要么一定一起失敗。
證明:為分?jǐn)?shù)xxx分配了概率的參賽者集合為N′,∣N′∣≥2N',|N'|\ge 2N′,∣N′∣≥2。事件N′N'N′中所有參賽者選擇分?jǐn)?shù)xxx定義為EEE。xxx為獲獎(jiǎng)分?jǐn)?shù)并且xxx出現(xiàn)同分?jǐn)?shù)的事件定義為DDD(m′m'm′個(gè)獎(jiǎng)項(xiàng)分配給N′N'N′中∣N′∣|N'|∣N′∣個(gè)參賽者,且1≤m′<∣N′∣1\le m' <|N'|1≤m′<∣N′∣)。假設(shè)DDD有嚴(yán)格正值概率,在DDD的基礎(chǔ)上,至少有一位參賽者i∈N′i\in N'i∈N′可以通過選擇略大于xxx的分?jǐn)?shù)從而獲勝。因此事件DDD并不滿足最優(yōu)響應(yīng),換句話說任意均衡中不可能出現(xiàn)事件DDD。因此P(E)=P(EL)+P(EW)P(E)=P(E^L)+P(E^W)P(E)=P(EL)+P(EW),其中,P(EL)P(E^L)P(EL)表示出現(xiàn)事件EEE且N′N'N′中所有參賽者全部失敗,P(EW)P(E^W)P(EW)表示出現(xiàn)事件EEE且N′N'N′中所有參賽者全部獲勝,DDD事件不存在均衡中,因此無第三種部分獲勝部分失敗的情況。因此在EEE的基礎(chǔ)上,要么EWE^WEW成立要么ELE^LEL成立。TIE LEMMA得證。
作用:均衡中可能會(huì)有多位參賽者為某個(gè)分?jǐn)?shù)附以概率。TIE LEMMA消除了那些平分?jǐn)?shù)參賽者中部分獲勝的情況。均衡中無上述情況有助于確定哪些參賽者的期望收益為0。
(該引理說的是,在均衡中不會(huì)出現(xiàn)平局卡在分?jǐn)?shù)xxx上,因?yàn)閺慕Y(jié)果反推的角度,平局中至少有一個(gè)參賽者可以略微提高分?jǐn)?shù)從而必勝。但實(shí)際上,參賽者不會(huì)知道是否會(huì)發(fā)生平局,因此也無法做出策略調(diào)整規(guī)避掉平局的均衡?其實(shí)還是考慮博弈的過程是否會(huì)向著均衡的方向演化)
- ZERO LEMMA:在均衡GGG中,至少有n?mn-mn?m位參賽者針對(duì)于他們獲勝概率等于0或者接近于0的情況做出最優(yōu)響應(yīng)。這些參賽者期望收益最大是0。
證明:用JJJ表示某個(gè)m+1m+1m+1位參賽者的集合。用S~\tilde{S}S~表示JJJ中參賽者最優(yōu)響應(yīng)集合的聯(lián)合。用sinfs_{inf}sinf?表示S~\tilde{S}S~(笛卡爾積)的下確界。一共有三種情況:(1)JJJ有兩個(gè)及以上的參賽者針對(duì)分?jǐn)?shù)sinfs_{inf}sinf?附以正值概率。(2)JJJ只有一個(gè)的參賽者針對(duì)分?jǐn)?shù)sinfs_{inf}sinf?附以正值概率。(3)JJJ沒有參賽者針對(duì)分?jǐn)?shù)sinfs_{inf}sinf?附以正值概率。
情況(1):用N′N'N′表示JJJ中針對(duì)分?jǐn)?shù)sinfs_{inf}sinf?附以正值概率的參賽者。對(duì)于N′N'N′中每位參賽者來說不可能成立Pi(sinf)=1P_i(s_{inf})=1Pi?(sinf?)=1,由此根據(jù)TIE LEMMA得到:對(duì)于N′N'N′中每位參賽者來說一定成立Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0。
情況(2):用iii來表示JJJ中唯一一個(gè)針對(duì)分?jǐn)?shù)sinfs_{inf}sinf?附以正值概率的參賽者。Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0一定成立(因?yàn)?span id="ozvdkddzhkzd" class="katex--inline">JJJ中其余m位參賽者選擇分?jǐn)?shù)一定大于sinfs_{inf}sinf?)。由此(1)(2)可得:任意m+1位參賽者的集合JJJ中,可能選擇分?jǐn)?shù)下確界的參賽者一定成立Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0,并且針對(duì)獲勝概率為0的情況選擇分?jǐn)?shù)sinfs_{inf}sinf?也是其最優(yōu)響應(yīng)。
情況(3):根據(jù)下確界sinfs_{inf}sinf?的定義,一定存在某位參賽者i其最優(yōu)響應(yīng){xn}n=1∞\{x_n\}^\infty _{n=1}{xn?}n=1∞?接近于sinfs_{inf}sinf?。當(dāng)nnn趨向于無窮時(shí),Pi(xn)P_i(x_n)Pi?(xn?)接近于0。
因?yàn)?span id="ozvdkddzhkzd" class="katex--inline">JJJ是任意一個(gè)包含m+1位參賽者的集合,因此任意均衡中至少有n-m位參賽者是針對(duì)其獲勝概率等于0或接近于0做出的最優(yōu)響應(yīng)。(類似鴿籠原理,假設(shè)只有n-m-1個(gè)人成立,那么存在某個(gè)m+1個(gè)人中沒有人成立)獲勝概率等于0或接近于0,那么期望收益至多為0。
作用:NLN_LNL?中n?mn-mn?m位參賽者的任意均衡下期望收益為0。(LEAST LEMMA中得到NWN_WNW?中參賽者期望收益至少為Power,那么n-m個(gè)只能是NLN_LNL?中的。)
- THRESHOLD LEMMA:NWN_WNW?中的參賽者最優(yōu)響應(yīng)是接近或者超過threshold,因此期望收益最多為其power值。
證明:1.對(duì)于NL\{m+1}N_L\backslash \{m+1\}NL?\{m+1}中的參賽者來說,其最優(yōu)響應(yīng)的上確界為ssup<Ts_{sup}<Tssup?<T。為了證明NWN_WNW?中每位參賽者都為接近或者超過threshold的分?jǐn)?shù)附以了概率,使用反證法。假設(shè)存在一位NWN_WNW?中參賽者,沒有為接近或者超過threshold的分?jǐn)?shù)附以概率。那么marginal player可以純策略在范圍(max{am+1,s},T)(max\{a_{m+1},s\},T)(max{am+1?,s},T)中選擇分?jǐn)?shù)從而百分百贏得比賽。此時(shí)marginal player期望收益為正,與上面結(jié)論相違背。(證明NWN_WNW?中參賽者的最優(yōu)響應(yīng))
2.在NWN_WNW?中任選一位參賽者iii。其最優(yōu)響應(yīng){xn}n=1∞\{x_n\}^\infty _{n=1}{xn?}n=1∞?接近于某個(gè)zi≥Tz_i\ge Tzi?≥T。根據(jù)LEAST LEMMA,vi(xn)>0v_i(x_n)>0vi?(xn?)>0。根據(jù)viv_ivi?的連續(xù)性,我們可以得到:(證明NWN_WNW?中參賽者的期望收益上界)
ui=ui(xn)=Pi(xn)vi(xn)?(1?Pi(xn))ci(xn)≤vi(xn)→xn→zivi(zi)≤vi(T)=wiu_i=u_i(x_n)=P_i(x_n)v_i(x_n)-(1-P_i(x_n))c_i(x_n)\le v_i(x_n)\\ \rightarrow_{x_n\rightarrow z_i}v_i(z_i)\le v_i(T)=w_i ui?=ui?(xn?)=Pi?(xn?)vi?(xn?)?(1?Pi?(xn?))ci?(xn?)≤vi?(xn?)→xn?→zi??vi?(zi?)≤vi?(T)=wi?
作用:證明了NWN_WNW?中參賽者期望收益的上界為power。 - 綜合以上引理及其證明。LEAST LEMMA與THRESHOLD LEMMA共同證明了NWN_WNW?中參賽者所有均衡下期望收益等于其power。TIE LEMMA輔助證明ZERO LEMMA,從而證明了NLN_LNL?中參賽者所有均衡下期望收益等于0。(均在標(biāo)準(zhǔn)競(jìng)賽的前提下)綜合上述兩點(diǎn),定理1得證。
二、Theorem 2 證明過程
- 總體來說:Theorem 2的證明采用反證法,通過假設(shè)反面推理與已證明的Theorem 1部分結(jié)論產(chǎn)生矛盾。(基于Generic Condition+均衡存在性+Theorem 1)
- 正常情況下,全支付競(jìng)賽所有參賽者的初始分?jǐn)?shù)都是0,不存在初始優(yōu)勢(shì)。因此m+1以后的參賽者很少會(huì)參與。
- 每位參賽者的伯努利效用函數(shù)除以ui(ai)u_i(a_i)ui?(ai?)后并不影響均衡中所有參賽者的策略表現(xiàn),(伯努利效用函數(shù)為:ui(s)=Pi(s)vi(si)?(1?Pi(s))ci(si)u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i)ui?(s)=Pi?(s)vi?(si?)?(1?Pi?(s))ci?(si?))因此利用所有參賽者ui(ai)=1u_i(a_i)=1ui?(ai?)=1的競(jìng)賽證明即可代表所有競(jìng)賽。(這也是為何定理2中有正則化)
- 證明方法使用反證法。選擇該競(jìng)賽中的一個(gè)均衡GGG,假設(shè)存在某位參賽者i>m+1i>m+1i>m+1滿足定理2的條件并且參與到了競(jìng)賽中。即
cm+1(max{am+1,x})vm+1(am+1)<ci(x)vi(ai)for?all?x∈Sivm+1(max{am+1,x})vm+1(am+1)≥vi(x)vi(ai)for?all?x∈Si\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}\ge\frac{v_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ vm+1?(am+1?)cm+1?(max{am+1?,x})?<vi?(ai?)ci?(x)??for?all?x∈Si?vm+1?(am+1?)vm+1?(max{am+1?,x})?≥vi?(ai?)vi?(x)??for?all?x∈Si? - 令ti=inf{x:Gi(x)=1}<Tt_i=inf\{x:G_i(x)=1\}<Tti?=inf{x:Gi?(x)=1}<T。tit_iti?可理解為參賽者iii混合策略中所選擇分?jǐn)?shù)的最大值,ti≤ri<Tt_i\le r_i<Tti?≤ri?<T。令ti~=max{am+1,ti}<T\tilde{t_i}=max\{a_{m+1},t_i\}<Tti?~?=max{am+1?,ti?}<T,那么Pi(ti)<1P_i(t_i)<1Pi?(ti?)<1(由Threshold引理證明過程可得,NWN_WNW?中m位參賽者選擇分?jǐn)?shù)接近或者超過threshold,參賽者iii最高分?jǐn)?shù)才為ti<Tt_i<Tti?<T,因此不可能必勝),并且對(duì)于任意δ>0:Pm+1(ti~+δ)≥Pi(ti)\delta>0:P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)δ>0:Pm+1?(ti?~?+δ)≥Pi?(ti?)(ti~+δ>ti\tilde{t_i}+\delta>t_iti?~?+δ>ti?,在獎(jiǎng)項(xiàng)估值相同為1且代價(jià)函數(shù)遞增的情況下,分?jǐn)?shù)越高獲獎(jiǎng)概率越大,也稱為競(jìng)賽的單調(diào)性)(競(jìng)賽的單調(diào)性也是可研究的因素)。因此對(duì)于任意δ>0\delta>0δ>0使得ti~+δ<rm+1=T\tilde{t_i}+\delta<r_{m+1}=Tti?~?+δ<rm+1?=T我們有:
vm+1(ti~+δ)>0≥?cm+1(ti~+δ))v_{m+1}(\tilde{t_i}+\delta)>0\ge -c_{m+1}(\tilde{t_i}+\delta)) vm+1?(ti?~?+δ)>0≥?cm+1?(ti?~?+δ))
上式的含義是,參賽者m+1選擇分?jǐn)?shù)ti~+δ\tilde{t_i}+\deltati?~?+δ時(shí)代價(jià)函數(shù)大于等于0且獲勝效用大于0。 - 我們可以得到:
um+1≥Pm+1(ti~+δ)vm+1(ti~+δ)?(1?Pm+1(ti~+δ))cm+1(ti~+δ)≥Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)(根據(jù)Pm+1(ti~+δ)≥Pi(ti))u_{m+1}\ge P_{m+1}(\tilde{t_i}+\delta)v_{m+1}(\tilde{t_i}+\delta)-(1-P_{m+1}(\tilde{t_i}+\delta))c_{m+1}(\tilde{t_i}+\delta)\\ \ge P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \text{(根據(jù)$P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$)} um+1?≥Pm+1?(ti?~?+δ)vm+1?(ti?~?+δ)?(1?Pm+1?(ti?~?+δ))cm+1?(ti?~?+δ)≥Pi?(ti?)vm+1?(ti?~?+δ)?(1?Pi?(ti?))cm+1?(ti?~?+δ)(根據(jù)Pm+1?(ti?~?+δ)≥Pi?(ti?)) - 根據(jù)定理2中的定義可得,ci(ti)>cm+1(ti~+δ),vm+1(ti~+δ)≥vi(ti)c_i(t_i)>c_{m+1}(\tilde{t_i}+\delta),v_{m+1}(\tilde{t_i}+\delta)\ge v_i(t_i)ci?(ti?)>cm+1?(ti?~?+δ),vm+1?(ti?~?+δ)≥vi?(ti?),由此可得:
Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)>Pi(ti)vi(ti)?(1?Pi(ti))ci(ti)=ui(ti)≥0P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \\>P_i(t_i)v_i(t_i)-(1-P_i(t_i))c_i(t_i)=u_i(t_i)\ge 0 Pi?(ti?)vm+1?(ti?~?+δ)?(1?Pi?(ti?))cm+1?(ti?~?+δ)>Pi?(ti?)vi?(ti?)?(1?Pi?(ti?))ci?(ti?)=ui?(ti?)≥0 - 由此可得um+1>ui(ti)≥0u_{m+1}>u_i(t_i)\ge 0um+1?>ui?(ti?)≥0,即um+1>0u_{m+1}>0um+1?>0這有違定理1。(定理1表明um+1=0u_{m+1}=0um+1?=0)根據(jù)反證法可得,定理2成立。
三、Corollary 1 證明過程
- 總體來說:Corollary 1的證明通過特殊化競(jìng)賽,利用一些現(xiàn)有結(jié)論或特殊性質(zhì)找到一定存在的均衡,再證明該均衡也存在于原競(jìng)賽中即可。(該部分證明獨(dú)立)
- 推論1:所有的全支付競(jìng)賽中都存在均衡。
- 考慮一個(gè)競(jìng)賽CCC與一個(gè)受限的競(jìng)賽C′C'C′,其中每位參賽者選擇分?jǐn)?shù)在Si′=[ai,K],K=maxi∈Nri<∞S_i'=[a_i,K],K=max_{i\in N}r_i<\inftySi′?=[ai?,K],K=maxi∈N?ri?<∞范圍內(nèi)。(正常競(jìng)賽每位參賽者的分?jǐn)?shù)選擇范圍是[ai,∞)[a_i,\infty)[ai?,∞))任何C′C'C′中的均衡都是CCC中的均衡(K是所有參賽者最大的reach,選擇大于K的分?jǐn)?shù)一定使得任何參賽者收益為負(fù),不如選擇初始分?jǐn)?shù)收入為0),因此我們只要證明C′C'C′中一定存在均衡即可。
- 令S?=×i∈NSi′\{(s1,...,sn)∣?i≠j:si=sj}S^*=\times _{i\in N}S_i'\backslash \{(s_1,...,s_n)|\exists i\neq j:s_i=s_j\}S?=×i∈N?Si′?\{(s1?,...,sn?)∣?i?=j:si?=sj?},換句話說S?S^*S?是所有參賽者備選分?jǐn)?shù)組合然后去掉存在相同分?jǐn)?shù)選擇的情況。根據(jù)Simon and Zame的研究成果,存在某種打破平局規(guī)則,從而使得C′C'C′有一個(gè)混合策略均衡GGG。將應(yīng)用了該種打破平局規(guī)則的競(jìng)賽表示為C~\tilde{C}C~,均衡GGG中參賽者的收益為ui~\tilde{u_i}ui?~?。我們只需證明競(jìng)賽C~\tilde{C}C~中的均衡GGG也是競(jìng)賽C′C'C′的均衡即可。換句話說,只需證明在C′C'C′中GGG的混合策略對(duì)每位參賽者來說都是最優(yōu)響應(yīng)即可。
- 證明分兩步驟進(jìn)行。第一步證明在競(jìng)賽C′C'C′中按照均衡GGG的混合策略決策,參賽者的效用等于ui~\tilde{u_i}ui?~?。第二步證明不存在其他分?jǐn)?shù)選擇使參賽者獲得相較于ui~\tilde{u_i}ui?~?的更高收益。綜上GGG中混合策略在競(jìng)賽C′C'C′中也是最優(yōu)響應(yīng),即GGG也是競(jìng)賽C′C'C′的均衡。從而證明了C′C'C′中一定存在均衡,從而得到任意全支付競(jìng)賽中都存在均衡。
四、存在的問題
1.Corollary 1的證明過程中通過特殊化競(jìng)賽以及利用現(xiàn)有結(jié)論證明均衡存在性,請(qǐng)問該方法是否是均衡存在性證明的一貫方法?
2.Tie-Breaking Rule在證明中多次出現(xiàn),該因素是不是影響競(jìng)賽表現(xiàn)的一大關(guān)鍵因素?有無文章關(guān)注于該因素?
3.最優(yōu)響應(yīng)為何表示為矩陣序列{xn}n=1∞\{x_n\}^\infty_{n=1}{xn?}n=1∞??n趨向于無窮的極限代表著什么?
總結(jié)
以上是生活随笔為你收集整理的All-Pay Contests 论文定理推导(博弈论+机制设计)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《人月神话》(The Mythical
- 下一篇: 计算机课包括什么东西,计算机全课程包括什