當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

All-Pay Contests 论文定理推导（博弈论+机制设计）

發(fā)布時(shí)間：2023/12/16 编程问答 54 豆豆

生活随笔收集整理的這篇文章主要介紹了 All-Pay Contests 论文定理推导（博弈论+机制设计）小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

All-Pay Contests 論文定理推導(dǎo)（博弈論+機(jī)制設(shè)計(jì)）

- - 一、Theorem 1 證明過程
  - 二、Theorem 2 證明過程
  - 三、Corollary 1 證明過程
  - 四、存在的問題

本文針對(duì)于全支付競(jìng)賽（準(zhǔn)確來說是標(biāo)準(zhǔn)競(jìng)賽）提出兩大結(jié)論：Theorem 1有關(guān)標(biāo)準(zhǔn)競(jìng)賽中參賽者的均衡收益情況；Theorem 2有關(guān)標(biāo)準(zhǔn)競(jìng)賽中參賽者的均衡參與情況。 Theorem1、2需依賴于均衡存在性定理（原文中Corollary 1）。因此本文證明大體分為三部分。
三部分的證明之間存在聯(lián)系。Corollary 1證明獨(dú)立，是Theorem1,2成立的基礎(chǔ)。Theorem 1證明依賴于Generic Condition。Theorem 2證明依賴于Generic Condition與Theorem 1。

一、Theorem 1 證明過程

總體來說：Theorem 1的證明分為四部分，提出四個(gè)Lemma并分別證明，四個(gè)Lemma組合可推出Theorem 1的內(nèi)容。（基于Generic Condition+均衡存在性）
Theorem 1內(nèi)容：在標(biāo)準(zhǔn)競(jìng)賽的任意均衡中，每個(gè)參賽者的期望收益都等于其power值與0之間的較大值。（ $N_W$ 中參賽者期望收益為power， $N_L$ 中參賽者期望收益為0。）
選擇一個(gè)標(biāo)準(zhǔn)競(jìng)賽以及一個(gè)競(jìng)賽的均衡 $G=(G_1,...,G_N)$ 。（任意標(biāo)準(zhǔn)競(jìng)賽均衡存在+任意競(jìng)賽的任意均衡滿足定理1 $→\rightarrow$ 定理1得以證明）

LEAST LEMMA：參賽者在任意均衡 $G$ 中的期望收益至少等于其power與0之間的較大值。
證明：初始分?jǐn)?shù)的存在使得每位參賽者的收益都大于等于0（ $N_L$ 中參賽者 $i$ 選擇分?jǐn)?shù) $si∈[ai,ri)s_i\in[a_i,r_i)$ ，如果獲勝那么期望收益為正，如果失敗那么不如選擇初始分?jǐn)?shù)保證收益為0）。參賽者劃分為 $N_W,N_L$ 兩部分， $N_L$ 中參賽者power小于0故已滿足引理。 $N_W$ 中任意參賽者選擇分?jǐn)?shù) $max{ai,T+?},?>0max\{a_i,T+\epsilon\},\epsilon>0$ 都可以打敗 $N_L$ 中所有 $n ? m$ 位參賽者而獲勝（ $N_L$ 中參賽者reach<T，因此不會(huì)出價(jià)大于等于T）。由此可得：（參賽者 $i$ 百分百選擇最高的分?jǐn)?shù)獲勝，伴隨著最大的代價(jià)，因此是期望收益的下界）
$ui≥vi(max{ai,T+?})→?→0vi(max{ai,T})=wiu_i\ge v_i(max\{a_i,T+\epsilon\})\rightarrow_{\epsilon\rightarrow0}v_i(max\{a_i,T\})=w_i$
由上式可得 $N_W$ 中參賽則期望收益大于等于其power（ $N_W$ 中參賽則的power>0）。綜上，LEAST LEMMA得證。
作用：證明了任意均衡中所有參賽者期望收益都至少為power與0之間的較大值（定理1的下界部分）。

TIE LEMMA：假設(shè)在均衡 $G$ 中兩個(gè)以上的參賽者為分?jǐn)?shù) $x$ 分配了概率，也就是說以嚴(yán)格正值概率選擇 $x$ 。那么為分?jǐn)?shù) $x$ 分配了概率的參賽者們?nèi)绻x擇 $x$ 要么一定一起獲勝要么一定一起失敗。
證明：為分?jǐn)?shù) $x$ 分配了概率的參賽者集合為 $N′,∣N′∣≥2N',|N'|\ge 2$ 。事件 $N^{'}$ 中所有參賽者選擇分?jǐn)?shù) $x$ 定義為 $E$ 。 $x$ 為獲獎(jiǎng)分?jǐn)?shù)并且 $x$ 出現(xiàn)同分?jǐn)?shù)的事件定義為 $D$ （ $m^{'}$ 個(gè)獎(jiǎng)項(xiàng)分配給 $N^{'}$ 中 $∣ N^{'} ∣$ 個(gè)參賽者，且 $1≤m′<∣N′∣1\le m' <|N'|$ ）。假設(shè) $D$ 有嚴(yán)格正值概率，在 $D$ 的基礎(chǔ)上，至少有一位參賽者 $i∈N′i\in N'$ 可以通過選擇略大于 $x$ 的分?jǐn)?shù)從而獲勝。因此事件 $D$ 并不滿足最優(yōu)響應(yīng)，換句話說任意均衡中不可能出現(xiàn)事件 $D$ 。因此 $P(E)=P(E^L)+P(E^W)$ ，其中， $P(E^L)$ 表示出現(xiàn)事件 $E$ 且 $N^{'}$ 中所有參賽者全部失敗， $P(E^W)$ 表示出現(xiàn)事件 $E$ 且 $N^{'}$ 中所有參賽者全部獲勝， $D$ 事件不存在均衡中，因此無第三種部分獲勝部分失敗的情況。因此在 $E$ 的基礎(chǔ)上，要么 $E^W$ 成立要么 $E^L$ 成立。TIE LEMMA得證。
作用：均衡中可能會(huì)有多位參賽者為某個(gè)分?jǐn)?shù)附以概率。TIE LEMMA消除了那些平分?jǐn)?shù)參賽者中部分獲勝的情況。均衡中無上述情況有助于確定哪些參賽者的期望收益為0。
（該引理說的是，在均衡中不會(huì)出現(xiàn)平局卡在分?jǐn)?shù) $x$ 上，因?yàn)閺慕Y(jié)果反推的角度，平局中至少有一個(gè)參賽者可以略微提高分?jǐn)?shù)從而必勝。但實(shí)際上，參賽者不會(huì)知道是否會(huì)發(fā)生平局，因此也無法做出策略調(diào)整規(guī)避掉平局的均衡？其實(shí)還是考慮博弈的過程是否會(huì)向著均衡的方向演化）

ZERO LEMMA：在均衡 $G$ 中，至少有 $n ? m$ 位參賽者針對(duì)于他們獲勝概率等于0或者接近于0的情況做出最優(yōu)響應(yīng)。這些參賽者期望收益最大是0。
證明：用 $J$ 表示某個(gè) $m + 1$ 位參賽者的集合。用 $S~\tilde{S}$ 表示 $J$ 中參賽者最優(yōu)響應(yīng)集合的聯(lián)合。用 $s_{inf}$ 表示 $S~\tilde{S}$ （笛卡爾積）的下確界。一共有三種情況：（1） $J$ 有兩個(gè)及以上的參賽者針對(duì)分?jǐn)?shù) $s_{inf}$ 附以正值概率。（2） $J$ 只有一個(gè)的參賽者針對(duì)分?jǐn)?shù) $s_{inf}$ 附以正值概率。（3） $J$ 沒有參賽者針對(duì)分?jǐn)?shù) $s_{inf}$ 附以正值概率。
情況（1）：用 $N^{'}$ 表示 $J$ 中針對(duì)分?jǐn)?shù) $s_{inf}$ 附以正值概率的參賽者。對(duì)于 $N^{'}$ 中每位參賽者來說不可能成立 $P_i(s_{inf})=1$ ，由此根據(jù)TIE LEMMA得到：對(duì)于 $N^{'}$ 中每位參賽者來說一定成立 $P_i(s_{inf})=0$ 。
情況（2）：用 $i$ 來表示 $J$ 中唯一一個(gè)針對(duì)分?jǐn)?shù) $s_{inf}$ 附以正值概率的參賽者。 $P_i(s_{inf})=0$ 一定成立（因?yàn)?span id="ozvdkddzhkzd" class="katex--inline"> $J$ 中其余m位參賽者選擇分?jǐn)?shù)一定大于 $s_{inf}$ ）。由此(1)(2)可得：任意m+1位參賽者的集合 $J$ 中，可能選擇分?jǐn)?shù)下確界的參賽者一定成立 $P_i(s_{inf})=0$ ，并且針對(duì)獲勝概率為0的情況選擇分?jǐn)?shù) $s_{inf}$ 也是其最優(yōu)響應(yīng)。
情況（3）：根據(jù)下確界 $s_{inf}$ 的定義，一定存在某位參賽者i其最優(yōu)響應(yīng) ${xn}n=1∞\{x_n\}^\infty _{n=1}$ 接近于 $s_{inf}$ 。當(dāng) $n$ 趨向于無窮時(shí)， $P_i(x_n)$ 接近于0。
因?yàn)?span id="ozvdkddzhkzd" class="katex--inline"> $J$ 是任意一個(gè)包含m+1位參賽者的集合，因此任意均衡中至少有n-m位參賽者是針對(duì)其獲勝概率等于0或接近于0做出的最優(yōu)響應(yīng)。（類似鴿籠原理，假設(shè)只有n-m-1個(gè)人成立，那么存在某個(gè)m+1個(gè)人中沒有人成立）獲勝概率等于0或接近于0，那么期望收益至多為0。
作用： $N_L$ 中 $n ? m$ 位參賽者的任意均衡下期望收益為0。（LEAST LEMMA中得到 $N_W$ 中參賽者期望收益至少為Power，那么n-m個(gè)只能是 $N_L$ 中的。）

THRESHOLD LEMMA： $N_W$ 中的參賽者最優(yōu)響應(yīng)是接近或者超過threshold，因此期望收益最多為其power值。
證明：1.對(duì)于 $NL\{m+1}N_L\backslash \{m+1\}$ 中的參賽者來說，其最優(yōu)響應(yīng)的上確界為 $s_{sup}<T$ 。為了證明 $N_W$ 中每位參賽者都為接近或者超過threshold的分?jǐn)?shù)附以了概率，使用反證法。假設(shè)存在一位 $N_W$ 中參賽者，沒有為接近或者超過threshold的分?jǐn)?shù)附以概率。那么marginal player可以純策略在范圍 $max\{a_{m+1},s\},T)$ 中選擇分?jǐn)?shù)從而百分百贏得比賽。此時(shí)marginal player期望收益為正，與上面結(jié)論相違背。（證明 $N_W$ 中參賽者的最優(yōu)響應(yīng)）
2.在 $N_W$ 中任選一位參賽者 $i$ 。其最優(yōu)響應(yīng) ${xn}n=1∞\{x_n\}^\infty _{n=1}$ 接近于某個(gè) $zi≥Tz_i\ge T$ 。根據(jù)LEAST LEMMA， $v_i(x_n)>0$ 。根據(jù) $v_i$ 的連續(xù)性，我們可以得到：（證明 $N_W$ 中參賽者的期望收益上界）
$ui=ui(xn)=Pi(xn)vi(xn)?(1?Pi(xn))ci(xn)≤vi(xn)→xn→zivi(zi)≤vi(T)=wiu_i=u_i(x_n)=P_i(x_n)v_i(x_n)-(1-P_i(x_n))c_i(x_n)\le v_i(x_n)\\ \rightarrow_{x_n\rightarrow z_i}v_i(z_i)\le v_i(T)=w_i$
作用：證明了 $N_W$ 中參賽者期望收益的上界為power。
綜合以上引理及其證明。LEAST LEMMA與THRESHOLD LEMMA共同證明了 $N_W$ 中參賽者所有均衡下期望收益等于其power。TIE LEMMA輔助證明ZERO LEMMA，從而證明了 $N_L$ 中參賽者所有均衡下期望收益等于0。（均在標(biāo)準(zhǔn)競(jìng)賽的前提下）綜合上述兩點(diǎn)，定理1得證。

二、Theorem 2 證明過程

總體來說：Theorem 2的證明采用反證法，通過假設(shè)反面推理與已證明的Theorem 1部分結(jié)論產(chǎn)生矛盾。（基于Generic Condition+均衡存在性+Theorem 1）
正常情況下，全支付競(jìng)賽所有參賽者的初始分?jǐn)?shù)都是0，不存在初始優(yōu)勢(shì)。因此m+1以后的參賽者很少會(huì)參與。
每位參賽者的伯努利效用函數(shù)除以 $u_i(a_i)$ 后并不影響均衡中所有參賽者的策略表現(xiàn)，（伯努利效用函數(shù)為： $u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i)$ ）因此利用所有參賽者 $u_i(a_i)=1$ 的競(jìng)賽證明即可代表所有競(jìng)賽。（這也是為何定理2中有正則化）
證明方法使用反證法。選擇該競(jìng)賽中的一個(gè)均衡 $G$ ，假設(shè)存在某位參賽者 $i > m + 1$ 滿足定理2的條件并且參與到了競(jìng)賽中。即
$cm+1(max{am+1,x})vm+1(am+1)<ci(x)vi(ai)for?all?x∈Sivm+1(max{am+1,x})vm+1(am+1)≥vi(x)vi(ai)for?all?x∈Si\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}\ge\frac{v_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\$
令 $t_i=inf\{x:G_i(x)=1\}<T$ 。 $t_i$ 可理解為參賽者 $i$ 混合策略中所選擇分?jǐn)?shù)的最大值， $ti≤ri<Tt_i\le r_i<T$ 。令 $ti~=max{am+1,ti}<T\tilde{t_i}=max\{a_{m+1},t_i\}<T$ ，那么 $P_i(t_i)<1$ （由Threshold引理證明過程可得， $N_W$ 中m位參賽者選擇分?jǐn)?shù)接近或者超過threshold，參賽者 $i$ 最高分?jǐn)?shù)才為 $t_i<T$ ，因此不可能必勝），并且對(duì)于任意 $δ>0:Pm+1(ti~+δ)≥Pi(ti)\delta>0:P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$ （ $ti~+δ>ti\tilde{t_i}+\delta>t_i$ ，在獎(jiǎng)項(xiàng)估值相同為1且代價(jià)函數(shù)遞增的情況下，分?jǐn)?shù)越高獲獎(jiǎng)概率越大，也稱為競(jìng)賽的單調(diào)性）（競(jìng)賽的單調(diào)性也是可研究的因素）。因此對(duì)于任意 $δ>0\delta>0$ 使得 $ti~+δ<rm+1=T\tilde{t_i}+\delta<r_{m+1}=T$ 我們有：
$vm+1(ti~+δ)>0≥?cm+1(ti~+δ))v_{m+1}(\tilde{t_i}+\delta)>0\ge -c_{m+1}(\tilde{t_i}+\delta))$
上式的含義是，參賽者m+1選擇分?jǐn)?shù) $ti~+δ\tilde{t_i}+\delta$ 時(shí)代價(jià)函數(shù)大于等于0且獲勝效用大于0。
我們可以得到：
$um+1≥Pm+1(ti~+δ)vm+1(ti~+δ)?(1?Pm+1(ti~+δ))cm+1(ti~+δ)≥Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)(根據(jù)Pm+1(ti~+δ)≥Pi(ti))u_{m+1}\ge P_{m+1}(\tilde{t_i}+\delta)v_{m+1}(\tilde{t_i}+\delta)-(1-P_{m+1}(\tilde{t_i}+\delta))c_{m+1}(\tilde{t_i}+\delta)\\ \ge P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \text{(根據(jù)$P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$)}$
根據(jù)定理2中的定義可得， $ci(ti)>cm+1(ti~+δ),vm+1(ti~+δ)≥vi(ti)c_i(t_i)>c_{m+1}(\tilde{t_i}+\delta),v_{m+1}(\tilde{t_i}+\delta)\ge v_i(t_i)$ ，由此可得：
$Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)>Pi(ti)vi(ti)?(1?Pi(ti))ci(ti)=ui(ti)≥0P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \\>P_i(t_i)v_i(t_i)-(1-P_i(t_i))c_i(t_i)=u_i(t_i)\ge 0$
由此可得 $um+1>ui(ti)≥0u_{m+1}>u_i(t_i)\ge 0$ ，即 $u_{m+1}>0$ 這有違定理1。（定理1表明 $u_{m+1}=0$ ）根據(jù)反證法可得，定理2成立。

三、Corollary 1 證明過程

總體來說：Corollary 1的證明通過特殊化競(jìng)賽，利用一些現(xiàn)有結(jié)論或特殊性質(zhì)找到一定存在的均衡，再證明該均衡也存在于原競(jìng)賽中即可。（該部分證明獨(dú)立）
推論1：所有的全支付競(jìng)賽中都存在均衡。
考慮一個(gè)競(jìng)賽 $C$ 與一個(gè)受限的競(jìng)賽 $C^{'}$ ，其中每位參賽者選擇分?jǐn)?shù)在 $Si′=[ai,K],K=maxi∈Nri<∞S_i'=[a_i,K],K=max_{i\in N}r_i<\infty$ 范圍內(nèi)。（正常競(jìng)賽每位參賽者的分?jǐn)?shù)選擇范圍是 $[ai,∞)[a_i,\infty)$ ）任何 $C^{'}$ 中的均衡都是 $C$ 中的均衡（K是所有參賽者最大的reach，選擇大于K的分?jǐn)?shù)一定使得任何參賽者收益為負(fù)，不如選擇初始分?jǐn)?shù)收入為0），因此我們只要證明 $C^{'}$ 中一定存在均衡即可。
令 $S?=×i∈NSi′\{(s1,...,sn)∣?i≠j:si=sj}S^*=\times _{i\in N}S_i'\backslash \{(s_1,...,s_n)|\exists i\neq j:s_i=s_j\}$ ，換句話說 $S^*$ 是所有參賽者備選分?jǐn)?shù)組合然后去掉存在相同分?jǐn)?shù)選擇的情況。根據(jù)Simon and Zame的研究成果，存在某種打破平局規(guī)則，從而使得 $C^{'}$ 有一個(gè)混合策略均衡 $G$ 。將應(yīng)用了該種打破平局規(guī)則的競(jìng)賽表示為 $C~\tilde{C}$ ，均衡 $G$ 中參賽者的收益為 $ui~\tilde{u_i}$ 。我們只需證明競(jìng)賽 $C~\tilde{C}$ 中的均衡 $G$ 也是競(jìng)賽 $C^{'}$ 的均衡即可。換句話說，只需證明在 $C^{'}$ 中 $G$ 的混合策略對(duì)每位參賽者來說都是最優(yōu)響應(yīng)即可。
證明分兩步驟進(jìn)行。第一步證明在競(jìng)賽 $C^{'}$ 中按照均衡 $G$ 的混合策略決策，參賽者的效用等于 $ui~\tilde{u_i}$ 。第二步證明不存在其他分?jǐn)?shù)選擇使參賽者獲得相較于 $ui~\tilde{u_i}$ 的更高收益。綜上 $G$ 中混合策略在競(jìng)賽 $C^{'}$ 中也是最優(yōu)響應(yīng)，即 $G$ 也是競(jìng)賽 $C^{'}$ 的均衡。從而證明了 $C^{'}$ 中一定存在均衡，從而得到任意全支付競(jìng)賽中都存在均衡。

四、存在的問題

1.Corollary 1的證明過程中通過特殊化競(jìng)賽以及利用現(xiàn)有結(jié)論證明均衡存在性，請(qǐng)問該方法是否是均衡存在性證明的一貫方法？
2.Tie-Breaking Rule在證明中多次出現(xiàn)，該因素是不是影響競(jìng)賽表現(xiàn)的一大關(guān)鍵因素？有無文章關(guān)注于該因素？
3.最優(yōu)響應(yīng)為何表示為矩陣序列 ${xn}n=1∞\{x_n\}^\infty_{n=1}$ ？n趨向于無窮的極限代表著什么？

總結(jié)

以上是生活随笔為你收集整理的All-Pay Contests 论文定理推导（博弈论+机制设计）的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：《人月神话》（The Mythical
下一篇：计算机课包括什么东西,计算机全课程包括什