双重差分法之空间DID
簡單談一下我本人對空間雙重差分模型(Spatial Difference in Difference Model,SDID)幾點(diǎn)或許不太成熟的理解。
(本文首發(fā)于個人微信公眾號DMETP,歡迎關(guān)注!)
一、從聚類標(biāo)準(zhǔn)誤到空間相關(guān)性
當(dāng)使用面板數(shù)據(jù)進(jìn)行固定效應(yīng)模型估計時,考慮到組間異方差和組內(nèi)自相關(guān),我們必然需要將標(biāo)準(zhǔn)誤進(jìn)行聚類調(diào)整。一般來說,聚類調(diào)整后的標(biāo)準(zhǔn)誤大于異方差穩(wěn)健標(biāo)準(zhǔn)誤,而異方差穩(wěn)健標(biāo)準(zhǔn)誤大于普通標(biāo)準(zhǔn)誤,因此,根據(jù)聚類標(biāo)準(zhǔn)誤做出來的結(jié)果是相對最穩(wěn)健的,這里所說的穩(wěn)健,指的是系數(shù)顯著性穩(wěn)健,因為標(biāo)準(zhǔn)誤影響t值,而對系數(shù)的本身影響不大。
然而,將標(biāo)準(zhǔn)誤聚類調(diào)整到什么層次是一個問題。當(dāng)將個體(id)作為聚類依據(jù)時,即假定每個個體不同年份的干擾項存在相關(guān)性(組內(nèi)自相關(guān)),而不同個體的干擾項不存在相關(guān)性(組間不相關(guān))。但是,這樣的假定可能不符合現(xiàn)實(shí)情況,比如,對于微觀企業(yè)來說,同一行業(yè)的企業(yè)之間必然存在競合關(guān)系,此時同一行業(yè)不同企業(yè)之間就存在相關(guān)性,在這種情況下,將標(biāo)準(zhǔn)誤聚類調(diào)整到行業(yè)層面可能更合理。因此,為了得出更穩(wěn)健的結(jié)果,也為了說服苛刻的讀者(或?qū)徃迦?#xff09;接受我們根據(jù)實(shí)證結(jié)果得出的結(jié)論,將標(biāo)準(zhǔn)誤聚類到更高層級是一種更安全的做法,當(dāng)然,聚類層級越高系數(shù)越不顯著。
然而,有時候我們沒有甚至不能將標(biāo)準(zhǔn)誤聚類到更高層級。除了顯著性與穩(wěn)健性之間的權(quán)衡,更多的原因在于聚類層級越高聚類數(shù)目越少,而大樣本理論要求聚類數(shù)目足夠大,這樣才能保證所估計的標(biāo)準(zhǔn)誤收斂到真實(shí)值(Petersen,2009),根據(jù)拇指法則,聚類數(shù)少于30可能就不太合適了。
退而求其次,為了同時兼顧聚類層級與聚類數(shù)目,有些文獻(xiàn)將標(biāo)準(zhǔn)誤聚類到行業(yè)-年份層面(在Stata中可以利用分組函數(shù)group生成聚類變量再在回歸中進(jìn)行聚類調(diào)整,即:先egen ind_year = group(industry year),然后reghdfe y xlist, absorb(id year) cluster(ind_year)),如李青原和章尹賽楠(2021)、邵朝對等(2021),即假定同一年同一行業(yè)之間存在自相關(guān),而不同年或不同行業(yè)之間不存在自相關(guān)。
參考文獻(xiàn):
[1] Petersen M A. Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches[J]. Review of Financial Studies, 2009, 22(01): 435-480.
[2] 李青原, 章尹賽楠. 金融開放與資源配置效率——來自外資銀行進(jìn)入中國的證據(jù)[J]. 中國工業(yè)經(jīng)濟(jì), 2021(05): 95-113.
[3] 邵朝對, 蘇丹妮, 楊琦. 外資進(jìn)入對東道國本土企業(yè)的環(huán)境效應(yīng): 來自中國的證據(jù)[J]. 世界經(jīng)濟(jì), 2021, 44(03): 32-60.
根據(jù)常識與理論將標(biāo)準(zhǔn)誤聚類調(diào)整到行業(yè)-年份層面,即先驗式地承認(rèn)同一年份同一行業(yè)的企業(yè)存在相關(guān)性,同理,當(dāng)聚類到省份-年份層面或區(qū)域-年份層面時,也可以認(rèn)為同一年同一地區(qū)(省份或區(qū)域)不同個體之間存在相關(guān)性,這與構(gòu)建空間計量模型(Spatial Econometric Model)的思想不謀而合。
空間計量模型最大的特征是放松了空間單位之間相互獨(dú)立的假設(shè),即認(rèn)為本地區(qū)與鄰近地區(qū)存在相互關(guān)系,本地區(qū)變量的變動不僅直接影響本地區(qū),也會影響鄰近地區(qū),而且通過影響鄰近地區(qū)最后反作用于本地區(qū)。本地區(qū)對本地區(qū)的影響稱為直接效應(yīng)(Direct Effect),本地區(qū)對鄰近地區(qū)的平均影響稱作間接影響或空間溢出效應(yīng)(Indirect Effect or Spatial Spillover Effect)。對具體空間相關(guān)形式的判斷,是在OLS模型的基礎(chǔ)上對其殘差進(jìn)行拉格朗日乘子檢驗(LM test)和穩(wěn)健的拉格朗日乘子檢驗(robust LM test),以檢驗OLS回歸殘差中是否存在某種形式的空間關(guān)聯(lián),即檢驗OLS回歸殘差中是否包含被解釋變量的空間滯后項(wywywy)抑或擾動項的空間滯后項(wεw\varepsilonwε)(Burridge,1980;Anselin,1988;Anselin at al.,1996;Elhorst,2014)。
參考文獻(xiàn):
[4] Burridge P. On the Cliff‐Ord Test for Spatial Correlation[J]. Journal of the Royal Statistical Society: Series B (Methodological), 1980, 42(01): 107-108.
[5] Anselin L: Spatial Dependence in Regression Error Terms, Anselin L, editor, Spatial Econometrics: Methods and Models, Dordrecht: Springer Netherlands, 1988: 100-118.
[6] Anselin L, Bera A K, Florax R, et al. Simple Diagnostic Tests for Spatial Dependence[J]. Regional Science & Urban Economics, 1996, 26(01): 77-104.
[7] Elhorst J P. Matlab Software for Spatial Panels[J]. International Regional Science Review, 2014, 37(03): 389-405.
因此,從這種意義上來說,當(dāng)標(biāo)準(zhǔn)誤聚類調(diào)整到地區(qū)-年份層面時,此時假定中的同一年份同一地區(qū)不同個體之間存在的相關(guān)性(組內(nèi)自相關(guān))本質(zhì)上是一種空間相關(guān)性。也就是說,當(dāng)我們將標(biāo)準(zhǔn)誤聚類調(diào)整到地區(qū)-年份層面時,實(shí)質(zhì)上就已經(jīng)變相說明模型中存在一定的空間相關(guān)性。
二、個體處理效應(yīng)穩(wěn)定性假設(shè)
在DID中,一個經(jīng)典的假設(shè)是個體處理效應(yīng)穩(wěn)定性假設(shè)(Stable Unit Treatment Value Assumption,SUTVA)。SUTVA最重要的一點(diǎn)是“處理組個體不會影響控制組個體”(Rubin,1974)。換言之,在SUTVA框架下,總體中的任何個體并不會受到其他個體接受處理與否的影響(王金杰和盛玉雪,2020)。然而,這個假設(shè)在考慮到空間相關(guān)性時被打破了,或者說,當(dāng)不同空間單元之間存在相關(guān)性即存在空間溢出效應(yīng)時,SUTVA不再成立(Kolak & Anselin,2019)。
參考文獻(xiàn):
[8] Rubin D B. Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies[J]. Journal of Educational Psychology, 1974, 66(05): 688-701.
[9] 王金杰, 盛玉雪. 社會治理與地方公共研發(fā)支出——基于空間倍差法的實(shí)證研究[J]. 南開經(jīng)濟(jì)研究, 2020, 1(01): 199-219.
[10] Kolak M, Anselin L. A Spatial Perspective on the Econometrics of Program Evaluation[J]. International Regional Science Review, 2019, 43(02): 128-153.
事實(shí)上,SUTVA在大多數(shù)情況下可能都不成立,而現(xiàn)有的DID類實(shí)證文章很少會考慮到這一點(diǎn),并且Ferman(2020)指出忽略空間相關(guān)性將導(dǎo)致標(biāo)準(zhǔn)誤被低估,從而夸大系數(shù)的顯著性。
參考文獻(xiàn):
[11] Ferman B. Inference in Differences-in-Differences: How Much Should We Trust in Independent Clusters? [R]. MPRA Paper 93746, University Library of Munich, Germany, 2020.
一個簡單的道理,處理組在期初實(shí)施了某項政策,控制組沒有實(shí)施,但不是說政策實(shí)施之后只會對處理組產(chǎn)生影響,通過示范、學(xué)習(xí)、要素流動等渠道也會作用于控制組,因此,政策的施行在長期將會在一個較廣的區(qū)域范圍內(nèi)產(chǎn)生普遍(但不一致)的影響。
這里有兩個問題,一個是政策實(shí)施對控制組作用的力度,另一個是作用的方向。
首先,在處理組實(shí)施的某項政策不會對全域內(nèi)所有地區(qū)產(chǎn)生相同的影響,可能兩地間經(jīng)濟(jì)聯(lián)系越密切,政策的空間溢出效應(yīng)越強(qiáng);可能兩地共享同一地理邊界(鄰接),空間溢出效應(yīng)越明顯;可能兩地核心城市之間的地理距離或路程距離越短,空間溢出效應(yīng)就越強(qiáng)。總之,政策的施行不會對其他地區(qū)產(chǎn)生一致的影響,而會隨著某種空間相互關(guān)系的趨弱存在衰減效應(yīng),而我們論文中的SDID就是圍繞這種空間相互關(guān)系進(jìn)行研究設(shè)計的(空間權(quán)重矩陣的設(shè)置)。
其次,處理組實(shí)施的某項政策對鄰近地區(qū)的影響有正有負(fù)。一方面,政策施行導(dǎo)致資源向先行區(qū)傾斜集聚,這不僅意味著先行地區(qū)內(nèi)部資源的重新配置,而且也將導(dǎo)致鄰近地區(qū)的資源(如勞動力、資金等)向該地區(qū)流動富集,這樣的結(jié)果是抑制了鄰近控制組的經(jīng)濟(jì)發(fā)展,形成了“虹吸效應(yīng)”。另一方面,先行發(fā)展的示范區(qū)一般都是經(jīng)濟(jì)發(fā)展較好的地區(qū)(這同時說明DID可能存在嚴(yán)重的樣本自選擇問題!),政策實(shí)施后這些地區(qū)將已有的、相對落后的產(chǎn)能向周圍轉(zhuǎn)移,連帶著將相關(guān)人才、技術(shù)與資金轉(zhuǎn)移,通過這樣的一種方式促進(jìn)了鄰近地區(qū)的發(fā)展,形成了所謂的“涓滴效應(yīng)”??傊?#xff0c;政策的施行對鄰近地區(qū)產(chǎn)生正反兩方面的影響,而我們的工作就是要精準(zhǔn)穩(wěn)健地測度出這種影響,并進(jìn)一步分析出這種異質(zhì)性影響背后的形成機(jī)制或者說機(jī)理。
三、政策實(shí)施的空間溢出效應(yīng)
下面結(jié)合幾個實(shí)例給出SDID模型設(shè)計的參考。
空間計量模型中和DID結(jié)合最多的是自變量空間滯后模型(The Spatial Lag of X Model,SLX),而SLX是在普通線性模型等式右端引入(所有)自變量的空間滯后項,形如式(1)(1)(1):
Y=αιN+Xβ+WXθ+ε(1)Y=\alpha \iota _N+X\beta +WX\theta +\varepsilon \tag{1} Y=αιN?+Xβ+WXθ+ε(1)
式(1)(1)(1)中的WXWXWX即為所有自變量的空間滯后項,由于等式右端不包括被解釋變量的空間滯后項,該模型可以視為普通的線性模型,并使用OLS方法進(jìn)行估計。因此,式(1)(1)(1)中的β\betaβ衡量的是直接效應(yīng)的大小,θ\thetaθ測度的是間接效應(yīng)的大小(Vega & Elhorst,2015)。
參考文獻(xiàn):
[12] Vega S H, Elhorst J P. The SLX Model[J]. Journal of Regional Science, 2015, 55(03): 339-363.
SDID基于式(1)(1)(1),但等式右邊只有DID交互項的空間滯后項,其余自變量均以其初始形式作為控制變量,形如式(2)(2)(2):
Y=αιN+Xβ+φdid+θWdid+ε(2)Y=\alpha \iota _N+X\beta +\varphi did+\theta Wdid+\varepsilon \tag{2} Y=αιN?+Xβ+φdid+θWdid+ε(2)
其中,φ\varphiφ代表政策的直接效應(yīng),即絕大多數(shù)論文中所要考察的處理效應(yīng)(Treatment Effect),而θ\thetaθ代表政策的間接效應(yīng)或空間溢出效應(yīng)。
王金杰和盛玉雪(2020)在研究社會治理與地方公共研發(fā)支出的關(guān)系時,將十八屆三中全會以來的社會治理作為準(zhǔn)自然實(shí)驗,設(shè)計了如下式(3)(3)(3)的實(shí)證模型。
Y=?+θ+(α+βW)D+Xγ′+WXδ′+ε(3)Y=\phi +\theta +\left(\alpha +\beta W\right)D+X\gamma ^{'}+WX\delta ^{'} + \varepsilon \tag{3} Y=?+θ+(α+βW)D+Xγ′+WXδ′+ε(3)
其中,DID交互項(DDD)空間滯后項系數(shù)β\betaβ衡量的是平均的溢出效應(yīng)。
可以看出,形如式(2)(2)(2)和式(3)(3)(3)的SDID只能測度平均的空間溢出效應(yīng),空間滯后項系數(shù)的大小代表在所有處理組實(shí)施的政策對鄰近地區(qū)的影響。從這個意義上來說,以上的研究設(shè)計本質(zhì)上討論的是空間依賴性,而非空間異質(zhì)性,而對空間異質(zhì)性的討論或許是我們應(yīng)該關(guān)注的重點(diǎn),即:在處理組實(shí)施的某項政策,在多大范圍內(nèi)存在空間溢出效應(yīng)?
沈坤榮和金剛(2018)在評估河長制的水污染治理效果時,設(shè)計了如下式(4)(4)(4)的實(shí)證模型。
Pollutantit=βHezhangzhiit+α∑δ∑jwijδδ+100Hezhangzhijt+λXit+αi+γt+εit(4)Pollutant_{it}=\beta Hezhangzhi_{it}+\alpha \sum_{\delta}{\sum_jw_{ij}^{\delta \text{~}\delta +100}Hezhangzhi_{jt}+\lambda X_{it}+\alpha _i+\gamma _t+\varepsilon _{it}} \tag{4} Pollutantit?=βHezhangzhiit?+αδ∑?j∑?wijδ?δ+100?Hezhangzhijt?+λXit?+αi?+γt?+εit?(4)
其中,wijδδ+100w_{ij}^{\delta \text{~}\delta +100}wijδ?δ+100?表示閾值為[δ,δ+100][\delta,\delta +100][δ,δ+100]的地理距離倒數(shù)矩陣元素,當(dāng)iii地和jjj地之間的距離在閾值范圍內(nèi),該元素取值為距離倒數(shù),否則為0。
可以看出,形如式(4)(4)(4)的SDID模型以100kmkmkm為步進(jìn)距離,考察在不同地理閾值范圍內(nèi)空間溢出效應(yīng)的大小。圖 1是不同地理閾值范圍內(nèi)系數(shù)α\alphaα的大小與顯著性。
參考文獻(xiàn):
[13] 沈坤榮, 金剛. 中國地方政府環(huán)境治理的政策效應(yīng)——基于“河長制”演進(jìn)的研究[J]. 中國社會科學(xué), 2018(05): 92-115+206.
然而,也有部分文獻(xiàn)通過巧妙的模型設(shè)計,在不使用SDID的情況下,測度了不同閾值范圍內(nèi)政策實(shí)施的空間溢出效應(yīng)。
曹清峰(2020)在評估國家級新區(qū)的經(jīng)濟(jì)效應(yīng)時,認(rèn)為國家級新區(qū)通過空間溢出效應(yīng)促進(jìn)了區(qū)域協(xié)調(diào)發(fā)展。該文的實(shí)證模型設(shè)計如下式(5)(5)(5):
gdprit=β0+β1didit+∑s=50400δsNits+λZit+νi+μt+εit(5)gdpr_{it}=\beta _0+\beta _1did_{it}+\sum_{s=50}^{400}\delta _sN_{it}^s+\lambda Z_{it}+\nu _i+\mu _t+\varepsilon _{it} \tag{5} gdprit?=β0?+β1?didit?+s=50∑400?δs?Nits?+λZit?+νi?+μt?+εit?(5)
其中,sss表示不同城市間的球面距離;如果在ttt年距離城市iii(s?50,s](s-50,s](s?50,s]的空間范圍內(nèi)存在國家級新區(qū),Nits=1N_{it}^s=1Nits?=1,否則Nits=0N_{it}^s=0Nits?=0;系數(shù)δs\delta_sδs?衡量了國家級新區(qū)設(shè)立后對鄰近城市經(jīng)濟(jì)增長率的影響。圖 2是不同地理閾值范圍內(nèi)系數(shù)δs\delta_sδs?的大小與顯著性。
參考文獻(xiàn):
[14] 曹清峰. 國家級新區(qū)對區(qū)域經(jīng)濟(jì)增長的帶動效應(yīng)——基于70大中城市的經(jīng)驗證據(jù)[J]. 中國工業(yè)經(jīng)濟(jì), 2020(07): 43-60.
總結(jié)
以上是生活随笔為你收集整理的双重差分法之空间DID的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sqlserver2005 sa密码忘记
- 下一篇: PVE安装画面灰白只显示鼠标解决方案