空间相关分析与SDM
文章目錄
- 摘要
- 一. 空間計量經濟學
- 1.1 空間自相關檢驗
- 1.2 空間權重矩陣
- 1.2.1 鄰近權重矩陣
- 1.2.2 距離權重矩陣
- 1.2.3 經濟權重矩陣
- 1.3 全局自相關—莫蘭指數
- 1.4 局部莫蘭指數
- 2.1 模型選擇與空間杜賓模型解釋
- 2.1.1 常用的三種空間模型
- 2.1.1.1**空間自回歸模型SAR(空間滯后模型SLM)**
- 2.1.1.2 空間誤差模型(SEM)
- 2.1.1.3 空間杜賓模型(SDM)
- 2.1.2 空間杜賓模型的評估與解讀
- 二. 力源項目相關
- 三.文獻
- 四. 本科畢設
- 總結
摘要
一是對空間計量經濟學的大致理解,其主要包含空間自相關檢驗與空間計量模型的建立。一般利用空間自相關指數來反映空間依賴性,通常是計算莫蘭指數;但關鍵在于創建空間權重矩陣(一般利用鄰近權重矩陣),將獲取的shp文件轉化成鄰近權重矩陣。然后利用面板數據導入經濟分析軟件,對各年的變量做全局莫蘭指數;以及模型選擇與空間杜賓模型的解讀。二是對力源項目的一些小小完善。
一. 空間計量經濟學
引入了空間效應,空間效應是空間計量經濟學的基本特征,它反映著空間因素的影響,是空間計量經濟學從傳統計量經濟領域獨立出來的根本原因。
1.1 空間自相關檢驗
主要包含空間自相關檢驗與空間計量模型建立的這兩大部分。首先是空間自相關檢驗;空間相關性亦稱“地理學第一定律”,任何事物存在空間相關,距離越近的事務空間相關性越大。空間相關性來源主要有溢出效應、模仿行為和截面上與個體之間的相互競爭等方面引起的。空間統計學一般利用空間自相關指數來反映空間依賴性。空間自相關指數一般分為兩類:莫蘭指數( Moran’s I)和吉爾利指數(Geary’ s C)。
其中
YiY_iYi?表示第i個地區的觀測值,n為截面數(比如是中國的31個省份),w(ij)w_(ij)w(?ij),為空間權重矩陣(具體如何計算后面會展開)。莫蘭指數的作用類似相關系數,取值范圍為[一1,1],當指數大于0時,表示正相關,小于0時表示負相關。莫蘭指數的絕對值越靠近1,則說明空間依賴性越強,各地地區之間的關系越密切。
1.2 空間權重矩陣
空間權重矩陣為模型關鍵,根據地理學第一定律"任何事物都是緊密相連的,只不過越相鄰的事物連接更緊密"。而空間權重矩陣即可描述事物間的關聯程度。不同的空間權重矩陣測算出的結果各不相同。
1.2.1 鄰近權重矩陣
1.2.2 距離權重矩陣
空間單元間除了相鄰關系,還有可用距離進行描述。在空間計量經濟學中,可分為狹義距離和廣義距離。狹義距離通常指兩個區域的質心距離或者行政中心距離,構建方式如下:
其中dijd_{ij}dij? 表示區域iii與區域jjj間質心距離(或者行政中心距離)。故距離越遠,空間權重系數越小,空間相關性越差。
1.2.3 經濟權重矩陣
廣義距離:比如經濟距離。在研究區域經濟聚集現象時,很多情況下地理位置相鄰并不能代表相關性相同。與基于地理信息構造的空間權重矩陣相比,經濟權重矩陣的實際應用背景較強,其沒有統一的數學表達式。下面例子構建一個較為簡單的關系權重:
其中,YiY_{i}Yi?和YjY_{j}Yj?代表各區域的經濟發展水平∣Yi?Yj∣|Y_{i}-Y_{j}|∣Yi??Yj?∣則代表兩者的經濟距離。
那如何利用shp文件創建空間權重矩陣呢?可參考:創建空間權重矩陣
1.3 全局自相關—莫蘭指數
利用各年的GDP,EI生態環境綜合指數做空間自相關的全局莫蘭指數分析,得出莫蘭指數值均在10%以上,說明GDP,EI存在明顯的空間依賴性。繼續對每一年的變量做全局莫蘭指數,會發現它們隨時間變化,其空間區域相關性的變化是如何的。
具體參考:全局莫蘭指數的計算
1.4 局部莫蘭指數
局部莫蘭指數的計算方式要簡潔許多,其計算方式如下:
從上式不難看出,IiI_{i}Ii?的正負取決于yi?yˉy_{i}-\bar{y}yi??yˉ? 和后面那一坨。前者可反映出第i 個地區的經濟發展水平與整個區域的平均水平之間的高低情況,后者則反映出第i 個地區的周邊地區與整個區域水平之間的高低情況。兩個式子都有高低兩種可能性,兩兩組合,共有四種情況。(與四個象限一樣)
具體制作莫蘭指數散點圖:局部莫蘭散點圖實操
2.1 模型選擇與空間杜賓模型解釋
2.1.1 常用的三種空間模型
以區域經濟學理論出發,研究空間與區域經濟之間的關系。空間面板模型也衍生出眾多子模型,如空間自回歸模型(SAR )或者指空間滯后模型( SLM)、空問誤差模型( SEM) 、空間杜賓模型(SDM)等等。
2.1.1.1空間自回歸模型SAR(空間滯后模型SLM)
定義:區域行為受到文化環境及與空間距離有關的遷移成本的影響,具有很強的地域性(Anselin et al.,1996)。由于SLM模型與時間序列中自回歸模型相類似,因此SLM也被稱作空間自回歸模型(Spatial Autoregressive Model,SAR)。
公式如下:y=ρWy+Xβ+εy=ρWy+Xβ+εy=ρWy+Xβ+ε
參數β反映了自變量對因變量的影響,空間滯后因變量W(空間權重矩陣)是一內生變量,反映了空間距離對區域行為的作用。
2.1.1.2 空間誤差模型(SEM)
空間誤差模型(spatial error model,SEM)描述了空間擾動相關和空間總體相關,其形式如式所示:
其中,𝜆為空間誤差相關系數,度量了鄰近個體關于被解釋變量的誤差沖擊對本個體觀察值的影響方向與程度;W為空間權重矩陣,其中元素𝒘𝒊𝒋 描述了第j個與第i個截面個體誤差項之間的相關性。 SEM模型說明了區域間外溢是隨機沖擊作用結果,其經濟含義在于:在某一地區發生沖擊會隨著協方差結構形式 傳遞到相鄰區域,而這一傳遞形式具有長期延續性且逐步衰減。
空間誤差模型其實就是將回歸項放到了誤差里面,簡單的來說,SLM是研究因變量自相關,而SEM是研究誤差項自相關。
2.1.1.3 空間杜賓模型(SDM)
空間杜賓模型是空間滯后模型和空間誤差模型的擴展形式,同時考慮因變量和自變量的自相關性。
含有兩個空間權重矩陣
Y=δW1Y+αlN+Xβ+W2Xθ+εY=δW1Y+αlN+Xβ+W2Xθ+εY=δW1Y+αlN+Xβ+W2Xθ+ε
兩個矩陣可以相同,也可以不同,
W1是因變量也就是被解釋變量的空間相關關系,
W2是自變量也就是解釋變量的空間相關關系。
不同空間依賴模型之間的關系:
2.1.2 空間杜賓模型的評估與解讀
首先,利用LM檢驗和Robust·LM檢驗,檢驗空間自回歸模型( SAR)或空間誤差模型(SEM)是否比無空間效應模型更適合;其次,利用LR檢驗時間效應和空間效應是否顯著﹔.再者,利用LR檢驗空間杜賓模型( SDM)是否會退化為空間滯后模型( SAR)和空間誤差模型((SEM)。
上面這些模型選擇過程,是可在stata統計分析軟件中,通過得到的模型面板數據,先是通過截面數據整理獲得面板數據,在stata中演示如何進行模型選擇:演示模型選擇與解讀案例。
Elhorst模型選擇方法檢驗結果:(案例驗證選擇流程)
第一步:檢驗模型是否存在空間效應,LM檢驗和Robust-LM檢驗均通過顯著性檢驗,為此應選擇帶空間效應的面板模型。
第二步:對模型的效應類型進行檢驗,即檢驗是否是固定效應,還是隨機效應。檢驗結果顯示霍斯曼檢驗拒絕原假設,固定效應模型優于隨機效應模型,應該選擇固定效應模型。
第三步:檢驗SDM模型是否會退化為SARI模型或者SEM模型,表顯示無論是空間滯后模型( SAR))還是空間誤差模型( SDM)和空間杜賓模型( SDM)相比,LR檢驗結果顯示均拒絕原假設,應該選擇SDM模型。
第四步:檢驗固定效應的類型,是時期固定、個體固定亦或|是雙固定模型。表顯示應該選擇雙固定效應的模型。
綜上,最終的模型應該是雙固定效應的SDM模型。
任務1:
- 通過整理截面數據成面板數據,再導入stata 中用以做空間相關性的分析。比如用縣域GDP,縣域行政區域,EI(數據集1),加入縣域空間權重矩陣(數據集2)去解釋評估生態環境狀況指數(EI)的影響。這里是下一步馬上需要自己去驗證實現的。
任務2:
- 在之前的圖譜中(增加展示關聯信息)
1:加入市級單位,(需要手動區分收集相關數據),體現每個市域的GDP增長率,人口流入出變化率,EI變化率等;
2:體現縣域GDP的增長率,人口的人口流入出變化率,EI變化率。
這兩個任務盡快的實現起來!!!
二. 力源項目相關
2.1 對出庫統計按日期的搜查結果的修正
之前由于是在頁面獲取日期時,將兩個日期給固定寫死了,所以一直都是按之前那兩個固定的時期之內的才可以完成查找顯示。
修改處:
修改后效果:
可以正常按日期搜索顯示出庫統計結果。
2.2 對稽核統計之處的按姓名查詢的修改
2.3 對稽核人員管理處信息的刪除徹底(之前只是在頁面刪除)
2.4 還需對稽核人員信息管理與出庫人員管理信息的修改添加頁面
2.5 以及需要完成出庫APP與稽核APP的部署。
三.文獻
四. 本科畢設
總結
對空間計量經濟學分析,有了一定的理解,最關鍵的還是利用現有的截面數據轉換成所需要的面板數據,以及創建空間權重矩陣,這些數據必須準備好;再通過stata統計分析軟件去空間相關性分析。將這些分析的結果利用起來,這些關聯盡快添加到圖譜中去,完成一個demo案例。
總結
以上是生活随笔為你收集整理的空间相关分析与SDM的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 分布式常见面试题总结(2021)
- 下一篇: RSA加密2048