门限回归模型的思想_Stata+R:门槛回归教程
來(lái)源 | 數(shù)量經(jīng)濟(jì)學(xué)綜合整理
轉(zhuǎn)載請(qǐng)聯(lián)系
進(jìn)行回歸分析,一般需要研究系數(shù)的估計(jì)值是否穩(wěn)定。很多經(jīng)濟(jì)變量都存在結(jié)構(gòu)突變問(wèn)題,使用普通回歸的做法就是確定結(jié)構(gòu)突變點(diǎn),進(jìn)行分段回歸。這就像我們高中學(xué)習(xí)的分段函數(shù)。但是對(duì)于大樣本、面板數(shù)據(jù)如何尋找結(jié)構(gòu)突變點(diǎn)。所以本文在此講解面板門限回歸的問(wèn)題,門限回歸也適用于時(shí)間序列。
門限效應(yīng),是指當(dāng)一個(gè)經(jīng)濟(jì)參數(shù)達(dá)到特定的數(shù)值后,引起另外一個(gè)經(jīng)濟(jì)參數(shù)發(fā)生突然轉(zhuǎn)向其它發(fā)展形式的現(xiàn)象(結(jié)構(gòu)突變)。作為原因現(xiàn)象的臨界值稱為門限值。例如,成果和時(shí)間存在非線性關(guān)系,但是在每個(gè)階段是線性關(guān)系。有些人將這樣的模型稱為門檻模型,或者門限模型。如果模型的研究對(duì)象包含多個(gè)個(gè)體多個(gè)年度,那么就是門限面板模型。
1history&Hansen常見(jiàn)模型如下:門檻回歸模型(threshold regression,也稱門限回歸):
漢森(Bruce E. Hansen)在門限回歸模型上做出了很多貢獻(xiàn)。Hansen于1996年在《Econometrica》上發(fā)表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了時(shí)間序列門限自回歸模型(TAR)的估計(jì)和檢驗(yàn)。之后,他在門限模型上連續(xù)追蹤,發(fā)表了幾篇經(jīng)典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》(Hansen (1999) 首次介紹了具有個(gè)體效應(yīng)的面板門限模型的計(jì)量分析方法, 該方法以殘差平方和最小化為條件確定門限值, 并檢驗(yàn)門限值的顯著性, 克服了主觀設(shè)定結(jié)構(gòu)突變點(diǎn)的偏誤。具體思路是:選定某一變量作為門限變量, 根據(jù)搜尋到的門限值將回歸模型區(qū)分為多個(gè)區(qū)間, 每個(gè)區(qū)間的回歸方程表達(dá)不同, 根據(jù)門限劃分的區(qū)間將其他樣本值進(jìn)行歸類, 回歸后比較不同區(qū)間系數(shù)的變化。),2000年的《Sample splitting and threshold estimation》和2004年與他人合作的《Instrumental Variable Estimation of a Threshold Model》。
在這些文章中,Hansen介紹了包含個(gè)體固定效應(yīng)的靜態(tài)平衡面板數(shù)據(jù)門限回歸模型,闡述了計(jì)量分析方法。方法方面,首先要通過(guò)減去時(shí)間均值方程,消除個(gè)體固定效應(yīng),然后再利用OLS(最小二乘法)進(jìn)行系數(shù)估計(jì)。如果樣本數(shù)量有限,那么可以使用自舉法(Bootstrap)重復(fù)抽取樣本,提高門限效應(yīng)的顯著性檢驗(yàn)效率。在Hansen(1999)的模型中,解釋變量中不能包含內(nèi)生解釋變量,無(wú)法擴(kuò)展應(yīng)用領(lǐng)域。Caner和Hansen在2004年解決了這個(gè)問(wèn)題。他們研究了帶有內(nèi)生變量和一個(gè)外生門限變量的面板門限模型。與靜態(tài)面板數(shù)據(jù)門限回歸模型有所不同,在含有內(nèi)生解釋變量的面板數(shù)據(jù)門限回歸模型中,需要利用簡(jiǎn)化型對(duì)內(nèi)生變量進(jìn)行一定的處理,然后用2SLS(兩階段最小二乘法)或者GMM(廣義矩估計(jì))對(duì)參數(shù)進(jìn)行估計(jì)。
2顯著性檢驗(yàn)門檻回歸模型顯著性檢驗(yàn)的目的是,檢驗(yàn)以門檻值劃分的兩組樣本其模型估計(jì)參數(shù)是否顯著不同。
因此,不存在門檻值的零假設(shè)為:Ho:兩個(gè)系數(shù)相同。同時(shí)構(gòu)造LM統(tǒng)計(jì)量:
其中,So是在零假設(shè)下的殘差平方和。由于LM統(tǒng)計(jì)量并不服從標(biāo)準(zhǔn)的分布。因此, Hansen(2000)提出了通過(guò)“自舉法”( Bootstrap)來(lái)獲得漸進(jìn)分布的想法,進(jìn)而得出相應(yīng)的概率p值,也稱為 Bootstrap P值。
這種方法的基本思想是:在解釋變量和門檻值給定的前提下,模擬( Simulate)產(chǎn)生一組因變量序列,并使其滿足N(0,e2),其中e是式(4)的殘差項(xiàng)。每得到一個(gè)自抽樣樣本,就可以計(jì)算出一個(gè)模擬的エM統(tǒng)計(jì)量。將這一過(guò)程重復(fù)1000次。Hansen(1996)認(rèn)為模擬產(chǎn)生的LM統(tǒng)計(jì)量大于式(6)的次數(shù)占總模擬次數(shù)的百分比就是“自舉法”估計(jì)得到的P值。這里的Bootstrap P值類似于普通計(jì)量方法得出的相伴概率P值。例如,當(dāng) Bootstrap P值小于0.01時(shí),表示在1 %的顯著性水平下通過(guò)了LM檢驗(yàn),以此類推。
3置信區(qū)間以上的檢驗(yàn)過(guò)程為只有一個(gè)門檻值的檢驗(yàn)過(guò)程,為了能確定是否存在兩個(gè)門檻值或者是更多的門檻值,我們應(yīng)當(dāng)檢驗(yàn)是否存在兩個(gè)門檻值,拒絕意味著至少存在一個(gè)門檻值。我們可以假設(shè)己經(jīng)估計(jì)的第一個(gè)門檻值,然后開始尋找第二個(gè)門檻值。在確定有兩個(gè)門檻值后,再尋找第三個(gè)門檻值,方法都和前面的一樣,直至我們不能拒絕零假設(shè)。
4門檻回歸及R操作主要使用pdR安裝包,在pdR安裝包中主要使用ptm函數(shù)。
ptm函數(shù)是估計(jì)面板門限模型的一種通用規(guī)范。
此代碼只適用于平衡面板數(shù)據(jù)。它推廣了Hansen(http://www.ssc.wisc.edu/~bhansen/)的簡(jiǎn)單代碼,允許多個(gè)(不止一個(gè))依賴于系統(tǒng)的(ind1)變量。
為了更好地適應(yīng)面板數(shù)據(jù)中閾值建模的一般需要,我們對(duì)原始代碼進(jìn)行了改進(jìn)。bootn和trimn是3×1的向量,表示三個(gè)相應(yīng)的體制的數(shù)字。這個(gè)版本修正了參數(shù)max_lag引起的一個(gè)小錯(cuò)誤,Hansen用它來(lái)通過(guò)lag安排投資數(shù)據(jù)。
在這個(gè)包中,用戶操作數(shù)據(jù)以使個(gè)人研究適合ptm(),因此省略了這個(gè)論點(diǎn),以免自由度會(huì)損失N。
Author(s)
Ho Tsung-wu , College of Management, National Taiwan Normal University.
References
Hansen B. E. (1999) Threshold effects in non-dynamic panels: Estimation, testing and inference. Journal of Econometrics,93, 345-368.
語(yǔ)法格式為:
ptm(dep,?ind1,?ind2,?d,?bootn,?trimn,?qn,?conf_lev,?t,?n)選項(xiàng)含義為
dep:表示因變量,即被解釋變量
ind1:Independent variables: regime dependent,意思為區(qū)制變量
ind2:Independent variables:regime independent,其他不受區(qū)制變量影響的變量
d:門檻變量Threshold variable
bootn:Vector of bootstrap repetition,可以理解為stata命令里面的自舉抽樣次數(shù),即表示網(wǎng)格搜索數(shù)量
trimn:Vector of trimmed percentage,修整比例,根據(jù)門檻個(gè)數(shù)來(lái)確定,具體請(qǐng)看下面案例,1 2 3個(gè)門檻時(shí)候該選項(xiàng)不一致,請(qǐng)看案例
qn:Number of quantiles to examine,門限變量分割的分割點(diǎn)位數(shù),一般默認(rèn)為100,
conf_lev:Confidence level,置信度水平,默認(rèn)為95%
t:Length of time period,時(shí)間
n:Number of cross-section units截面?zhèn)€數(shù)
案例代碼為,首先查看源碼Stata命令里面xthreg所對(duì)應(yīng)的數(shù)據(jù)代碼。
例如:
xthreg需要stata13及以上版本
語(yǔ)法格式為:
xthreg depvar [indepvars] [if] [in], rx(varlist) qx(varname) [thnum(#) grid(#) trim(numlist) bs(numlist) thlevel(#) gen(newvarname) noreg nobslog thgiven options]?
depvar被解釋變量,indepvars 解釋變量,qx(varname) is the threshold variable,門限變量,thnum(#) is the number of thresholds,在stata13.0中門檻值是必要項(xiàng)目,需要等于大于1,小于等于3,默認(rèn)值為1,也就是至少存在三個(gè)門檻值。
門檻回歸的案例
use hansen1999
Estimate a single-threshold model?
xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(1) trim(0.01) grid(400) bs(300)?
Estimate a triple-threshold model given the estimated result above
xthreg i q1 q2 q3 d1 qd1, rx(c1) qx(d1) thnum(3) trim(0.01 0.01 0.05) grid(400) bs(300 300 300)
輸出結(jié)果包括四個(gè)部分。第一部分輸出門限估計(jì)值和自舉法的結(jié)果。第二部分列表輸出門限值及置信區(qū)間,Th-1代表單一門限估計(jì)值,Th-21 和Th-22代表雙門限回歸的兩個(gè)估計(jì)值,有時(shí)Th-21和Th-1相同。第三部分列出了門限檢驗(yàn),包括RSS、MSE、F統(tǒng)計(jì)量及概率值,以及10%、5%、1%的置信水平。第四部分是固定效應(yīng)回歸結(jié)果。
那么通過(guò)這個(gè)例子上面對(duì)應(yīng)的位置就可以很好的理解R操作門檻回歸了!
4.1單門檻回歸及R操作1、單門檻回歸命令代碼
#?R統(tǒng)計(jì)分析與應(yīng)用# 經(jīng)濟(jì)金融數(shù)據(jù)分析及R應(yīng)用# # 計(jì)量經(jīng)濟(jì)學(xué)服務(wù)中心# 2018年1月setwd("C:\\Users\\admin\\Desktop")library(readstata13) library(pdR)# 導(dǎo)入數(shù)據(jù)(計(jì)量經(jīng)濟(jì)學(xué)服務(wù)中心)hansen?"hansen1999.dta")然后進(jìn)行各個(gè)變量設(shè)置:
結(jié)果為:
4.2雙門檻/三重回歸及R操作結(jié)果:注意:上述展現(xiàn)的是雙重門檻的結(jié)果,然后自抽樣次數(shù)修改為1出來(lái)的結(jié)果,這樣保證了軟件運(yùn)行出來(lái)的速度。
另外上述結(jié)果與Stata出來(lái)結(jié)果有細(xì)小的差別!
總結(jié)
以上是生活随笔為你收集整理的门限回归模型的思想_Stata+R:门槛回归教程的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【OS学习笔记】二十四 保护模式七:调用
- 下一篇: biosrecovery什么意思_BIO