常用Stata命令(持续更新中)
生活随笔
收集整理的這篇文章主要介紹了
常用Stata命令(持续更新中)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
為便于實際操作,筆者將命令與顯示結果存儲成do文件(直接可以在Stata軟件中查看,便于學習),移步資源窗口下載。
基本操作命令:
查看數據:
browse #看到全部數據list q #只看到q的數據list q area in 4/10 #顯示指定變量從i=4到i=10的數據describe #查看數據集中的變量名單、標簽summarize q #查看變量q的統計特征summarize q,detail #查看變量q更多的統計指標summarize #若未指明變量,則顯示數據集中所有變量的統計指標tabulate pl #顯示變量pl的經驗累積分布函數pwcorr pl pf pk,sig star(.05)#顯示變量pl、pf、pk之間的相關系數,.05表示顯著性水平為5%I q farmm if q<=200 #顯示滿足條件的指定變量的數據 #還可以設置多個條件,中間要用&連接輸入數據:
cd G:\Stataex #指定默認路徑 pwd #查看當前路徑 import excel "G:\Stataex\expd.xls", sheet("sheet11") firstrow clear #輸入數據 save "G:\Stataex\expanel.dta" #保存數據 # 在 Stata中“/* */”、“*”表示對命令進行注解,在Stata中不會被執行調用數據:
use G:\Stataex\expanel.dta,clear #打開指定路徑下的數據文件,這里的clear表示把之前的數據都清除掉。 shellout "auto.xls" #打開auto.xls, 注意要寫全后綴 import excel "auto.xls",sheet(domestic) #導入Excel數據 label variable lnprice "ln(汽車價格-price)" #為變量lnprice添加標簽 cls #清屏,stata16里的新功能顯示面板數據結構:
xtdescribe #顯示面板數據結構顯示面板數據的統計特征:
xtsum q area provi year #可以查看多個變量(q,area,provi,year)的統計特征查看數據的分布頻率:
xttab q in 1/100 #查看前1到100個q的分布情況 多用于離散模型 #在此基礎上變形 xttab q if q<=100 #查看 q小于等于100時的分布頻率##在使用xttab命令時,需要設置最大值 set maxsize * #在Stata/MP和Stata/SE中,允許的范圍:10< * < 11000 #Stata/IC中:10< * < 800 超過此范圍會報錯畫圖:
xtline q, overlay #表示在同一圖里,畫變量q的時間序列圖,否則,畫n個(n個個體)時間序列圖 histogram q,width(1000) frequency #變量q的直方圖 kdensity q #變量q的連續經驗分布圖/核密度函數圖 scatter tc q #tc與q之間的散點圖 twoway (scatter tc q)(lfit tc q) #散點圖上畫出回歸直線 twoway (scatter tc q)(qfit tc q) #散點圖上畫出二次回歸曲線 graph combine scatter1.gph scatter2.gph #將兩張圖并列排放在一張圖上 #scatter1,scatter2為事先生成圖的文件名 help histogram #查看對于該命令的詳細說明 #保存圖 graph save panel2 replace #表示將圖片保存至默認路徑,將已存在的panel2替換掉生成新變量 (generate/gen/g):
gen lnq = log(g+farmm) g lnq = log(g+farmm) #虛擬變量的生成 qy的取值為1,2,3 1代表東部,2代表中部,3代表西部 g d_qy2=(qy==2) #如果是中部省,生成虛擬變量d_qy2=1,否則為0安裝第三方包:
ssc install st0085_2 #安裝第三方包 help esttab #找到esttab對應的軟件包數據分析:
reg lnq lnarea lnfarmm, r #pool回歸 estimates store POOL11 #est sto POOL11 xtreg lnq lnarea lnfarmm lnagchf, fe vce(cluster provi) #個體固定效應變截距模型--組內估計 est sto FE1 esttab POOL11 FE1, ar2(%8.4f) se(%8.4f) star(*0.1 **0.05 ***0.01) # esttab using test.doc, ar2(%8.4f) se(%8.4f) brackets aic bic mtitles esttab using test1.xls, ar2(%8.4f) se(%8.4f) brackets aic bic mtitles replace #默認展示最近一次回歸的結果 # (%8.4f)表示數據保留小數點后4位有效數字 # star(*0.1 ** 0.05 *** 0.01) 顯著性水平--默認也顯示 # barckets表示se放在中括號里--默認是小括號 # ar2表示修正的R2--r2表示R2 # se表示標準誤 # aic、bic是信息準則 # mtitles表示把POOL11、FE1作為標題名,默認是被解釋變量名 # using test1.doc表示將回歸結果保存至Word文檔變量重命名:
rename larg large #將larg重命名為large計算器功能:
display log(2) #計算log(2)的值線性回歸:
regress lntc lnq lnpl lnpk lnpf #對變量lntc lnq lnpl lnpk lnpf進行回歸分析 vce #顯示估計系數的協方差矩陣 predict lntchat #計算被解釋變量的擬合值,并將其記為lntchat predict e1,residual #計算殘差,并將其記為e1自相關檢驗
#DW檢驗:可檢驗一階自相關(高階無效),在回歸后輸入 estat dwatson #LM檢驗: estat bgodfrey #1階自相關檢驗 estate bgodfrey,lags(2) #檢驗幾階自相關就在括號內輸入幾階異方差檢驗(更新中)
在這里插入代碼片特殊情況的處理:
情況一:個體變量名非數值
例如,province 是個體變量名, year是時點變量名
(注:在運行面板數據的相關命令前,要運行下列命令)
第一步:
encode province, gen(id) #生成新變量ID(取值為1,2,3...)來替代province #若個體變量為1,2,3...整數,就無需使用encoder命令第二步:
xtset id year #本命令相當于告訴Stata, 該數據為面板數據以下命令慎用
drop farmm #刪除變量farmm drop if q<=2000 #刪除滿足條件的數據 keep q area #僅保留q、area兩個變量總結
以上是生活随笔為你收集整理的常用Stata命令(持续更新中)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 路就在脚下,请勇敢的迈步。-----(对
- 下一篇: 用Python实现TXT文件分割