计量经济学建模_浅谈统计学模型(兼计量经济学模型)
計(jì)量經(jīng)濟(jì)學(xué)模型是從統(tǒng)計(jì)學(xué)模型中衍生出來的,故將它們一并放在此處進(jìn)行說明。
實(shí)際上,很多人在很久之前就督促我寫一篇統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)模型的文章,但我太懶惰,一直拖到現(xiàn)在,也是十分汗顏。
先講一些統(tǒng)計(jì)學(xué)上的基礎(chǔ)故事,主要以豬重估計(jì)與沉船搜索為例吧。某個(gè)地區(qū)每年舉辦一次豬的重量的競(jìng)猜活動(dòng),與真實(shí)重量最接近的人獲得獎(jiǎng)金。數(shù)學(xué)家將這些五花八門的競(jìng)猜數(shù)據(jù)進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)其平均值與真實(shí)值幾乎相等。第二個(gè)例子說的是打撈沉船的事情,讓多個(gè)團(tuán)隊(duì)進(jìn)行設(shè)想,并估計(jì)船只沉的過程及沉落地,然后將所有的結(jié)果進(jìn)行統(tǒng)計(jì),所得的地點(diǎn)與沉船實(shí)際地點(diǎn)很近。
可以看出,統(tǒng)計(jì)學(xué)還是有一定的意義的。上述的兩個(gè)事例僅僅說明了單變量比較準(zhǔn)確。實(shí)際上,多個(gè)變量之間也存在著一定的因果關(guān)系。這種情況下,統(tǒng)計(jì)學(xué)描述這一問題準(zhǔn)確嗎。
統(tǒng)計(jì)學(xué)在這個(gè)問題上借鑒了映射的概念,而其中最重要的是函數(shù)/方程關(guān)系,最簡(jiǎn)單的莫過于線性。比如假定一個(gè)變量x是另一個(gè)變量y的原因,在線性思維的基礎(chǔ)上,這兩個(gè)隨機(jī)變量大致滿足下列的形式
(1)
由于y與x均是隨機(jī)變量,實(shí)際測(cè)定的數(shù)組(x,y)總不落在直線y=ax+b上,而是圍繞著這個(gè)直線上下波動(dòng)。
當(dāng)然,線性化假設(shè)不能描述事物的本質(zhì),我們往往處在一個(gè)非線性的社會(huì)之中,非線性現(xiàn)象比比皆是。另外,經(jīng)濟(jì)與管理中,存在著大量的非函數(shù)映射關(guān)系,這個(gè)顯然是y=ax+b無法解釋的。更進(jìn)一步的,經(jīng)濟(jì)與管理中不是兩個(gè)變量所決定的,而是由多個(gè)變量所決定,對(duì)于每一事物,其表現(xiàn)特征是多維的,不妨假設(shè)它們之間的因果關(guān)系為
圖1映射
此時(shí),方程y=ax+b就難以描述上面的問題。故此,需要有更加先進(jìn)的方法來分析。為簡(jiǎn)單起見,我們假設(shè)y1,y2,……ym之間獨(dú)立,互不相關(guān)。以其中一個(gè)為例,可知
? ?(2)
這個(gè)多元函數(shù),需要有大量的數(shù)據(jù),才可以將所有的參數(shù)?與,……估計(jì)出來。
在一元函數(shù)中,由點(diǎn)離直線距離表示映射的準(zhǔn)確性。比如
? ? ? ? ?(1)????????????????????(2)
? ? ? ? ? ? ? ? ? 圖2
圖(2)比圖(1)所擬合的方程準(zhǔn)確。但對(duì)于多元函數(shù)來說,這個(gè)參數(shù)在什么情況下是正確的,則成為統(tǒng)計(jì)學(xué)家與計(jì)量經(jīng)濟(jì)學(xué)家所關(guān)注的重點(diǎn)問題之一。一種叫最小二乘法的估計(jì)方法——當(dāng)然是最簡(jiǎn)單的、最粗糙的方法,確定參數(shù)的大小——參數(shù)的準(zhǔn)確性決定了方程的準(zhǔn)確性。計(jì)量經(jīng)濟(jì)學(xué)或多元統(tǒng)計(jì)學(xué)中對(duì)于最小二乘法的講解異常晦澀,很少有人能理解。今天,我們一改之前的文風(fēng),在此處花一點(diǎn)點(diǎn)筆墨,講一下這個(gè)最小二乘法。
不妨假定獲取了m個(gè)樣本的數(shù)據(jù),假定每個(gè)樣本基本上服從
則有
? ? (3)
寫成矩陣的形式,可知
? ? (4)
假定ω服從N(0,1),則有
(5)
現(xiàn)在已知X與Y、B未知,故做以下的變換,便可得到B的值
(6)
? ?(7)
?是最小二乘法的本質(zhì),其余的,如加權(quán)最小二乘法,便是在此基礎(chǔ)上的拓展。在好的估計(jì)方法之下,方程的準(zhǔn)確性便會(huì)增加。
正如前文所述,還有更多的非線性關(guān)系,那么這種關(guān)系的多樣性與復(fù)雜性決定了統(tǒng)計(jì)或計(jì)量的多樣性與復(fù)雜性,我們關(guān)注線性關(guān)系的主要原因并不是線性分析的簡(jiǎn)單性,還是因?yàn)楹芏嗍挛锟梢赞D(zhuǎn)化成線性的,以著名的生產(chǎn)函數(shù)為例,
(8)
就可以轉(zhuǎn)化成線性方程
? ?(9)
我們稱之為無標(biāo)度性,或冪律分布。無標(biāo)度是一個(gè)經(jīng)濟(jì)與管理中非常著名的特征。正如在《規(guī)模》中所述的,世界萬物都可以歸結(jié)為這種屬性。不過最關(guān)鍵的是要找到這些變量,一旦發(fā)現(xiàn)了這些變量以及這個(gè)對(duì)應(yīng)的關(guān)系,就有重大的發(fā)現(xiàn)。然而,最困難的是發(fā)現(xiàn)這些變量,一般情況下這種變量很難找到,不僅需要對(duì)所研究對(duì)象非常熟悉,而且需要大量的探索。唯有不斷地探索、不斷的失敗,才能找到合適的變量。這種線性關(guān)系不僅在數(shù)學(xué)上成立,更應(yīng)該在實(shí)際中找到對(duì)應(yīng)的因果關(guān)系。
無標(biāo)度性,也稱標(biāo)度不變性,指的是對(duì)自變量坐標(biāo)進(jìn)行任意的拉伸或壓縮后,函數(shù)的表達(dá)形式不變,即
(10)
而這種形式,僅有冪函數(shù)滿足它。不妨令,則有,恰好滿足這個(gè)直線關(guān)系。
然而在統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)的模型中,也并非僅僅有這一種映射(函數(shù))關(guān)系,還有更多的模型等著我們?nèi)ヌ剿鳌W屛覀円陨芷诶碚摓橹?#xff0c;分析一下經(jīng)濟(jì)組織的一般發(fā)展機(jī)制,在事物發(fā)展變化過程中,我們一般認(rèn)為可以分成若干個(gè)階段。不同階段中,它的影響因素不同——此處的不同不僅僅局限于量的不同,而且還會(huì)包括因素種類的不同。在事物剛剛發(fā)展(比如初建企業(yè))之時(shí),它能否成長(zhǎng)的原因在于產(chǎn)品本身以及企業(yè)努力,此時(shí)關(guān)注了企業(yè)的經(jīng)營(yíng),但當(dāng)事物成熟之后,對(duì)其發(fā)展起決定作用的則在于管理,尤其是在發(fā)展的制度。可見它的因素會(huì)不斷變化。如果新研究的問題恰好處于成長(zhǎng)與成熟的中間狀態(tài)——我們稱之為“接續(xù)態(tài)”,則因素的變化非常明顯,模型會(huì)變成
? ??(11)
這其中就描述了影響因素的變化性。如果碰到此類問題,就需知道哪個(gè)狀態(tài)變化(拐點(diǎn))的時(shí)間,以及在切換過程中因素的變化情況,如下圖所示:
圖3
如上圖所示,在接續(xù)態(tài)有一個(gè)下限與上限,在此區(qū)域中,關(guān)鍵因素的切換非常快,也許在前一時(shí)刻還是主要的影響因素,在下一刻就會(huì)成為次要的因素,反之亦然。
這個(gè)過程中的統(tǒng)計(jì)模型實(shí)際上非常難構(gòu)建。為了方便分析,在接續(xù)狀態(tài)一般會(huì)考慮所有的因素,即使次要因素的影響不顯著,也不應(yīng)在意,也許在下一個(gè)時(shí)刻就顯著了呢。在這個(gè)“接續(xù)態(tài)”中,方程在不斷的變化,主要體現(xiàn)在參數(shù)不斷的變化。這個(gè)變化一般有三種:j圍繞一個(gè)數(shù)值上下隨機(jī)波動(dòng),但不能超過某一個(gè)界。k是一個(gè)隨機(jī)變量,但受到近期影響力度強(qiáng)于遠(yuǎn)期的影響,也就是說,每個(gè)時(shí)間點(diǎn)的系統(tǒng)特征對(duì)后續(xù)都有影響。離得越近的系統(tǒng)對(duì)其影響越大,如股市屬于此類。③參數(shù)是一個(gè)隨機(jī)過程,且參數(shù)之間構(gòu)成一個(gè)鞅差序列—這種情況最為復(fù)雜。在混沌狀態(tài)下,經(jīng)濟(jì)與管理系統(tǒng)就具備這種性質(zhì)。那么,對(duì)于這個(gè)系統(tǒng)的統(tǒng)計(jì)意義上的模型,最有效的估計(jì)方法有LMS與卡爾曼濾波。這種時(shí)變隨機(jī)結(jié)構(gòu)的系統(tǒng)更能體現(xiàn)經(jīng)濟(jì)系統(tǒng)的復(fù)雜性與隨機(jī)性。
讓我們退回來,回到統(tǒng)計(jì)模型的多樣性上。多元統(tǒng)計(jì)除此之外,還有大量的其他模型。計(jì)量經(jīng)濟(jì)學(xué)在此基礎(chǔ)上更是推出了形形色色的模型,這些所謂的一個(gè)又一個(gè)的模型,讓分析者的選擇難度變得更大。
首先,在這一類模型中,除了連續(xù)性變量,也有分類變量、序類變量。不妨假設(shè)我們考慮他們,一般的做法是加入一個(gè)虛擬變量——啞變量作為參考值,而當(dāng)與另一種情況進(jìn)行比較,值得注意的是,一旦建立一個(gè)參考——參照物,我們必須弄清這個(gè)分類變量的性質(zhì)—既有無“序”的出現(xiàn)——此處的“序”很關(guān)鍵。進(jìn)一步來說,當(dāng)各個(gè)類型之間屬于平等時(shí),用虛擬變量會(huì)讓模型變得有意義。但如果不平等,有一些等級(jí)關(guān)系時(shí),情況則變得更復(fù)雜。事實(shí)上,當(dāng)分類變量作為解釋變量、控制變量時(shí),我們?cè)谧鼋y(tǒng)計(jì)模型的時(shí)候,相當(dāng)于提前對(duì)總體行為分類,針對(duì)每一類型來說,做出的一個(gè)對(duì)應(yīng)模型。一般講,對(duì)于關(guān)系“平等”的分類變量來說,其最終效用的差異主要體現(xiàn)在類型的差異上,與其他連續(xù)型變量關(guān)系不大。如果這其中有一些序關(guān)系的存在,則在其他連續(xù)型變量的影響會(huì)截然不同。
舉例來說,如果我們的分類變量有一個(gè)是“貧富”,而資源獲取能力、社會(huì)關(guān)系的強(qiáng)弱影響會(huì)差異很大。對(duì)于窮人來說,顯然錢比關(guān)系重要,但對(duì)于富人來說,關(guān)系比錢重要。他們獲利能力的差異性就很強(qiáng)。如果用經(jīng)典意義上的分類變量處理方法建模,必將得到一個(gè)錯(cuò)誤的結(jié)果。
當(dāng)這些分類變量變成被解釋變量時(shí),就會(huì)衍生出幾個(gè)模型、Logistic模型、Probit模型、Multi-Logistic模型,這種概率選擇模型在近幾年被大量的應(yīng)用,甚至是錯(cuò)誤的應(yīng)用。一般的,某種形式被選擇需依賴于一些因素。如果知道某一經(jīng)濟(jì)體這些因素的特征,就可以測(cè)算出選擇特定狀態(tài)的被選的概率大小。而Probit模型與其他兩者最大的區(qū)別在于,Probit的被解釋變量屬于有序分類變量,而Logistic與Multi-Logistic的被解釋變量屬于無序分類變量。對(duì)于Probit模型的分析,難度遠(yuǎn)遠(yuǎn)大于其他兩者。
無論是Logistic,還是Probit模型,我們都稱之為非線性模型。不過這種非線性模型是比較簡(jiǎn)單的非線性模型,而不是真正的非線性模型,并且這個(gè)模型是確定的,而非隨機(jī)的。
當(dāng)然,還有一些非線性統(tǒng)計(jì)模型,鑒于篇幅原因,不作釋解,僅僅提下。
統(tǒng)計(jì)學(xué)與計(jì)量經(jīng)濟(jì)學(xué)中的基本條件中有一個(gè)非常重要,叫多重共線性。多重共線性的本質(zhì)原因是對(duì)管理與經(jīng)濟(jì)系統(tǒng)的性質(zhì)不清。這時(shí)只好把所有能考慮的因素都考慮上。一般的做法有幾種:①降維:用逐步回歸的做法,將不重要的變量逐個(gè)刪掉,觀測(cè)結(jié)果的準(zhǔn)確性,直到刪一個(gè)變量之后模型的結(jié)果發(fā)生顯著變化為止,這個(gè)工作量極其大。在功利主義盛行的今天,“浮躁”與“學(xué)術(shù)造假”之風(fēng)不斷的幾天,很少有人認(rèn)真的做研究,也不會(huì)有人認(rèn)真的選擇了。②主成分分析/因子分析,將二者放在一起說明,其實(shí)也不是很恰當(dāng),畢竟這是統(tǒng)計(jì)學(xué)中一種比較偷懶的方法。然而,在數(shù)學(xué)上有道理,在經(jīng)濟(jì)與管理中不一定行得通,這主要是因?yàn)?#xff0c;在經(jīng)濟(jì)與管理中,不同類型的變量可以再細(xì)分,但他們屬于同一個(gè)“父輩”,如果能找到這種邏輯關(guān)系,主成份分析/因子分析才有意義。見下圖
圖4
從圖中可以看出x1~x3是從A中分下來的? x3~x5從B的視角下分下來的變量。如果不考慮這個(gè)拓?fù)浣Y(jié)構(gòu),直接按照統(tǒng)計(jì)學(xué)的觀點(diǎn)來降維這些變量,其拓?fù)浣Y(jié)構(gòu)將變成
圖5
雖然,這二者之間降維后的特征會(huì)有很大的區(qū)別,故此,在定量降維之前,定性分析的必要性很強(qiáng)。③減少參數(shù)估計(jì)量的方差——嶺回歸法。這種方法屬于技術(shù)上的處理方法,而不屬于本質(zhì)性的分析。就我個(gè)人而言,我認(rèn)為方法并不重要,洞察問題本質(zhì)才是最根本的解決之道,但作為基本的手段,我們還是需知道一些的,在回歸分析中我們認(rèn)為
? 最小二乘法是讓其殘差平方和最小,即而得到的。但如果出現(xiàn)多重共線性,的行列式接近于0,則為一個(gè)不適定問題。嶺回歸的做法就是將這個(gè)“不適定”問題轉(zhuǎn)換成“適定”問題:為損失函數(shù)加上一個(gè)正則化項(xiàng)。
,?????其中?? (12)
?? 故,其中為單位矩陣。從上面可以看出,嶺回歸從本質(zhì)上并沒有解決解釋變量相互解釋的現(xiàn)象,反之是從數(shù)學(xué)手段上對(duì)其進(jìn)行了一定的處理。當(dāng)系統(tǒng)屬性不明確時(shí),我們可以用此類方法來處理。
? 當(dāng)然,變量之間相互解釋的觀察并不一定要死守看經(jīng)典的模型。我們可以選擇SEM(結(jié)構(gòu)方程模型)來處理這一問題。不過需注意的是,SEM模型對(duì)定性分析的要求非常高。
? 統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)都要求有足夠的樣本做支撐。如果樣本量較少怎么辦?科學(xué)家構(gòu)成了一個(gè)SVMC(支持向量機(jī))模型,這個(gè)模型可以解決對(duì)應(yīng)的問題。
? 總之,由于得到充分的發(fā)展,統(tǒng)計(jì)學(xué)的計(jì)量經(jīng)濟(jì)學(xué)中還有大量的靜態(tài)模型,由于篇幅有限,我們不做一一介紹。我們主要是介紹這一類模型的思想、思維,并不局限于方法的說明。如有興趣,不妨去查閱專業(yè)的資料。
? 其實(shí),要準(zhǔn)確刻畫事物的特征,就應(yīng)加入時(shí)間的因素,讓這些個(gè)靜態(tài)的模型“動(dòng)”起來。在統(tǒng)計(jì)學(xué)或計(jì)量經(jīng)濟(jì)學(xué)時(shí),時(shí)間這一因素已被重視,尤其是單一變量的時(shí)間序列過程。已得到非常全面的描述,在本文中不再啰嗦。在下文中,我們將提出“時(shí)滯”的思想。
假設(shè)經(jīng)濟(jì)與管理的問題可由一組變量所描述,這種描述可以分成兩種情況。一是刻畫特征。二是描述內(nèi)在機(jī)制。無論哪種,都將面臨著以下三種類型的變量。①即時(shí)刻畫/影響經(jīng)濟(jì)與管理系統(tǒng)狀態(tài)屬性的變量,我們稱之為一致性指標(biāo)/因素②提前一段時(shí)間就可以刻畫/影響經(jīng)濟(jì)與管理系統(tǒng)狀態(tài)屬性的變量。我們稱之為先行性指標(biāo)/因素。這類具有預(yù)兆性的變量往往在事物發(fā)展之前就會(huì)影響管理系統(tǒng)的特征③滯后一段時(shí)間才會(huì)刻畫影響經(jīng)濟(jì)與管理系統(tǒng)的屬性,我們稱之為滯后指標(biāo)/因素,這句話似乎有問題,但你沒聽錯(cuò),的確是這樣的。比如說,我們要評(píng)價(jià)某個(gè)科學(xué)家的科研實(shí)力,用一致性指標(biāo)所得的結(jié)果遠(yuǎn)沒有利用滯后性所得的結(jié)果的準(zhǔn)確。因?yàn)榭茖W(xué)研究結(jié)果是真是假需要實(shí)踐來驗(yàn)證。同樣的,未來可能的因素會(huì)影響該經(jīng)濟(jì)/管理系統(tǒng)的屬性。比如說,中國(guó)在20年之后的人口結(jié)構(gòu)(以年齡為參考點(diǎn))將嚴(yán)重影響目前消費(fèi)產(chǎn)品與服務(wù)結(jié)構(gòu)的決策。故此,該模型將變成下面的形式。
(13)
?其中、、分別表示,先行型指標(biāo)/變量、一致指標(biāo)/變量、滯后型指標(biāo)變量。l1? 和l2分別表示先行周期與滯后周期、l1? 與l2是一個(gè)正數(shù),故此對(duì)x1、 x2與x3的識(shí)別與構(gòu)造,以及l(fā)1?與l2的確定則顯得尤為重要。對(duì)于前者,我們?cè)谇拔闹械暮芏嗥杏刑徇^。但對(duì)于l1? 與l2的確定。則需要進(jìn)一步的定性定量分析。事實(shí)上,也有成形的相關(guān)理論對(duì)此進(jìn)行分析,建議有興趣的讀者自行查閱。
如果方程(13)具有參數(shù)隨機(jī)時(shí)變的特征,則用最小二乘法、加權(quán)最小二乘法等經(jīng)典的算法難以對(duì)此進(jìn)行估算。此時(shí)LMS算法及Kalmman濾波大有作為了,甚至是更加先進(jìn)的啟發(fā)式算法。比如蟻群算法。
在前面的內(nèi)容中,我們的變量都是結(jié)構(gòu)性的變量,那么,如果這些變量是圖片、音頻、視頻和文字,我們則想知道,統(tǒng)計(jì)學(xué)模型還適用嗎?答案是肯定的,多維統(tǒng)計(jì)學(xué)習(xí)則是一種有效的工具,比如深度神經(jīng)網(wǎng)絡(luò)模型,其中的變量就可以是非結(jié)構(gòu)化的數(shù)據(jù),關(guān)于深度神經(jīng)網(wǎng)絡(luò),我們將在后文中進(jìn)行闡述,此處不再多說。
上面的分析,主要針對(duì)的是函數(shù)和方程,然而在經(jīng)濟(jì)與管理的問題中,更多的是映射。即圖1所述,這種情況下,問題會(huì)更加復(fù)雜,對(duì)于這一問題,結(jié)構(gòu)方程,深度神經(jīng)網(wǎng)絡(luò)都是一個(gè)比較有效的工具。對(duì)于神經(jīng)網(wǎng)絡(luò)所存在的梯度消失或梯度爆炸、訓(xùn)練太慢、過擬合等三大缺陷,引入無監(jiān)督學(xué)習(xí)算法大大提高了效率,從而使得神經(jīng)網(wǎng)絡(luò)應(yīng)用非常普遍。它是對(duì)映射解決的一種較為有效的模型,通過對(duì)大量的案例(樣本)的學(xué)習(xí),我們就可以得到各個(gè)節(jié)點(diǎn)中的權(quán)重,這個(gè)權(quán)重描述由輸入到多輸出之間的映射屬性,然后在訓(xùn)練成功的基礎(chǔ)上,對(duì)未知的事件進(jìn)行分析,以便得到未知事件的性質(zhì)。
在多維統(tǒng)計(jì)學(xué)習(xí)中,還有一些其他的方法。都會(huì)在經(jīng)濟(jì)與管理的科學(xué)研究中發(fā)揮巨大的功能,比如人工智能。正如我們?cè)凇洞髷?shù)據(jù)是思想,是思維還是方法?》一文中所講的,目前最關(guān)鍵的是對(duì)各種算法進(jìn)行嚴(yán)密的證明,如果能突破若干個(gè)基本問題,則會(huì)大大推動(dòng)這一領(lǐng)域的發(fā)展。
鑒于篇幅有限以及本文的目的,我們不再花大量的筆墨分析各個(gè)模型,在這里我們將重點(diǎn)討論如何使用這些模型,以及如何正確使用模型。換句話說,我們不應(yīng)該為了模型而模型,以及不應(yīng)該被模型綁架。首先我們必須關(guān)注統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)的使用條件,不是所有的問題都可以用它來解決,比如優(yōu)化、博弈、動(dòng)力學(xué)、復(fù)雜網(wǎng)絡(luò)、概率,都無法用統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)去解釋。其次,統(tǒng)計(jì)學(xué)的回歸分析中——目前計(jì)量經(jīng)濟(jì)學(xué)也在關(guān)注這一塊兒,其解釋變量必須滿足的幾大條件,比如樣本的隨機(jī)性,變量的獨(dú)立同分布性,噪聲也有要求。然而在我們?nèi)粘5难芯坷又?#xff0c;很少有人完全做到這三大要求。比如樣本的隨機(jī)性在研究中就很難實(shí)現(xiàn),因?yàn)槲覀償?shù)據(jù)的可獲得性較差所致。畢竟這個(gè)不等同于隨機(jī)實(shí)驗(yàn),無法隨心所欲的得到數(shù)據(jù),故此很多科學(xué)家便依賴于統(tǒng)計(jì)年鑒和問卷調(diào)查。而依賴于某種數(shù)據(jù)時(shí),本身便失去了隨機(jī)性。比如,有人研究中國(guó)的企業(yè)創(chuàng)新問題,但只能獲取A股企業(yè)的數(shù)據(jù),沒有未上市的企業(yè)以及眾多的未上市的中小企業(yè)。那么,對(duì)于技術(shù)創(chuàng)新本身來講,到底是中小企業(yè)創(chuàng)新的多,還是上市企業(yè)創(chuàng)新得多,這本身就需要論證。如果僅僅采用上市企業(yè)的數(shù)據(jù),那么未上市企業(yè)則被排除,這個(gè)悖論應(yīng)該是一個(gè)很好的切入點(diǎn)。一旦選擇A股企業(yè),那么選擇企業(yè)時(shí),很多人都會(huì)選擇競(jìng)爭(zhēng)力在前百分之X的企業(yè)。顯然,這個(gè)選擇并不是隨機(jī)選擇,而是典型分析,不符合統(tǒng)計(jì)分析與計(jì)量經(jīng)濟(jì)學(xué)的思想,所得的結(jié)論也會(huì)有所偏差。現(xiàn)在分析第二個(gè)條件:在分析時(shí)大都要求變量滿足獨(dú)立同分布的條件。在這點(diǎn)上,大家做的都不太好。下面舉幾個(gè)例子,首先變量的類型不一致,在其中有效益變量,也有成本性變量,還有居中型變量。在分析的過程中都應(yīng)該把變量化成效益型變量。成本型和居中型變量的轉(zhuǎn)化方法分別如下:
(14)
這里,假定居中型變量的曲線如圖6:
圖6
圖7
對(duì)于圖7的情況則恰好相反,其中很多科研工作者都不對(duì)變量進(jìn)行無量綱化處理,而這個(gè)更為重要,當(dāng)且僅當(dāng)量綱去掉之后,統(tǒng)計(jì)模型才準(zhǔn)確可靠。再次,他們也沒有進(jìn)行標(biāo)準(zhǔn)化處理,將所有的變量變成0-1之間的一個(gè)數(shù)。第四,所有很多經(jīng)濟(jì)與管理學(xué)家在做研究時(shí)喜歡采用問卷調(diào)查的方法,而在問卷調(diào)查中會(huì)涉及到很多分類變量,并且有一定的無序分類變量,比如性別,民族,地域,然后很多人就用這些數(shù)據(jù)進(jìn)行回歸分析。顯然這是一種錯(cuò)誤的做法,舉例來說,設(shè)0=男,1=女,那么他們只能以分類變量進(jìn)入回歸模型中,而不能直接放入。畢竟1>0,但女男。
即使對(duì)于有序分類變量,我們也不能隨便的采用直接回歸,而應(yīng)當(dāng)進(jìn)行適當(dāng)?shù)奶幚怼T龠M(jìn)一步來說,在分析中,自變量必須有且至少有一個(gè)連續(xù)變量才可以得到正確的結(jié)論。因?yàn)橛行蚍诸愖兞康慕M內(nèi)方差、組間平方差以及總平方差都無法找到。這些科學(xué)家混淆了回歸分析中的那個(gè)最小二乘法的內(nèi)涵,它只能針對(duì)連續(xù)變量,對(duì)于離散變量則不會(huì)如此處理。
在統(tǒng)計(jì)學(xué)中,噪聲一般都假設(shè)為一個(gè)白噪聲,因?yàn)樗械淖兞慷技僭O(shè)是一個(gè)服從特定分布如正態(tài)分布的隨機(jī)變量,所以多個(gè)變量的聯(lián)合分布也服從正態(tài)分布的假設(shè)。然而,在實(shí)際中,這個(gè)噪聲并不是白噪聲,而是一個(gè)彩噪聲,我們對(duì)于其分析也有類似的處理。詳情可查閱對(duì)應(yīng)的資料。
我應(yīng)該關(guān)注每一個(gè)模型的適用條件,這一點(diǎn)非常關(guān)鍵,知道每個(gè)模型的前因后果才能把我們的問題抽象成和對(duì)應(yīng)的模型,這些在前文已已有涉及,在此不再累贅。其實(shí)我們知道每一個(gè)模型都蘊(yùn)含著一種思想,模型本身的思想思維過程的重要性遠(yuǎn)遠(yuǎn)大于形式以及其參數(shù)估計(jì)方法。
關(guān)于統(tǒng)計(jì)與計(jì)量經(jīng)濟(jì)學(xué)中的一些問題,我們先談到這里,文章不能將所有的內(nèi)容都一一詳述,只能從其思想,思維及模型自身做一點(diǎn)點(diǎn)見解,試圖達(dá)到拋磚引玉的效果。望對(duì)讀者有所啟示,最后祝在此領(lǐng)域中的各位研究學(xué)者出來更多的優(yōu)秀成果。
總結(jié)
以上是生活随笔為你收集整理的计量经济学建模_浅谈统计学模型(兼计量经济学模型)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 现在白金一克多少钱啊?
- 下一篇: go 声明二维数组_一篇文章了解Go语言