统计决策理论1 统计问题与统计决策
統(tǒng)計(jì)決策理論1 統(tǒng)計(jì)問題與統(tǒng)計(jì)決策
- Kolmogorov公理化體系
- 統(tǒng)計(jì)問題的描述
這個(gè)系列的目標(biāo)是在數(shù)理統(tǒng)計(jì)的語境下建立統(tǒng)一描述統(tǒng)計(jì)問題的統(tǒng)計(jì)決策理論,第一講闡述統(tǒng)計(jì)問題和統(tǒng)計(jì)決策的含義。
Kolmogorov公理化體系
概率論與數(shù)理統(tǒng)計(jì)簡(jiǎn)單地說就是描述隨機(jī)現(xiàn)象的數(shù)學(xué)模型,現(xiàn)代概率論的基礎(chǔ)是Kolmogorov用來描述概率的公理體系。首先定義樣本空間Ω\OmegaΩ,它是所有可以想到的隨機(jī)事件的結(jié)果www的集合。記S\mathbf{S}S是樣本空間的一個(gè)σ\sigmaσ-代數(shù)。PPP是(Ω,S)(\Omega,\mathbf{S})(Ω,S)的一個(gè)非負(fù)測(cè)度,滿足P(Ω)=1P(\Omega)=1P(Ω)=1,也稱PPP是一個(gè)概率測(cè)度或者概率。稱(Ω,S,P)(\Omega,\mathbf{S},P)(Ω,S,P)是概率空間。
如果同一個(gè)隨機(jī)事件獨(dú)立重復(fù)了NNN次,每一次的樣本空間記為(Ωi,Si)(\Omega^i,\mathbf{S}^i)(Ωi,Si),則這NNN次的樣本空間可以記為樣本空間的直積,對(duì)應(yīng)的σ\sigmaσ-代數(shù)是每一個(gè)σ\sigmaσ-代數(shù)的張量積
Ω=Ω1×Ω2×?×ΩNS=S1?S2???SN\Omega = \Omega^1 \times \Omega^2 \times \cdots \times \Omega^N \\ \mathbf{S} = \mathbf{S}^1 \otimes \mathbf{S}^2 \otimes \cdots \otimes \mathbf{S}^NΩ=Ω1×Ω2×?×ΩNS=S1?S2???SN
新的這個(gè)σ\sigmaσ-代數(shù)中的元素的結(jié)構(gòu)可以表示為A1×?×AN={ω∈Ω:ωi∈AN,Ai?Ωi}A^1 \times \cdots \times A^N = \{\omega \in \Omega: \omega^i \in A^N,A^i \subset \Omega^i\}A1×?×AN={ω∈Ω:ωi∈AN,Ai?Ωi},原來的概率測(cè)度可以比較自然地推廣到新的樣本空間上:
P(A1×?×AN)=P(A1)P(A2)?P(AN)P(A^1 \times \cdots \times A^N) = P(A^1) P(A^2) \cdots P(A^N)P(A1×?×AN)=P(A1)P(A2)?P(AN)
如果是一個(gè)隨機(jī)事件的序列,比如Markov鏈,如果最多有NNN步轉(zhuǎn)移,樣本空間的構(gòu)造可以與獨(dú)立重復(fù)事件相同:
(Ω,S)=(×i=1NΩi,?i=1NSi)(\Omega,\mathbf{S}) = (\times_{i=1}^N \Omega^i,\otimes_{i=1}^N \mathbf{S}^i)(Ω,S)=(×i=1N?Ωi,?i=1N?Si)
但概率測(cè)度會(huì)更復(fù)雜。定義Ti(w′,w′′)T^i(w',w'')Ti(w′,w′′)是第iii步從w′w'w′到w′′w''w′′的轉(zhuǎn)移概率密度,則
P(A1×?×AN)=∫A1?∫AN?1P1(dw1)T2(w1,dw2)?TN?1(wN?1,AN)P(A^1 \times \cdots \times A^N) = \int_{A_1} \cdots \int_{A_{N-1}} P^1(dw^1) T^{2}(w^1,dw^2) \cdots T^{N-1}(w^{N-1},A^N)P(A1×?×AN)=∫A1???∫AN?1??P1(dw1)T2(w1,dw2)?TN?1(wN?1,AN)
假設(shè)樣本空間具有有限的元素,Ω={w1,?,wn}\Omega = \{w_1,\cdots,w_n\}Ω={w1?,?,wn?},則概率測(cè)度可以一個(gè)向量p=(p1,?,pn)Tp=(p_1,\cdots,p_n)^Tp=(p1?,?,pn?)T表示,pj=P(wj),?jp_j = P(w_j),\forall jpj?=P(wj?),?j,此時(shí)所有可能的概率測(cè)度均是下面的集合的元素:
{p:pj≥0,?j;∑j=1npj=1}\{ p:p_j \ge 0, \forall j; \sum_{j=1}^n p_j =1\}{p:pj?≥0,?j;j=1∑n?pj?=1}
這個(gè)集合是一個(gè)單純形。
統(tǒng)計(jì)問題的描述
概率論解決的問題是如果我們了解一個(gè)概率空間所有的信息,即所有可能的結(jié)果(Ω,S)(\Omega,\mathbf{S})(Ω,S)以及對(duì)應(yīng)的概率PPP,我們可以做什么。數(shù)理統(tǒng)計(jì)面臨的問題更加現(xiàn)實(shí),因?yàn)檎鎸?shí)情況往往是我們只知道所有可能的,或者部分的事件結(jié)果,也就是我們掌握(Ω,S)(\Omega,\mathbf{S})(Ω,S)的信息,不知道對(duì)應(yīng)的概率測(cè)度PPP。數(shù)理統(tǒng)計(jì)中最常用的參數(shù)統(tǒng)計(jì)的思想是假設(shè)概率測(cè)度屬于某個(gè)分布族{Pθ,θ∈Θ}\{P_{\theta},\theta \in \Theta\}{Pθ?,θ∈Θ},Θ\ThetaΘ被稱為參數(shù)空間,統(tǒng)計(jì)問題就被定義在概率空間(Ω,S,Pθ)(\Omega,\mathbf{S},P_{\theta})(Ω,S,Pθ?)上。
用決策的思路來描述統(tǒng)計(jì)問題,這個(gè)過程是我們通過對(duì)觀察到的一組樣本進(jìn)行一些分析,然后從決策空間(A,A)(A,\mathbf{A})(A,A)中選擇一個(gè)決策a∈Aa \in Aa∈A,A\mathbf{A}A是AAA的一個(gè)σ\sigmaσ-代數(shù)。可以定義決策函數(shù)f:Ω→Af:\Omega \to Af:Ω→A,也就是fff是樣本空間到?jīng)Q策空間的一個(gè)映射。
比較常規(guī)的操作是用Markov概率轉(zhuǎn)移函數(shù)來定義一個(gè)決策過程。我們可以用轉(zhuǎn)移函數(shù)T(w,a)T(w,a)T(w,a)來表示如果觀察到樣本www,那么我們就選擇決策aaa的概率,從而給定樣本時(shí)策略的概率為Pw(a)=T(w,a)P_w(a) = T(w,a)Pw?(a)=T(w,a)。按這種理解,決策空間也是一個(gè)概率空間,可以定義概率測(cè)度QQQ為
Q(a)=(PT)(a)=∫ΩT(w,a)P(dw)Q(a) = (PT)(a) = \int_{\Omega} T(w,a)P(dw)Q(a)=(PT)(a)=∫Ω?T(w,a)P(dw)
所以決策函數(shù)其實(shí)就是兩個(gè)概率空間之間的映射。
有了樣本與決策的對(duì)應(yīng)關(guān)系之后,接下來要回答的問題是觀察到一組樣本,怎么做決策才是最優(yōu)的?我們可以定義損失函數(shù)L(a,θ):A×Θ→RL(a,\theta):A \times \Theta \to \mathbb{R}L(a,θ):A×Θ→R,它將參數(shù)-決策對(duì)映射到一個(gè)數(shù),這個(gè)數(shù)表示真實(shí)參數(shù)為θ\thetaθ時(shí),選擇決策aaa的損失。因?yàn)?span id="ozvdkddzhkzd" class="katex--inline">aaa是概率空間(A,A,Q)(A,\mathbf{A},Q)(A,A,Q)中的元素,所以L(a,θ)L(a,\theta)L(a,θ)的值是隨機(jī)數(shù)。為了便于比較,可以定義風(fēng)險(xiǎn)函數(shù)
R(θ,T)=∫AL(a,θ)Q(da)=∫A∫ΩL(a,θ)T(w,a)Pθ(dw)R(\theta,T) = \int_{A} L(a,\theta) Q(da) = \int_{A} \int_{\Omega} L(a,\theta)T(w,a)P_{\theta}(dw) R(θ,T)=∫A?L(a,θ)Q(da)=∫A?∫Ω?L(a,θ)T(w,a)Pθ?(dw)
稱這樣定義的風(fēng)險(xiǎn)為Wald風(fēng)險(xiǎn)。每一個(gè)決策函數(shù)TTT都會(huì)有一個(gè)風(fēng)險(xiǎn)與之對(duì)應(yīng),最優(yōu)決策的思路是找到風(fēng)險(xiǎn)最小的那個(gè)決策函數(shù),并用它來做決策。但Wald風(fēng)險(xiǎn)還與真實(shí)參數(shù)θ\thetaθ有關(guān),因此具體怎么操作以后再細(xì)談。
統(tǒng)計(jì)決策理論是由Wald系統(tǒng)性地建立起來的,在此之前數(shù)理統(tǒng)計(jì)主要有兩個(gè)領(lǐng)域,以Fisher為代表的參數(shù)估計(jì)理論和以Neyman、Pearson為代表的的假設(shè)檢驗(yàn)理論。統(tǒng)計(jì)決策理論的進(jìn)步性體現(xiàn)在它能把這兩個(gè)領(lǐng)域解決的問題用同一套話語體系來描述,并給出了一些共通的方法。這個(gè)系列的博客接下來的安排是把統(tǒng)計(jì)決策理論需要的基礎(chǔ)先簡(jiǎn)單敘述一遍,再開始介紹統(tǒng)計(jì)決策的理論。基礎(chǔ)部分需要的主要是條件概率、流形以及范疇論。條件概率是非常基礎(chǔ)但也很重要的的概率論工具,是鞅、Markov族的基礎(chǔ)。流形主要是用來處理一些和連續(xù)分布相關(guān)的分析問題。范疇是作為算子半群的推廣,用來處理一些Markov族的問題的。
總結(jié)
以上是生活随笔為你收集整理的统计决策理论1 统计问题与统计决策的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 矩阵分析与多元统计1 线性空间与线性变换
- 下一篇: UA MATH564 概率论III 期望