均值、方差、协方差等定义与基本运算
一、均值
定義:
設(shè)P(x)是一個(gè)離散概率分布函數(shù)自變量的取值范圍是。那么其均值被定義為:
設(shè)P(x)是一個(gè)連續(xù)概率分布函數(shù),那么他的均值是:
性質(zhì):
1.線性運(yùn)算:
期望服從先行性質(zhì),因此線性運(yùn)算的期望等于期望的線性運(yùn)算:
我們可以把它推廣到任意一般情況:
2.函數(shù)的期望:
設(shè)f(x)是x的函數(shù),則f(x)的期望為:
離散:
連續(xù):
3.乘積的期望:
一般來說,乘積的期望不等于期望的乘積,除非變量相互獨(dú)立。因此,如果x和y相互獨(dú)立,則
期望的運(yùn)算構(gòu)成了統(tǒng)計(jì)量的運(yùn)算基礎(chǔ),因?yàn)榉讲睢f(xié)方差等統(tǒng)計(jì)量本質(zhì)上是一種特殊的期望。
設(shè)C為一個(gè)常數(shù),X和Y是兩個(gè)隨機(jī)變量。以下是數(shù)學(xué)期望的重要性質(zhì):
1.E(C)=C
2.E(CX)=CE(X)
3.E(X+Y)=E(X)+E(Y)
4.當(dāng)X和Y相互獨(dú)立時(shí),E(XY)=E(X)E(Y)
性質(zhì)3和性質(zhì)4可以推到到任意有限個(gè)相互獨(dú)立的隨機(jī)變量之和或之積的情況。
例子:
某城市有10萬個(gè)家庭,沒有孩子的家庭有1000個(gè),有一個(gè)孩子的家庭有9萬個(gè),有兩個(gè)孩子的家庭有6000個(gè),有3個(gè)孩子的家庭有3000個(gè)。求一個(gè)家庭平均小孩的數(shù)目:
思路:則此城市中任一個(gè)家庭中孩子的數(shù)目是一個(gè)隨機(jī)變量。它可取值0,1,2,3。其中取0的概率為0.01(1000/10萬),取1的概率0.9(9000/10萬),取2的概率為0.06(6000/10萬),取3的概率為0.03(3000/10萬)。它的數(shù)學(xué)期望0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一個(gè)家庭平均有小孩1.11個(gè)。用數(shù)學(xué)式子表示為E(X)=1.11。
二、方差
定義:
方差是一種特殊的期望, 被定義為:
離散型的方差:
連續(xù)型的方差:
以上兩式是一樣的,只是寫法不同。
證明:由數(shù)學(xué)期望的性質(zhì)得
性質(zhì):
1.設(shè)C是常數(shù),則D(C)=0
2.設(shè)X是隨機(jī)變量,C是常數(shù),則有
3.設(shè) X 與 Y 是兩個(gè)隨機(jī)變量,則
其中協(xié)方差
特別的,當(dāng)X,Y是兩個(gè)不相關(guān)的隨機(jī)變量(相互獨(dú)立)則
此性質(zhì)可以推廣到有限多個(gè)兩兩不相關(guān)的隨機(jī)變量之和的情況。
統(tǒng)計(jì)學(xué)意義:
方差和標(biāo)準(zhǔn)差是測算離散趨勢最重要、最常用的指標(biāo)。方差是各變量值與其均值離差平方的平均數(shù),它是測算數(shù)值型數(shù)據(jù)離散程度的最重要的方法。標(biāo)準(zhǔn)差為方差的算術(shù)平方根,用S表示。方差相應(yīng)的計(jì)算公式為(無偏性)。
標(biāo)準(zhǔn)差與方差不同的是,標(biāo)準(zhǔn)差和變量的計(jì)算單位相同,比方差清楚,因此很多時(shí)候我們分析的時(shí)候更多的使用的是標(biāo)準(zhǔn)差。
三、協(xié)方差
定義:
在概率論和統(tǒng)計(jì)學(xué)中,協(xié)方差用于衡量兩個(gè)變量的總體誤差。期望值分別為E[X]與E[Y]的兩個(gè)實(shí)隨機(jī)變量X與Y之間的協(xié)方差Cov(X,Y)定義為:
特殊情況下,當(dāng)X=Y時(shí):
從直觀上來看,協(xié)方差表示的是兩個(gè)變量總體誤差的期望。
如果兩個(gè)變量的變化趨勢一致,也就是說如果其中一個(gè)大于自身的期望值時(shí)另外一個(gè)也大于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是正值;如果兩個(gè)變量的變化趨勢相反,即其中一個(gè)變量大于自身的期望值時(shí)另外一個(gè)卻小于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是負(fù)值。
如果X與Y是統(tǒng)計(jì)獨(dú)立的,那么二者之間的協(xié)方差就是0,因?yàn)閮蓚€(gè)獨(dú)立的隨機(jī)變量滿足E[XY]=E[X]E[Y]。
但是,反過來并不成立。即如果X與Y的協(xié)方差為0,二者并不一定是統(tǒng)計(jì)獨(dú)立的。
性質(zhì):
(1)Cov(X,Y)=Cov(Y,X);
(2)Cov(aX,bY)=abCov(X,Y),(a,b是常數(shù));
(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)。
由協(xié)方差定義,可以看出Cov(X,X)=D(X),Cov(Y,Y)=D(Y)。
四、相關(guān)系數(shù)
協(xié)方差作為描述X和Y相關(guān)程度的量,在同一物理量綱之下有一定的作用,但同樣的兩個(gè)量采用不同的量綱使它們的協(xié)方差在數(shù)值上表現(xiàn)出很大的差異。為此引入如下概念;
定義:
稱為隨機(jī)變量X和Y的(Pearson)相關(guān)系數(shù)。
性質(zhì):
1.若ρXY=0,則稱X與Y不線性相關(guān)。
2.即ρXY=0的充分必要條件是Cov(X,Y)=0,亦即不相關(guān)和協(xié)方差為零是等價(jià)的。
3.相關(guān)系數(shù)ρXY取值在-1到1之間,ρXY= 0時(shí),稱X,Y不相關(guān);
| ρXY| = 1時(shí),稱X,Y完全相關(guān),此時(shí),X,Y之間具有線性函數(shù)關(guān)系;
| ρXY| < 1時(shí),X的變動(dòng)引起Y的部分變動(dòng),ρXY的絕對(duì)值越大,X的變動(dòng)引起Y的變動(dòng)就越大;
| ρXY| > 0.8時(shí)稱為高度相關(guān),當(dāng) | ρXY| < 0.3時(shí)稱為低度相關(guān),其它時(shí)候?yàn)橹卸认嚓P(guān)。
看后請(qǐng)點(diǎn)贊
總結(jié)
以上是生活随笔為你收集整理的均值、方差、协方差等定义与基本运算的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 10年嵌入式工程师经验之谈:对于研发工作
- 下一篇: 给妹子修电脑,会有哪些故事?