java累积度分布,累积分布函数
累積分布函數(shù)是概率密度函數(shù)的積分,即能完整描述一個(gè)實(shí)隨機(jī)變量X的概率分布。對(duì)于所有實(shí)數(shù)x ,累積分布函數(shù)定義如下:
F_{X}(x)=P(X<=x)
其代表了實(shí)數(shù)X的取值小于等于x的概率(請(qǐng)注意大小寫,X代表隨機(jī)變量而x代表X的取值)。
若要求得X處于半閉區(qū)間(a,b)的概率,其中a < b,則可以根據(jù)分布函數(shù)進(jìn)行計(jì)算:
P(a
在上面的定義中,“小于或等于”符號(hào)“≤”是一種慣例,而不是普遍使用的慣例(例如匈牙利文獻(xiàn)使用“
一般使用小寫字母f代表概率密度函數(shù)和概率質(zhì)量函數(shù),而用大寫字母F表示累積分布函數(shù)。
連續(xù)隨機(jī)變量X的累積分布函數(shù)可以表示為其概率密度函數(shù)?_{X}的積分,如下式:
F_{X}(x)=\int_{-\intf}^x f_{X}(t)dt
累計(jì)分布函數(shù)有幾個(gè)重要的性質(zhì):
·有界性
o$$\varlimsup_{x\rightarrow - \infty}F_{X}(x)=0$$
o$$\varlimsup_{x\rightarrow + \infty}F_{X}(x)=1$$
·單調(diào)性:
oF_{x}(x_1)<=F_{x}(x_2) 若x_1
·右連續(xù)性:
·$$\varlimsup_{x\rightarrow +x_{0}^+}F_{X}(x_{0})
下圖給出具有不同均值和方差的正態(tài)分布的累積分布函數(shù),可以看到雖然其形狀各異,但都具備上述三個(gè)性質(zhì):
累積分布函數(shù)的概念主要用于統(tǒng)計(jì)分析中,其有兩種應(yīng)用,一種是對(duì)小于參考值的現(xiàn)象值的出現(xiàn)頻率的分析的累積頻率分析,另一種則是對(duì)累計(jì)分布函數(shù)進(jìn)行估計(jì),隨后可以求得簡(jiǎn)單的統(tǒng)計(jì)值,或進(jìn)行各種統(tǒng)計(jì)假設(shè)檢驗(yàn)。如檢驗(yàn)樣本數(shù)據(jù)是否來(lái)自給定的分布,或兩個(gè)樣本是否來(lái)自同一個(gè)概率分布。如著名的Kolmogorov-Smirnov檢驗(yàn)即是基于累積分布函數(shù),可用于檢驗(yàn)兩個(gè)經(jīng)驗(yàn)分布是否不同,或者經(jīng)驗(yàn)分布是否與理想分布不同。
發(fā)展歷史
描述
如上文所述,在統(tǒng)計(jì)分析中可以利用累積分布的概念對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn),Kolmogorov和Smirnov提出的Kolmogorov-Smirnov檢驗(yàn)(K-S檢驗(yàn))是其中最著名的應(yīng)用之一,用以檢驗(yàn)兩個(gè)經(jīng)驗(yàn)分布是否不同或一個(gè)經(jīng)驗(yàn)分布與另一個(gè)理想分布是否不同。雙樣本K-S檢驗(yàn)?zāi)壳叭允潜容^兩個(gè)樣本最有用和最常用的非參數(shù)方法之一,因?yàn)樗鼘?duì)兩個(gè)樣本的經(jīng)驗(yàn)累積分布函數(shù)的位置和形狀的差異很敏感。除此之外,基于累積分布的統(tǒng)計(jì)檢驗(yàn)還有Shapiro-Wilk檢驗(yàn),Anderson-Darling檢驗(yàn)等,Razali等人在2011年對(duì)這些檢驗(yàn)的效力進(jìn)行了比較。
1951年Massey Jr在發(fā)表的論文對(duì)Kolmogorov-Smirnov檢驗(yàn)進(jìn)行了修改,從而將其用于模型的擬合優(yōu)度(goodness-of-fit)分析。該檢驗(yàn)基于實(shí)證累積分布(empirical cumulative distribution)和假設(shè)累計(jì)分布(hypothetical cumulative distribution)之間的最大差異,文章中給出了具體的例子,并認(rèn)為結(jié)果顯示修改后的Kolmogorov-Smirnov檢驗(yàn)的表現(xiàn)比卡方檢驗(yàn)(chi-square test)更好。
為將高階變量的分布也納入分析范圍,J. P. Imhof于1961年發(fā)表了論文,對(duì)已有的方法進(jìn)行了探討,并提出如何估計(jì)隨機(jī)變量的二階甚至更高階形式的分布的新方法。
累積分布的應(yīng)用遠(yuǎn)不止于此,在圖像處理領(lǐng)域,基于圖像直方圖均衡方法的圖像增強(qiáng)實(shí)際上也依賴于累積分布的概念,Yu Wang等人在其1999年發(fā)表的論文對(duì)此進(jìn)行了說(shuō)明。
主要事件ABC
1年份事件相關(guān)論文/Reference
21933-1948Kolmogorov和Smirnov提出了Kolmogorov-Smirnov檢驗(yàn)Kolmogorov A (1933). Sulla determinazione empirica di una legge di distribuzione. G. Ist. Ital. Attuari. 4: 83–91. // Smirnov N (1948). Table for estimating the goodness of fit of empirical distributions. Annals of Mathematical Statistics. *19*: 279–281.
31951Massey Jr在發(fā)表的論文對(duì)Kolmogorov-Smirnov檢驗(yàn)進(jìn)行了修改,從而將其用于模型的擬合優(yōu)度(goodness-of-fit)分析Frank J. M. Jr. (1951). The Kolmogorov-Smirnov Test for Goodness of Fit, Journal of the American Statistical Association, 46(253): 68-78.
41961J. P. Imhof提出如何估計(jì)隨機(jī)變量的二階甚至更高階形式的分布的新方法Imhof. J. P.(1961). Computing the Distribution of Quadratic Forms in Normal Variables. Biometrika. 48(3/4): 419-426.
51999Yu Wang等人提出了基于圖像直方圖均衡方法的圖像增強(qiáng)法,這種方法實(shí)際上也是基于累積分布的Wang, Y.; Chen, Q.; Zhang, B. (1999). Image enhancement based on equal area dualistic sub-image histogram equalization method. IEEE Transactions on Consumer Electronics. 45(1):68 - 75.
62011Razali等人對(duì)基于累積分布的Shapiro-Wilk檢驗(yàn),Anderson-Darling檢驗(yàn)等進(jìn)行了比較Razali, N. M.; Wah Y. B.(2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics. 2(1): 21-33.
發(fā)展分析
瓶頸
累積分布函數(shù)是數(shù)學(xué)上的一個(gè)基本概念,并且經(jīng)過(guò)超過(guò)一百年的發(fā)展,已經(jīng)十分成熟,很難說(shuō)存在什么瓶頸。
未來(lái)發(fā)展方向
如上文所述,目前有關(guān)的研究大部分是基于累積分布函數(shù)這個(gè)概念的,而不是直接對(duì)累積分布函數(shù)進(jìn)行研究。
ByYuanyuan Li
總結(jié)
以上是生活随笔為你收集整理的java累积度分布,累积分布函数的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 鸿蒙汽车电动尾门工厂,汽车智能电动尾门为
- 下一篇: 电子报纸的分析即制作