数据的统计特性
數(shù)據(jù)分布特征可以從集中趨勢、離中趨勢及分布形態(tài)三個(gè)方面進(jìn)行描述。
?1、平均指標(biāo)是在反映總體的一般水平或分布的集中趨勢的指標(biāo)。測定集中趨勢的平均指標(biāo)有兩類:位置平均數(shù)和數(shù)值平均數(shù)。位置平均數(shù)是根據(jù)變量值位置來確定的代表值,常用的有:眾數(shù)、中位數(shù)。數(shù)值平均數(shù)就是均值,它是對總體中的所有數(shù)據(jù)計(jì)算的平均值,用以反映所有數(shù)據(jù)的一般水平,常用的有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)和冪平均數(shù)。
2、變異指標(biāo)是用來刻畫總體分布的變異狀況或離散程度的指標(biāo)。測定離中趨勢的指標(biāo)有極差、平均差、四分位差、方差和標(biāo)準(zhǔn)差、以及離散系數(shù)等。標(biāo)準(zhǔn)差是方差的平方根,即總體中各變量值與算術(shù)平均數(shù)的離差平方的算術(shù)平方根。離散系數(shù)是根據(jù)各離散程度指標(biāo)與其相應(yīng)的算術(shù)平均數(shù)的比值。
3、矩、偏度和峰度是反映總體分布形態(tài)的指標(biāo)。矩是用來反映數(shù)據(jù)分布的形態(tài)特征,也稱為動(dòng)差。偏度反映指數(shù)據(jù)分布不對稱的方向和程度。峰度反映是指數(shù)據(jù)分布圖形的尖峭程度或峰凸程度。
比較重要的幾個(gè)關(guān)鍵數(shù)據(jù)。
1. 均值。
2. 加權(quán)算數(shù)均值。
3. 截?cái)嗑怠?/p>
4. 中位數(shù)。
5. 數(shù)據(jù)傾斜,均值大于中位數(shù),正傾斜;均值小于中位數(shù),負(fù)傾斜。
6. 中列數(shù)。
7. 百分位數(shù),中位數(shù)是第50個(gè)百分位數(shù),第一個(gè)四分位數(shù)Q1是第25個(gè)百分位數(shù),第三個(gè)四分位數(shù)Q3是第75個(gè)百分位數(shù)。
8. 中間四分位數(shù)極差I(lǐng)QR = Q3-Q1。
9. 眾數(shù)。
數(shù)據(jù)散布程度度量。
1. 極差,最大值和最小值之間的差異。
2. 絕對平均偏差,AAD? absolute average deviation
3. 中位數(shù)絕對偏差? MAD? median absolute deviation
4. 四分位數(shù)極差?? IQR???? interquartiles range
總結(jié)
- 上一篇: scala中NULL的option定义的
- 下一篇: 使用setInterval对ajax请求