统计学习之箱线图
箱線圖:
? ? ?箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。在各種領域也經常被使用,常見于品質管理。它主要用于反映原始數據分布的特征,還可以進行多組數據分布特征的比 較。箱線圖的繪制方法是:先找出一組數據的上邊緣、下邊緣、中位數和兩個四分位數;然后, 連接兩個四分位數畫出箱體;再將上邊緣和下邊緣與箱體相連接,中位數在箱體中間。
? ? ? ?箱線圖如上所示,簡單解釋一下,中間的紅線是中位線,表示有50%的樣本數據在其上方,50%在其下方,黃色的代表上/下四分位數線,上四分位數線,代表其上方有25%的樣本數據,下方有75%的樣本數據。下四分位數線以此類推。紫色的線代表上下界,表示最大數值線與最小數值。上方的藍色的點代表異常值,可不予考慮,不必關心。
? ? ? 如何判斷異常值呢?
? ? ? 判斷是不是異常值,設上四分位數線為Q1,下四分位數線為Q3,那么? ?2.5Q3 - Q1 =<? 正常值 =< 2.5Q1-Q3,超過了這個界限的觀察值就是異常值。
總結
- 上一篇: jre6-java运行环境_Java运行
- 下一篇: 邻接矩阵的深度优先遍历