偏度和峰度存在的意义
生活随笔
收集整理的這篇文章主要介紹了
偏度和峰度存在的意义
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
目錄
- 1 代碼
- 2 為什么要處理偏斜數(shù)據(jù)
- 3 處理偏斜數(shù)據(jù)的一些常用技術(shù)
- 4 峰度的意義
1 代碼
import scipy.stats as st st.skew(data) # 計(jì)算偏度 st.kurtosis(data) # 計(jì)算峰度2 為什么要處理偏斜數(shù)據(jù)
因?yàn)樵S多統(tǒng)計(jì)測試和機(jī)器學(xué)習(xí)模型都依賴于正態(tài)性假設(shè)。 因此,嚴(yán)重偏斜意味著數(shù)據(jù)不正常,并且可能會影響您的統(tǒng)計(jì)測試或機(jī)器學(xué)習(xí)預(yù)測能力。
- 如果偏度在-0.5到0.5之間,則數(shù)據(jù)是相當(dāng)對稱的(正態(tài)分布);
- 如果偏斜度在-1和-0.5之間(負(fù)偏度)或0.5和1之間(正偏度),則數(shù)據(jù)偏斜;
- 如果偏斜度小于-1(負(fù)偏度)或大于1(正偏度),則數(shù)據(jù)高度偏斜;
3 處理偏斜數(shù)據(jù)的一些常用技術(shù)
在這種情況下,我們需要轉(zhuǎn)換數(shù)據(jù)以使其正常。 用于處理偏斜數(shù)據(jù)的一些常用技術(shù):
- Log transformation
- Square root transformation
- Power transformation
- Exponential transformation
- Box-Cox transformation
- etc
4 峰度的意義
“峰度”是對實(shí)值隨機(jī)變量的概率分布的“尾部”度量。 通常用于標(biāo)識給定數(shù)據(jù)集中的異常值(極值)。 由于用于識別離群值,因此使用尾部兩端的極值進(jìn)行分析。
- 常態(tài)峰 Mesokurtic (峰度=3)-此分布顯示峰度3接近零。 極值(離群值)的分布與正態(tài)分布相似。
- 尖峰的 Leptokurtic (峰值>3)-這種分布顯示出比Mekokurtic更大的峰度。 該峰比中胚層更高且更尖銳。 它的兩邊都有粗尾,表明離群值較大。 在投資世界中,尖峰的發(fā)行意味著它是高風(fēng)險的投資。
- 低峰態(tài) Platykurtic:(峰值<3)-此分布顯示峰度比中側(cè)偏低。 該峰比中胚層低且寬。 它的兩側(cè)均顯示平坦的尾巴,表示離群值較小。 在投資世界中,platykurtic發(fā)行意味著它是一種低風(fēng)險的投資。
總結(jié)
以上是生活随笔為你收集整理的偏度和峰度存在的意义的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1 0.99999的悖论_宇宙年龄只有1
- 下一篇: 字符串常见方法总结: 构造方法、静态方法