统计学---数据的标准化
北京2017年中考科目有6門,其分值分別是語文120,數(shù)學(xué)120,外語120,物理100,化學(xué)80,體育40,總分580分。
那么問題來了,數(shù)學(xué)考了100分就一定比物理考了90分強(qiáng)嗎?語文100分與外語100分的含金量是一樣的嗎?
我們假設(shè)拿到了10位同學(xué)的英語和語文成績,如下表所示
| 1 | 109 | 85 |
| 2 | 108 | 108 |
| 3 | 88 | 95 |
| 4 | 116 | 84 |
| 5 | 102 | 80 |
| 6 | 96 | 79 |
| 7 | 89 | 72 |
| 8 | 100 | 100 |
| 9 | 72 | 68 |
| 10 | 88 | 102 |
| 平均分 | 96.8 | 87.3 |
我們看到,英語100分,離平均值96.8較近,略高于平均分;而語文100分,離平均值87.3較遠(yuǎn),且遠(yuǎn)高于平均分;因此同樣是考100分,但各自的含金量是不同的,顯然語文考100分的含金量更大。
我們假設(shè)再拿到了10位同學(xué)數(shù)學(xué)和英語的成績,如下表所示
| 1 | 109 | 119 |
| 2 | 108 | 118 |
| 3 | 88 | 88 |
| 4 | 116 | 78 |
| 5 | 102 | 68 |
| 6 | 96 | 99 |
| 7 | 89 | 115 |
| 8 | 100 | 100 |
| 9 | 72 | 91 |
| 10 | 88 | 92 |
| 平均分 | 96.8 | 96.8 |
2門科目的平均分是一樣的,都為96.8,那么英語和數(shù)學(xué)都是100分的含義是一樣的嗎?
我們算一下英語和數(shù)學(xué)2門科目的標(biāo)準(zhǔn)差,英語科目的標(biāo)準(zhǔn)差是:12.29;而數(shù)學(xué)科目的標(biāo)準(zhǔn)差是:16.14。
前期的文章《統(tǒng)計(jì)學(xué)—掌握數(shù)據(jù)的整體狀態(tài)》提過,標(biāo)準(zhǔn)差越小,代表這組數(shù)據(jù)的“離散程度”也越小,換句話說,比起數(shù)學(xué),大家在英語科目上的成績更為接近,也就是說,在英語科目中的1分價(jià)值更高,因?yàn)榭赡芩﹂_更多的人,會大大影響排名。所以,在2門科目平均分一樣的情況下,英語的100分比數(shù)學(xué)的100分含金量更高。
那么,結(jié)合平均值和標(biāo)準(zhǔn)差這2個(gè)指標(biāo),可以通過”標(biāo)準(zhǔn)化(standardization)”來比較2個(gè)不同種類的數(shù)值。其計(jì)算方法是:
標(biāo)準(zhǔn)計(jì)分=數(shù)據(jù)值一平均值標(biāo)準(zhǔn)差
我們算一下,語文、英語、數(shù)學(xué)3門科目都是100分時(shí)的標(biāo)準(zhǔn)計(jì)分:
三門課的平均值分別是:87.3,96.8,96.8;標(biāo)準(zhǔn)差分別是:12.69,12.29,16.14。
那么:
標(biāo)準(zhǔn)計(jì)分(英語)=100?96.812.29=0.26
標(biāo)準(zhǔn)計(jì)分(數(shù)學(xué))=100?96.816.14=0.198
這說明同是100分,語文的含金量最高,其次是英語,最后是數(shù)學(xué)。
標(biāo)準(zhǔn)計(jì)分有2個(gè)特點(diǎn):一是平均值為0;二是標(biāo)準(zhǔn)差為1。這個(gè)從上面的公式就可以推導(dǎo)出來。
有了標(biāo)準(zhǔn)化,滿分100分和滿分120分的科目就可以進(jìn)行比較了;甚至數(shù)據(jù)的單位不同,也可以進(jìn)行比較了。
總結(jié)
以上是生活随笔為你收集整理的统计学---数据的标准化的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 损失函数为什么用平方形式(二)
- 下一篇: Pandas的DataFrame输出截断