2021美赛数据分析全网首发(R语言 )
目錄
- 引言
- 1、統(tǒng)計(jì)數(shù)據(jù)準(zhǔn)確性
- 1.1 MCM
- 1.2 ICM
- 2、各個(gè)賽題參加人數(shù)及其比例
- 2.1 透視圖表
- 2.2 分析
- 3、各個(gè)題目獲獎(jiǎng)人數(shù)
- 4、各個(gè)題目獲獎(jiǎng)比例
- 5、總結(jié)與資源
引言
北京時(shí)間4月23號(hào)23點(diǎn)左右,美賽成績(jī)陸續(xù)發(fā)布,不少參賽選手經(jīng)歷了一場(chǎng)“刮彩票”,有的是O也算沒(méi)有辜負(fù)參賽4天的努力,有的是S也只能下次繼續(xù)加油。具體查看方式見(jiàn)博文:2021美賽什么時(shí)候出成績(jī)?1。今天(北京時(shí)間4月24)關(guān)于比賽的官方文檔統(tǒng)計(jì)數(shù)據(jù)發(fā)布。即如下六個(gè)文檔(pdf):
具體文檔可以去美賽官網(wǎng)下載觀看。
在文檔中統(tǒng)計(jì)分別統(tǒng)計(jì)的MCM和ICM的各個(gè)獎(jiǎng)項(xiàng)的獲獎(jiǎng)比例及其人數(shù),因?yàn)檫@是兩個(gè)不同的比賽。但是缺少每個(gè)題目的獲獎(jiǎng)的具體數(shù)據(jù)。
本文使用R語(yǔ)言對(duì)pdf中的數(shù)據(jù)進(jìn)行讀取整理,并使用excel做成數(shù)據(jù)透視表和數(shù)據(jù)透視圖,供各位參賽著明確自己的位置,獲得S的不要?dú)怵H,因?yàn)橐话氲娜伺隳愕肧;得F得不要驕傲,因?yàn)榻衲甑帽壤_實(shí)提高了,比之前年份得M獎(jiǎng)的比例相當(dāng)。當(dāng)然依然不能否認(rèn)你們的優(yōu)秀。得O的都是大佬,估計(jì)也每個(gè)賽題平穩(wěn)5-6個(gè),啥都不說(shuō)了就是牛。
想獲得處理的原始數(shù)據(jù)的見(jiàn) 文末 。
下面展示統(tǒng)計(jì)圖表。
1、統(tǒng)計(jì)數(shù)據(jù)準(zhǔn)確性
先說(shuō)明一下文本使用數(shù)據(jù)的準(zhǔn)確性,下面是我整理完之后的數(shù)據(jù)。MCM以及ICM總共26124支隊(duì)伍。
> DataTeamNum problem level1: 2100112 D Outstanding2: 2100242 D Outstanding3: 2101855 D Outstanding4: 2106028 D Outstanding5: 2107091 D Outstanding--- 26120: 2127566 C Disqualified 26121: 2125243 C Disqualified 26122: 2127507 C Disqualified 26123: 2105727 C Not 26124: 2122048 C Not1.1 MCM
下面是官網(wǎng)對(duì)MCM的統(tǒng)計(jì)數(shù)據(jù)。
我們可以看到O、F、M一個(gè)人不差。總隊(duì)伍數(shù)、每個(gè)題目的的統(tǒng)計(jì)誤差在1-5隊(duì)左右可以接受。
1.2 ICM
> table(Data[problem %in% c("D", "E", "F"),]$level)Disqualified Finalist Honorable Meritorious Not Outstanding Successful Unsuccessful 551 301 2910 1192 9 19 11038 43 > table(Data[problem %in% c("D", "E", "F"),]$pro)D E F 5551 3521 6991 > sum(table(Data[problem %in% c("D", "E", "F"),]$pro)) [1] 16063可一看出誤差依然很小,可以接受。
注:以下統(tǒng)計(jì)數(shù)據(jù)以R語(yǔ)言統(tǒng)計(jì)為準(zhǔn),且與官方數(shù)據(jù)存在偏差。
2、各個(gè)賽題參加人數(shù)及其比例
2.1 透視圖表
2.2 分析
整體來(lái)看本次選題依然不均勻,C題最少,估計(jì)是這次數(shù)據(jù)為圖片視頻文本,操作難度比較大。但是往下看我們可以到C題的獲獎(jiǎng)比例還是蠻高的。F題最多為26.76%。
3、各個(gè)題目獲獎(jiǎng)人數(shù)
4、各個(gè)題目獲獎(jiǎng)比例
5、總結(jié)與資源
具體的分析我就不分析了,畢竟我也是小菜雞一個(gè),各位大佬自己按需服用。另外考慮到有想下載原始數(shù)據(jù)和代碼的,我把代碼和數(shù)據(jù)打包上傳CSDN資源,并附上下載鏈接。
資源內(nèi)容如下圖。
https://tjxwz.blog.csdn.net/article/details/113809480 ??
總結(jié)
以上是生活随笔為你收集整理的2021美赛数据分析全网首发(R语言 )的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 计算机基本问题
- 下一篇: 轻松记住美国50个州名