2021美赛数据分析全网首发(R语言 )
目錄
- 引言
- 1、統計數據準確性
- 1.1 MCM
- 1.2 ICM
- 2、各個賽題參加人數及其比例
- 2.1 透視圖表
- 2.2 分析
- 3、各個題目獲獎人數
- 4、各個題目獲獎比例
- 5、總結與資源
引言
北京時間4月23號23點左右,美賽成績陸續發布,不少參賽選手經歷了一場“刮彩票”,有的是O也算沒有辜負參賽4天的努力,有的是S也只能下次繼續加油。具體查看方式見博文:2021美賽什么時候出成績?1。今天(北京時間4月24)關于比賽的官方文檔統計數據發布。即如下六個文檔(pdf):
具體文檔可以去美賽官網下載觀看。
在文檔中統計分別統計的MCM和ICM的各個獎項的獲獎比例及其人數,因為這是兩個不同的比賽。但是缺少每個題目的獲獎的具體數據。
本文使用R語言對pdf中的數據進行讀取整理,并使用excel做成數據透視表和數據透視圖,供各位參賽著明確自己的位置,獲得S的不要氣餒,因為一半的人陪你得S;得F得不要驕傲,因為今年得比例確實提高了,比之前年份得M獎的比例相當。當然依然不能否認你們的優秀。得O的都是大佬,估計也每個賽題平穩5-6個,啥都不說了就是牛。
想獲得處理的原始數據的見 文末 。
下面展示統計圖表。
1、統計數據準確性
先說明一下文本使用數據的準確性,下面是我整理完之后的數據。MCM以及ICM總共26124支隊伍。
> DataTeamNum problem level1: 2100112 D Outstanding2: 2100242 D Outstanding3: 2101855 D Outstanding4: 2106028 D Outstanding5: 2107091 D Outstanding--- 26120: 2127566 C Disqualified 26121: 2125243 C Disqualified 26122: 2127507 C Disqualified 26123: 2105727 C Not 26124: 2122048 C Not1.1 MCM
下面是官網對MCM的統計數據。
我們可以看到O、F、M一個人不差。總隊伍數、每個題目的的統計誤差在1-5隊左右可以接受。
1.2 ICM
> table(Data[problem %in% c("D", "E", "F"),]$level)Disqualified Finalist Honorable Meritorious Not Outstanding Successful Unsuccessful 551 301 2910 1192 9 19 11038 43 > table(Data[problem %in% c("D", "E", "F"),]$pro)D E F 5551 3521 6991 > sum(table(Data[problem %in% c("D", "E", "F"),]$pro)) [1] 16063可一看出誤差依然很小,可以接受。
注:以下統計數據以R語言統計為準,且與官方數據存在偏差。
2、各個賽題參加人數及其比例
2.1 透視圖表
2.2 分析
整體來看本次選題依然不均勻,C題最少,估計是這次數據為圖片視頻文本,操作難度比較大。但是往下看我們可以到C題的獲獎比例還是蠻高的。F題最多為26.76%。
3、各個題目獲獎人數
4、各個題目獲獎比例
5、總結與資源
具體的分析我就不分析了,畢竟我也是小菜雞一個,各位大佬自己按需服用。另外考慮到有想下載原始數據和代碼的,我把代碼和數據打包上傳CSDN資源,并附上下載鏈接。
資源內容如下圖。
https://tjxwz.blog.csdn.net/article/details/113809480 ??
總結
以上是生活随笔為你收集整理的2021美赛数据分析全网首发(R语言 )的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机基本问题
- 下一篇: 轻松记住美国50个州名