日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2021美赛数据分析全网首发(R语言 )

發布時間:2023/12/29 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2021美赛数据分析全网首发(R语言 ) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • 引言
  • 1、統計數據準確性
    • 1.1 MCM
    • 1.2 ICM
  • 2、各個賽題參加人數及其比例
    • 2.1 透視圖表
    • 2.2 分析
  • 3、各個題目獲獎人數
  • 4、各個題目獲獎比例
  • 5、總結與資源

引言

北京時間4月23號23點左右,美賽成績陸續發布,不少參賽選手經歷了一場“刮彩票”,有的是O也算沒有辜負參賽4天的努力,有的是S也只能下次繼續加油。具體查看方式見博文:2021美賽什么時候出成績?1。今天(北京時間4月24)關于比賽的官方文檔統計數據發布。即如下六個文檔(pdf):

具體文檔可以去美賽官網下載觀看。
在文檔中統計分別統計的MCM和ICM的各個獎項的獲獎比例及其人數,因為這是兩個不同的比賽。但是缺少每個題目的獲獎的具體數據。
本文使用R語言對pdf中的數據進行讀取整理,并使用excel做成數據透視表和數據透視圖,供各位參賽著明確自己的位置,獲得S的不要氣餒,因為一半的人陪你得S;得F得不要驕傲,因為今年得比例確實提高了,比之前年份得M獎的比例相當。當然依然不能否認你們的優秀。得O的都是大佬,估計也每個賽題平穩5-6個,啥都不說了就是牛。

想獲得處理的原始數據的見 文末 。

下面展示統計圖表。

1、統計數據準確性

先說明一下文本使用數據的準確性,下面是我整理完之后的數據。MCM以及ICM總共26124支隊伍。

> DataTeamNum problem level1: 2100112 D Outstanding2: 2100242 D Outstanding3: 2101855 D Outstanding4: 2106028 D Outstanding5: 2107091 D Outstanding--- 26120: 2127566 C Disqualified 26121: 2125243 C Disqualified 26122: 2127507 C Disqualified 26123: 2105727 C Not 26124: 2122048 C Not

1.1 MCM

下面是官網對MCM的統計數據。

> table(Data[problem %in% c("A", "B", "C"),]$level)Disqualified Finalist Honorable Meritorious Not Outstanding Successful Unsuccessful 204 284 2417 697 11 17 6405 26 > table(Data[problem %in% c("A", "B", "C"),]$pro)A B C 4489 3110 2462 > sum(table(Data[problem %in% c("A", "B", "C"),]$pro)) [1] 10061 # 總人數

我們可以看到O、F、M一個人不差。總隊伍數、每個題目的的統計誤差在1-5隊左右可以接受。

1.2 ICM

> table(Data[problem %in% c("D", "E", "F"),]$level)Disqualified Finalist Honorable Meritorious Not Outstanding Successful Unsuccessful 551 301 2910 1192 9 19 11038 43 > table(Data[problem %in% c("D", "E", "F"),]$pro)D E F 5551 3521 6991 > sum(table(Data[problem %in% c("D", "E", "F"),]$pro)) [1] 16063

可一看出誤差依然很小,可以接受。
注:以下統計數據以R語言統計為準,且與官方數據存在偏差。

2、各個賽題參加人數及其比例

2.1 透視圖表


2.2 分析

整體來看本次選題依然不均勻,C題最少,估計是這次數據為圖片視頻文本,操作難度比較大。但是往下看我們可以到C題的獲獎比例還是蠻高的。F題最多為26.76%。

3、各個題目獲獎人數


4、各個題目獲獎比例


5、總結與資源

具體的分析我就不分析了,畢竟我也是小菜雞一個,各位大佬自己按需服用。另外考慮到有想下載原始數據和代碼的,我把代碼和數據打包上傳CSDN資源,并附上下載鏈接。
資源內容如下圖。


  • https://tjxwz.blog.csdn.net/article/details/113809480 ??

  • 總結

    以上是生活随笔為你收集整理的2021美赛数据分析全网首发(R语言 )的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。