日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

2021美赛数据分析全网首发(R语言 )

發(fā)布時(shí)間:2023/12/29 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2021美赛数据分析全网首发(R语言 ) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目錄

  • 引言
  • 1、統(tǒng)計(jì)數(shù)據(jù)準(zhǔn)確性
    • 1.1 MCM
    • 1.2 ICM
  • 2、各個(gè)賽題參加人數(shù)及其比例
    • 2.1 透視圖表
    • 2.2 分析
  • 3、各個(gè)題目獲獎(jiǎng)人數(shù)
  • 4、各個(gè)題目獲獎(jiǎng)比例
  • 5、總結(jié)與資源

引言

北京時(shí)間4月23號(hào)23點(diǎn)左右,美賽成績(jī)陸續(xù)發(fā)布,不少參賽選手經(jīng)歷了一場(chǎng)“刮彩票”,有的是O也算沒(méi)有辜負(fù)參賽4天的努力,有的是S也只能下次繼續(xù)加油。具體查看方式見(jiàn)博文:2021美賽什么時(shí)候出成績(jī)?1。今天(北京時(shí)間4月24)關(guān)于比賽的官方文檔統(tǒng)計(jì)數(shù)據(jù)發(fā)布。即如下六個(gè)文檔(pdf):

具體文檔可以去美賽官網(wǎng)下載觀看。
在文檔中統(tǒng)計(jì)分別統(tǒng)計(jì)的MCM和ICM的各個(gè)獎(jiǎng)項(xiàng)的獲獎(jiǎng)比例及其人數(shù),因?yàn)檫@是兩個(gè)不同的比賽。但是缺少每個(gè)題目的獲獎(jiǎng)的具體數(shù)據(jù)。
本文使用R語(yǔ)言對(duì)pdf中的數(shù)據(jù)進(jìn)行讀取整理,并使用excel做成數(shù)據(jù)透視表和數(shù)據(jù)透視圖,供各位參賽著明確自己的位置,獲得S的不要?dú)怵H,因?yàn)橐话氲娜伺隳愕肧;得F得不要驕傲,因?yàn)榻衲甑帽壤_實(shí)提高了,比之前年份得M獎(jiǎng)的比例相當(dāng)。當(dāng)然依然不能否認(rèn)你們的優(yōu)秀。得O的都是大佬,估計(jì)也每個(gè)賽題平穩(wěn)5-6個(gè),啥都不說(shuō)了就是牛。

想獲得處理的原始數(shù)據(jù)的見(jiàn) 文末 。

下面展示統(tǒng)計(jì)圖表。

1、統(tǒng)計(jì)數(shù)據(jù)準(zhǔn)確性

先說(shuō)明一下文本使用數(shù)據(jù)的準(zhǔn)確性,下面是我整理完之后的數(shù)據(jù)。MCM以及ICM總共26124支隊(duì)伍。

> DataTeamNum problem level1: 2100112 D Outstanding2: 2100242 D Outstanding3: 2101855 D Outstanding4: 2106028 D Outstanding5: 2107091 D Outstanding--- 26120: 2127566 C Disqualified 26121: 2125243 C Disqualified 26122: 2127507 C Disqualified 26123: 2105727 C Not 26124: 2122048 C Not

1.1 MCM

下面是官網(wǎng)對(duì)MCM的統(tǒng)計(jì)數(shù)據(jù)。

> table(Data[problem %in% c("A", "B", "C"),]$level)Disqualified Finalist Honorable Meritorious Not Outstanding Successful Unsuccessful 204 284 2417 697 11 17 6405 26 > table(Data[problem %in% c("A", "B", "C"),]$pro)A B C 4489 3110 2462 > sum(table(Data[problem %in% c("A", "B", "C"),]$pro)) [1] 10061 # 總?cè)藬?shù)

我們可以看到O、F、M一個(gè)人不差。總隊(duì)伍數(shù)、每個(gè)題目的的統(tǒng)計(jì)誤差在1-5隊(duì)左右可以接受。

1.2 ICM

> table(Data[problem %in% c("D", "E", "F"),]$level)Disqualified Finalist Honorable Meritorious Not Outstanding Successful Unsuccessful 551 301 2910 1192 9 19 11038 43 > table(Data[problem %in% c("D", "E", "F"),]$pro)D E F 5551 3521 6991 > sum(table(Data[problem %in% c("D", "E", "F"),]$pro)) [1] 16063

可一看出誤差依然很小,可以接受。
注:以下統(tǒng)計(jì)數(shù)據(jù)以R語(yǔ)言統(tǒng)計(jì)為準(zhǔn),且與官方數(shù)據(jù)存在偏差。

2、各個(gè)賽題參加人數(shù)及其比例

2.1 透視圖表


2.2 分析

整體來(lái)看本次選題依然不均勻,C題最少,估計(jì)是這次數(shù)據(jù)為圖片視頻文本,操作難度比較大。但是往下看我們可以到C題的獲獎(jiǎng)比例還是蠻高的。F題最多為26.76%。

3、各個(gè)題目獲獎(jiǎng)人數(shù)


4、各個(gè)題目獲獎(jiǎng)比例


5、總結(jié)與資源

具體的分析我就不分析了,畢竟我也是小菜雞一個(gè),各位大佬自己按需服用。另外考慮到有想下載原始數(shù)據(jù)和代碼的,我把代碼和數(shù)據(jù)打包上傳CSDN資源,并附上下載鏈接。
資源內(nèi)容如下圖。


  • https://tjxwz.blog.csdn.net/article/details/113809480 ??

  • 總結(jié)

    以上是生活随笔為你收集整理的2021美赛数据分析全网首发(R语言 )的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。