厉害了!20年【科比NBA】生涯|数据分析
使用工具:Ipython notebook
用到的庫:Pandas,Matplotlib
1.數(shù)據(jù)來源
本次用到的數(shù)據(jù)來源于https://www.basketball-reference.com/players/b/bryanko01.html,其中可以選擇多種形式,我選的是CSV格式,方便后面的數(shù)據(jù)分析,看看數(shù)據(jù)長什么樣呢
2.導入數(shù)據(jù)
1).數(shù)據(jù)集是一個下載好的csv文件( csv是數(shù)據(jù)分析金牌御用文件格式),我們把數(shù)據(jù)導入到pandas之后,初步分析一下
(20, 30) #數(shù)據(jù)集是一個20行30列的大表格,正好是20年的數(shù)據(jù)
看一些數(shù)據(jù)的基本統(tǒng)計分析信息:
20年平均得分是24.2分,相當厲害,最高得分是35.4,最低7.6,那我們繼續(xù)橫向探索數(shù)據(jù)
2).接下來就可以繼續(xù)分析了,一般來說,我們經(jīng)常關注的是球員的得分,籃板,助攻,搶斷和蓋帽的能力,所以我們可以從這5個方面來分析,先來看一下科比的得分的基本情況
常規(guī)賽總得分: 33633.3
常規(guī)賽場均得分: 24.9875928678
3).這里的總分會有偏差(實際總分是33643)
因為是根據(jù)每賽季的場均得分和場次得來的,所以數(shù)據(jù)會有出入,科比的得分巔峰是哪個賽季呢 ? 場均得分又是多少?只需兩行代碼就解決問題:
max_point=data.PTS.max()
print(data[data.PTS==max_point])
3).科比的巔峰賽季
科比的巔峰是在05-06賽季,27歲的時候,場均35.4分,要知道場均能上30分就已經(jīng)很了不起了,果然是巔峰科比,進攻火力太猛了,那我們接著看一下上30分的有哪些賽季
print(data.loc[data.PTS>=30])
30分以上的賽季有02-03,05-06和06-07
4).看一下這20年來各項的最強科比的數(shù)據(jù)
assistants 6.3
blocks 1.0
point 35.4
rebounds 6.9
steals 2.2
dtype: float64
3.可視化數(shù)據(jù)
1).為了更好的展現(xiàn)數(shù)據(jù)的魅力,我們用matplotlib畫個圖看看吧
x軸用20年(1997-2016)的年份
y軸是每個賽季的得分情況
用數(shù)據(jù)可視化可以非常清晰的看出,96-97剛起步的時候,進步非常快,幾乎是火箭般的快速上升,然后30分左右徘徊了3-4年。突然爆發(fā)了,黃金賽季在06-07人生頂峰35分,而2014開始慢慢走向低谷,哪到底發(fā)生了什么了呢
2).其他的籃板,助攻,搶斷和蓋帽都可以仿照得分的方式來分析,表中分別對應TRB,AST,STL,BLK,看一下大致情況就好
籃板
助攻
結合前面的數(shù)據(jù),我們發(fā)現(xiàn)從2013年開始從得分王,開始慢慢的轉(zhuǎn)為助攻王,助攻的得分明顯上升甚至達到職業(yè)生涯的頂峰,猜想也許是因為體能或者傷痛的原因,轉(zhuǎn)為助攻
綜合畫一個雷達圖
總結
以上是生活随笔為你收集整理的厉害了!20年【科比NBA】生涯|数据分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Django】Django web项目
- 下一篇: jeDate 日期控件