日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

盘点8个数据分析相关的Python库(实例+代码)

發布時間:2025/3/15 python 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 盘点8个数据分析相关的Python库(实例+代码) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

導讀:Python中常會用到一些專門的庫,如NumPy、SciPy、Pandas和Matplotlib。數據處理常用到NumPy、SciPy和Pandas,數據分析常用到Pandas和Scikit-Learn,數據可視化常用到Matplotlib,而對大規模數據進行分布式挖掘時則可以使用Pyspark來調用Spark集群的資源。

從一定程度上來說,學習Python數據分析主要就是學習使用這些分析庫。

作者:劉鵬 高中強 王一凡?等

來源:大數據DT(ID:hzdashuju)

01 NumPy

關于NumPy,本節主要介紹ndarray多維數組對象和數組屬性。

1. ndarray 多維數組對象

NumPy庫中的ndarray是一個多維數組對象,由兩部分組成:實際的數據值和描述這些值的元數據。大部分的數組操作僅僅涉及修改元數據的部分,并不改變底層的實際數據。

數組中的所有元素類型必須是一致的,所以如果知道其中一個元素的類型,就很容易確定該數組需要的存儲空間。可以用array()函數創建數組,并通過dtype獲取其數據類型。

import?numpy?as?npa?=?np.array(6)a.dtype output:?dtype('int64')

上例中,數組a的數據類型為int64,如果使用的是32位Python,則得到的數據類型可能是int32。

2. 數組屬性

NumPy數組有一個重要的屬性——維度(dimension),它的維度被稱作(rank)。以二維數組為例,一個二維數組相當于兩個一維數組。只看最外面一層,它相當于一個一維數組,該一維數組中的每個元素也是一維數組。那么,這個一維數組即二維數組的軸。

了解了以上概念,接著來看NumPy數組中比較重要的ndarray對象的屬性:

  • ndarray.ndim:秩,即軸的數量或維度的數量

  • ndarray.shape:數組的維度,如果存的是矩陣,如n×m矩陣則輸出為n行m列

  • ndarray.size:數組元素的總個數,相當于.shape中n×m的值

  • ndarray.dtype:ndarray對象的元素類型

  • ndarray.itemsize:ndarray對象中每個元素的大小,以字節為單位

  • ndarray.flags:ndarray對象的內存信息

  • ndarray.real:ndarray元素的實部

  • ndarray.imag:ndarray元素的虛部

  • ndarray.data:包含實際數組元素的緩沖區,由于一般通過數組的索引獲取元素,所以通常不需要使用這個屬性

02 Matplotlib

Matplotlib是Python數據分析中常用的一個繪圖庫,常用來繪制各種數據的可視化效果圖。其中,matplotlib.pyplot包含了簡單的繪圖功能。

1. 實戰:繪制多項式函數

為了說明繪圖的原理,下面來繪制多項式函數的圖像。使用NumPy的多項式函數poly1d()來創建多項式。

#?引入所需要的庫 import?numpy?as?np import?matplotlib.pyplot?as?plt #?使用?polyld()?函數創建多項式?func=1x3+2x2+3x+4 func?=?np.poly1d(np.array([1,2,3,4]).astype(f?loat)) #?使用?NumPy?的?linspace()?函數在?-10?和?10?之間產生?30?個均勻分布的值,作為函數?x?軸的取值 x?=?np.linspace(-10,?10?,?30) #?將?x?的值代入?func()?函數,計算得到?y?值 y=func(x) #?調用?pyplot?的?plot?函數?(),繪制函數圖像 plt.plot(x,?y) #?使用?xlable()?函數添加?x?軸標簽 plt.xlabel('x') #?使用?ylabel()?函數添加?y?軸標簽 plt.ylabel('y(x)') #?調用?show()?函數顯示函數圖像 plt.show()

多項式函數的繪制結果如圖2-13所示。

▲圖2-13 多項式函數繪制

2. 實戰:繪制正弦和余弦值

為了明顯看到兩個效果圖的區別,可以將兩個效果圖放到一張圖中顯示。Matplotlib中的subplot()函數允許在一張圖中顯示多張子圖。subplot()常用的3個整型參數分別為子圖的行數、子圖的列數以及子圖的索引。

下面的實例將繪制正弦和余弦兩個函數的圖像。

#?導入相關包 import?numpy?as?np import?matplotlib.pyplot?as?plt from?matplotlib.pyplot?import?f?igure f?igure(num=None,?f?igsize=(12,?8),?dpi=80,?facecolor='w',?edgecolor='k') #?計算正弦和余弦曲線上點的?x?和?y?坐標 x?=?np.arange(0,?3?*?np.pi,?0.1) y_sin?=?np.sin(x) y_cos?=?np.cos(x) #?subplot的3個參數,2、1、1?,表示繪制2行1列圖像中的第一個子圖 plt.subplot(2,?1,?1)#?繪制第一個子圖 #?繪制第一個圖像 plt.plot(x,?y_sin)? plt.title('Sin') plt.subplot(2,?1,?2)#?繪制2行1?列圖像中的第二個子圖 plt.plot(x,?y_cos)? plt.title('Cos') plt.show()#?顯示圖像

正弦和余弦函數的繪制結果如圖2-14所示。

▲圖2-14 正弦和余弦函數繪制

03 PySpark

在大數據應用場景中,當我們面對海量的數據和復雜模型巨大的計算需求時,單機的環境已經難以承載,需要用到分布式計算環境來完成機器學習任務。

Apache Spark是一個快速而強大的框架,可以對彈性數據集執行大規模分布式處理。通過圖2-15所示的Apache Spark架構圖可以非常清晰地看到它的組成。

▲圖2-15 Apache Spark架構圖

Spark支持豐富的數據源,可以契合絕大部分大數據應用場景,同時,通過Spark核心對計算資源統一調度,由于計算的數據都在內存中存儲,使得計算效率大大提高。Spark原生支持的語言是Scala,但為了豐富應用場景和滿足各研發人員的語言偏好,Spark同時支持Java、Python與R。

PySpark是Spark社區發布的在Spark框架中支持Python的工具包,它的計算速度和能力與Scala相似。通過PySpark調用Spark的API,配合MLlib與ML庫,可以輕松進行分布式數據挖掘。

MLlib庫是Spark傳統的機器學習庫,目前支持4種常見的機器學習問題:分類、回歸、聚類和協同過濾。MLlib的所有算法皆基于Spark特有的RDD(Resilient Distributed Dataset,彈性分布式數據集)數據結構進行運算。由于RDD并不能很好地滿足更為復雜的建模需求,ML庫應運而生。

ML庫相較MLlib庫更新,它全面采用基于數據幀(Data Frame)的API進行操作,能夠提供更為全面的機器學習算法,且支持靜態類型分析,可以在編程過程中及時發現錯誤,而不需要等代碼運行。

Python中除了包含上面介紹的庫,還有其他一些常用庫。下面分別進行介紹。

04 SciPy

SciPy是一個開源算法庫和數學工具包,它基于NumPy構建,并擴展了NumPy的功能。SciPy包含線性代數、積分、插值、特殊函數、快速傅里葉變換等常用函數,功能與軟件MATLAB、Scilab和GNU Octave類似。Scipy常常結合Numpy使用,可以說Python的大多數機器學習庫都依賴于這兩個模塊。

05 Pandas

Pandas提供了強大的數據讀寫功能、高級的數據結構和各種分析工具。該庫的一大特點是能用一兩個命令完成復雜的數據操作。

Pandas中最基礎的數據結構是Series,用于表示一行數據,可以理解為一維的數組。另一個關鍵的數據結構為DataFrame,用于表示二維數組,作用和R語言里的data.frame很像。

Pandas內置了很多函數,用于分組、過濾和組合數據,這些函數的執行速度都很快。Pandas對于時間序列數據有一套獨特的分析機制,可對時間數據做靈活的分析與管理。

06 Scikit-Learn

Scikit-Learn是一個基于NumPy、SciPy、Matplotlib的開源機器學習工具包,功能強大,使用簡單,是Kaggle選手經常使用的學習庫。它主要涵蓋分類、回歸和聚類算法,例如SVM、邏輯回歸、樸素貝葉斯、隨機森林、K均值以及數據降維處理算法等,官方文檔齊全,更新及時。

Scikit-Learn基于Numpy和SciPy等Python數值計算庫,提供了高效的算法實現,并針對所有算法提供了一致的接口調用規則,包括KNN、K均值、PCA等,接口易用。

07 TensorFlow

TensorFlow是谷歌開源的數值計算框架,也是目前最為流行的神經網絡分析系統。它采用數據流圖的方式,可靈活搭建多種機器學習和深度學習模型。

08 Keras

Keras是一個用于處理神經網絡的高級庫,可以運行在TensorFlow和Theano上,現在發布的新版本可以使用CNTK或MxNet作為后端。Keras簡化了很多特定任務,并大大減少了樣板代碼數,目前主要用于深度學習領域。

關于作者:劉鵬,教授,清華大學博士,云計算、大數據和人工智能領域的知名專家,南京云創大數據科技股份有限公司總裁、中國大數據應用聯盟人工智能專家委員會主任。中國電子學會云計算專家委員會云存儲組組長、工業和信息化部云計算研究中心專家。

高中強,人工智能與大數據領域技術專家,有非常深厚的積累,擅長機器學習和自然語言處理,尤其是深度學習,熟悉Tensorflow、PyTorch等深度學習開發框架。曾獲“2019年全國大學生數學建模優秀命題人獎”。參與鐘南山院士指導新型冠狀病毒人工智能預測系統研發項目,與鐘南山院士團隊共同發表學術論文。

本文摘編自《Python金融數據挖掘與分析實戰》,經出版方授權發布。(ISBN:9787111696506)

《Python金融數據挖掘與分析實戰》

點擊上圖了解及購買

轉載請聯系微信:DoctorData

推薦語:云創大數據(上市公司)總裁撰寫,零基礎學會金融數據挖掘,配有案例、視頻、代碼、數據、習題及答案。

劃重點👇

干貨直達👇

  • 終于有人把ROS機器人操作系統講明白了

  • 6個實例,8段代碼,詳解Python中的for循環

  • 這10本硬核技術書,帶你讀懂5G、物聯網和邊緣計算,玩轉元宇宙

  • 手把手教你獲取、編譯和調試Flink的源代碼

更多精彩👇

在公眾號對話框輸入以下關鍵詞

查看更多優質內容!

讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手

大數據?|?云計算?|?數據庫?|?Python?|?爬蟲?|?可視化

AI?|?人工智能?|?機器學習?|?深度學習?|?NLP

5G?|?中臺?|?用戶畫像?|?數學?|?算法?|?數字孿生

據統計,99%的大咖都關注了這個公眾號

👇

總結

以上是生活随笔為你收集整理的盘点8个数据分析相关的Python库(实例+代码)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 97se亚洲综合| 丁香综合激情 | 国产成人久久精品77777综合 | 黑人与亚洲人色ⅹvideos | 亚洲25p| 草草影院在线播放 | 亚洲三级在线看 | 久久狠| 国产午夜精品久久久久 | 欧美激情黑人 | 超碰1997| 波多野结衣av在线免费观看 | 亚洲三级电影网站 | 久久久a级片| 超碰超碰97 | 国产精品免费一区二区三区都可以 | 伦乱天堂 | 欧美一区二区性久久久 | 香蕉污视频 | 欧美三级理论片 | 四虎国产精品免费 | 每日av在线 | 色先锋在线 | 久久久久久久女国产乱让韩 | 麻豆国产av超爽剧情系列 | 成人免费观看网址 | 日韩欧美一级片 | 欧洲一区二区在线观看 | 美女无遮挡免费网站 | 91麻豆精品国产91久久久久久久久 | 国产一级生活片 | 调教撅屁股啪调教打臀缝av | 亚瑟av| 秋霞在线一区 | 大尺度摸揉捏胸床戏视频 | 91免费网| 风间由美在线视频 | 亚洲视频第一页 | 久久人人草 | 成人毛片网 | 一级免费观看视频 | 色伊人网 | 亚洲阿v天堂 | 97爱爱视频 | 最新视频在线观看 | 日本少妇色视频 | 免费看成人片 | 大j8福利视频导航 | 天天做天天摸天天爽天天爱 | 伦乱天堂 | 婷婷射| 中国精品一区二区 | 日本东京热一区二区三区 | 伊人999| 五月激情六月婷婷 | 最近中文字幕在线免费观看 | 天堂在线中文字幕 | 日日操网站| 九色国产精品 | 国产精品传媒一区二区 | 东方成人av | 亚洲乱色| 欧美做受高潮1 | 最新亚洲精品 | 可以看的毛片 | 久久久久久久久久久综合 | 91视频成人 | 国产亚洲精品久久久久久青梅 | av在线不卡观看 | 老太脱裤让老头玩ⅹxxxx | 欧美成人久久 | 日本熟妇一区二区三区四区 | 国产高清露脸 | 亚洲天堂成人在线 | 孕妇疯狂做爰xxxⅹ 国产精品乱码久久久久久 99久久久成人国产精品 | 伊人中文字幕在线观看 | 女优一区二区三区 | 日产毛片 | 正在播放一区二区 | 欧美体内she精高潮 日韩一区免费 | 名校风暴在线观看免费高清完整 | 国产女人18毛片水真多 | 伊人激情网| 日韩天堂av | 偷拍超碰 | 国产片天天弄 | 好吊视频一区二区 | 日日日插插插 | 国内精品久久久久久久影视简单 | 国产成人精品av | 日本精品一区 | 久操这里只有精品 | 石原莉奈在线播放 | 亚洲小说专区 | 无码免费一区二区三区 | 久久久久亚洲av无码专区桃色 | 国产精品天美传媒 | 成人日皮视频 | 国产成人精品综合久久久久99 |