日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python数模笔记-Sklearn (1)介绍

發布時間:2025/3/15 python 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python数模笔记-Sklearn (1)介绍 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、SKlearn 是什么

Sklearn(全稱 SciKit-Learn),是基于 Python 語言的機器學習工具包。

Sklearn 主要用Python編寫,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基礎上,也用 Cython編寫了一些核心算法來提高性能。

Sklearn 包括六大功能模塊:

  • 分類(Classification):識別樣本屬于哪個類別,常用算法有 SVM(支持向量機)、nearest neighbors(最近鄰)、random forest(隨機森林)

  • 回歸(Regression):預測與對象相關聯的連續值屬性,常用算法有 SVR(支持向量機)、 ridge regression(嶺回歸)、Lasso

  • 聚類(Clustering):對樣本進行無監督的自動分類,常用算法有 k-Means(k均值)、spectral clustering(特征聚類)、mean-shift(均值漂移)

  • 數據降維(Dimensionality reduction):減少相關變量維數,常用算法有 PCA(主成分分析)、feature selection(特征選擇)、non-negative matrix factorization(非負矩陣分解)

  • 模型選擇(Model Selection):比較,驗證,選擇參數和模型,常用模塊有 grid search(網格搜索)、cross validation(交叉驗證)、 metrics(度量)

  • 數據處理 (Preprocessing):特征提取和歸一化,常用模塊有 preprocessing(預處理),feature extraction(特征提取)

    這六個功能模塊涉及 4類算法,分類、回歸 屬于監督學習,聚類屬于非監督學習。

歡迎關注 Youcans 原創系列,每周更新數模筆記

Python數模筆記-PuLP庫
Python數模筆記-StatsModels統計回歸
Python數模筆記-Sklearn
Python數模筆記-NetworkX
Python數模筆記-模擬退火算法

官網地址:https://scikit-learn.org/

官方文檔中文版: https://www.scikitlearn.com.cn/

內置數據集:https://scikit-learn.org/stable/datasets.html



2、SKlearn 的安裝

Sklearn 的安裝要求:Python 3.5 以上版本,需要安裝 NumPy、SciPy、Pandas 工具包的支持,部分內容需要使用 Matplotlib、joblib 工具包。

pip 安裝命令:

pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple

注意 Sklearn 建議安裝 Numpy+mkl,可以在網址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下載后 pip3安裝:

pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl



3、SKlearn 內置數據集

Sklearn 內置了一些標準數據集可以用于練習和測試,都是經常被引用的經典問題,數據網址:https://scikit-learn.org/stable/datasets.html
  
  Sklearn 標準數據集主要包括:

  • 測試問題數據集
    • 波士頓房價:Boston house prices dataset
    • 鳶尾花問題:Iris plants dataset
    • 糖尿病數據:Diabetes dataset
    • 手寫數字的識別:Optical recognition of handwritten digits dataset
    • 體能訓練:Linnerrud dataset
    • 葡萄酒鑒別:Wine recognition dataset
    • 威斯康星州癌癥診斷:reast cancer wisconsin (diagnostic) dataset
  • 實際問題數據集
    • 人臉數據:The Olivetti faces dataset
    • 20個新聞文本數據:The 20 newsgroups text dataset
    • 標記的人臉數據:The Labeled Faces in the Wild face recognition dataset
    • 森林覆蓋類型:Forest covertypes
    • 路透社新聞數據:RCV1 dataset
    • 網絡入侵檢測數據:Kddcup 99 dataset
    • 加州住房數據:California Housing dataset
      = 關注 Youcans,分享原創系列 https://blog.csdn.net/youcans =


4、Sklearn 數模筆記的計劃

粗略看看 Sklearn 的文檔,是一個功能強大和豐富的機器學習庫,遠遠超出了數學建模學習的范圍。
  基于數模教學的目的,本系列主要對應數模學習中的分類、聚類、降維問題,并不打算全面講解 Sklearn 的各種算法,而是以典型問題為例來介紹原理簡單、使用廣泛的基本方法,以便新手入門。



版權說明:
YouCans 原創作品
Copyright 2021 YouCans, XUPT
Crated:2021-05-09

歡迎關注 Youcans 原創系列,每周更新數模筆記

Python數模筆記-PuLP庫(1)線性規劃入門
Python數模筆記-PuLP庫(2)線性規劃進階
Python數模筆記-PuLP庫(3)線性規劃實例
Python數模筆記-StatsModels 統計回歸(1)簡介
Python數模筆記-StatsModels 統計回歸(2)線性回歸
Python數模筆記-StatsModels 統計回歸(3)模型數據的準備
Python數模筆記-StatsModels 統計回歸(4)可視化
Python數模筆記-Sklearn (1)介紹
Python數模筆記-Sklearn (2)聚類分析
Python數模筆記-Sklearn (3)主成分分析
Python數模筆記-Sklearn (4)線性回歸
Python數模筆記-Sklearn (5)支持向量機
Python數模筆記-模擬退火算法(1)多變量函數優化
Python數模筆記-模擬退火算法(2)約束條件的處理
Python數模筆記-模擬退火算法(3)整數規劃問題
Python數模筆記-模擬退火算法(4)旅行商問題

總結

以上是生活随笔為你收集整理的Python数模笔记-Sklearn (1)介绍的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。