sklearn 中的 Iris 数据集
sklearn
· Scikit-learn(sklearn)是機(jī)器學(xué)習(xí)中常用的第三方模塊,對(duì)常用的機(jī)器學(xué)習(xí)方法進(jìn)行了封裝,包括回歸(Regression)、降維(Dimensionality Reduction)、分類(Classfication)、聚類(Clustering)等方法。
· sklearn 中自帶的小型數(shù)據(jù)集:
1. 鳶尾花數(shù)據(jù)集 load_iris():用于分類任務(wù)的數(shù)據(jù)集
2. 手寫(xiě)數(shù)據(jù)集 load_digits():用于分類任務(wù)或者降維任務(wù)的數(shù)據(jù)集
3. 乳腺癌數(shù)據(jù)集 load-barest-cancer():簡(jiǎn)單經(jīng)典的用于二分類任務(wù)的數(shù)據(jù)集
4. 糖尿病數(shù)據(jù)集 load-diabetes():經(jīng)典的用于回歸認(rèn)為的數(shù)據(jù)集,值得注意的是,這10個(gè)特征中的每個(gè)特征都已經(jīng)被處理成0均值,方差歸一化的特征值
5. 波士頓房?jī)r(jià)數(shù)據(jù)集 load-boston():經(jīng)典的用于回歸任務(wù)的數(shù)據(jù)集
6. 體能訓(xùn)練數(shù)據(jù)集 load-linnerud():經(jīng)典的用于多變量回歸任務(wù)的數(shù)據(jù)集
Iris 數(shù)據(jù)集
· Iris (/?a?r?s/) 數(shù)據(jù)集是機(jī)器學(xué)習(xí)任務(wù)中常用的分類實(shí)驗(yàn)數(shù)據(jù)集,由Fisher在1936年整理。
· Iris :Anderson’s Iris data set, 中文名稱:安德森鳶尾花數(shù)據(jù)集
· Iris 數(shù)據(jù)集一共包含150個(gè)樣本,分3類,每類50個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)包含4個(gè)特征。4個(gè)特征分別為: Sepal.Length(花萼長(zhǎng)度)、Sepal.Width(花萼寬度)、Petal.Length(花瓣長(zhǎng)度)、Petal.Width(花瓣寬度),特征值都為正浮點(diǎn)數(shù),單位為厘米。根據(jù)4個(gè)特征預(yù)測(cè)鳶尾花屬于 Iris Setosa(山鳶尾)、Iris Versicolour(雜色鳶尾),Iris Virginica(維吉尼亞鳶尾)
測(cè)試
import numpy as np from sklearn import datasets def load_data():iris = datasets.load_iris()# 數(shù)據(jù)共 150 行 ,4 列print(iris.data.shape)# 150 行數(shù)據(jù) 對(duì)應(yīng) 150 個(gè)標(biāo)簽值(種類)print(iris.target.shape) if __name__ == "__main__":load_data()總結(jié)
以上是生活随笔為你收集整理的sklearn 中的 Iris 数据集的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 终于有人将进程间通信讲明白了
- 下一篇: Linux内核入门之路 (非广告)