近邻算法分类
scikit-learn已經封裝好很多數據挖掘的算法
現介紹數據挖掘框架的搭建方法
- 轉換器(Transformer)用于數據預處理,數據轉換
- 流水線(Pipeline)組合數據挖掘流程,方便再次使用(封裝)
- 估計器(Estimator)用于分類,聚類,回歸分析(各種算法對象)
- 所有的估計器都有下面2個函數
- fit() 訓練
- 用法:estimator.fit(X_train, y_train),
- estimator = KNeighborsClassifier() 是scikit-learn算法對象
- X_train = dataset.data 是numpy數組
- y_train = dataset.target 是numpy數組
- predict() 預測
- 用法:estimator.predict(X_test)
- estimator = KNeighborsClassifier() 是scikit-learn算法對象
- X_test = dataset.data 是numpy數組
- fit() 訓練
- 所有的估計器都有下面2個函數
電離層數據集
電離層數據集(Ionosphere Dataset)需要根據給定的電離層中的自由電子的雷達回波預測大氣結構。
它是一個二元分類問題。每個類的觀察值數量不均等,一共有 351 個觀察值,34 個輸入變量和1個輸出變量。變量名如下:
1 17對雷達回波數據。
2 … …
3 類
總結
- 上一篇: 使用jieba 提取 关键词
- 下一篇: svm的三个核函数