如何来玩MNIST数据集?
生活随笔
收集整理的這篇文章主要介紹了
如何来玩MNIST数据集?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
MNIST數據集是一個基本的手寫字體識別數據集,包含50000個訓練樣本和10000個測試樣本,都是28*28的分辨率,可以用來做很多機器學習算法的研究。下面來看看這個數據集有哪些方法來玩。
之前已經玩過了,使用libsvm來對手寫數字進行分類,最終效果不錯,手寫字體達到了98+%的正確率,在李春光老師的課上提到最高可以提到99.8%左右。不過一般情況下,98%已經夠用了。
SVM的評價:
有監督學習方法,準確率高,訓練較慢(小時級別),訓練后預測較快(只依賴支持向量)。
其他還可以玩的方法有:
1. KNN
這是最簡單基本的機器學習方法。
2. PCA
降維并保持特征feature。李春光老師的課上,將數據集降維到二維平面上,可以基本明顯的將他們分開來。
3. 聚類
除了KNN,其他聚類方法。
4. ANN
神經網絡來一發。也是有監督訓練,試驗下10個hidden unit下的輸出?三層網絡到底能有什么效果?
5. 線性回歸、邏輯回歸
使用回歸能有多高的正確率?猜測不高,但是可以實踐看一下。
總結
以上是生活随笔為你收集整理的如何来玩MNIST数据集?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 回归、线性回归和逻辑回归【逻辑回归部分待
- 下一篇: 机器学习中的lazy method与ea