matlab 使用uci数据集,如何使用UCI数据集
UCI數據集是一個常用的機器學習標準測試數據集。 地址: http://www.ics.uci.edu/~mlearn
以Iris鳶尾花數據集為例:
1.Iris數據集在右邊方框【Most Popular Data Sets (hits since 2007)】中第一個。
2.點擊Iris數據集,進入該數據集詳情頁面:
上面是這個數據集的詳細信息:多變量數據集,沒有缺失值,也許是模式識別文獻中最著名的數據集等等,再往下是與該數據集相關的一些論文。
3.回到上面的圖片處,左邊【Data Folder】是存放該數據集的位置,【Data Set Description】是數據集的描述,點擊進入【Data Folder】。
4.該文件夾中有三個文件:【Index】、【iris.data】和【iris.names】(忽略【bezdekIris.data】)。
Index為文件夾目錄,列出了本文件夾里的所有文件。如iris中index的內容如下:
Index of iris
02 Dec 1996 105 Index
08 Mar 1993 4551 iris.data
30 May 1989 2604 iris.names
iris.data為iris數據文件,內容如下:
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
……
7.0,3.2,4.7,1.4,Iris-versicolor
6.4,3.2,4.5,1.5,Iris-versicolor
6.9,3.1,4.9,1.5,Iris-versicolor
……
6.3,3.3,6.0,2.5,Iris-virginica
5.8,2.7,5.1,1.9,Iris-virginica
7.1,3.0,5.9,2.1,Iris-virginica
……
如上,屬性直接以逗號隔開,中間沒有空格(5.1,3.5,1.4,0.2,),最后一列為本行屬性對應的值(這里即為鳶尾花的種類)。
iris.names就是說過的【Data Set Description】,介紹了iris數據的一些相關信息,如數據標題、數據來源、以前使用情況、最近信息、實例數目、實例的屬性等。
4.點擊【iris.data】,右鍵,鏈接另存為,即可下載該數據集。
5.在Matlab中,我們可以右鍵點擊該文件選擇【導入數據】進入可視化界面并加載數據或使用命令【load 文件名】加載數據。建議使用右鍵方法,因為可以自行選擇導入數據的范圍。P.S.因為Iris數據集中有字符串,所以我們需要將其替換為數字。
6.至此,我們就可以得到該數據集并使用了!
參考資料:
1. UCI數據集使用
總結
以上是生活随笔為你收集整理的matlab 使用uci数据集,如何使用UCI数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python实现语音机器人
- 下一篇: 怎么用计算机画正弦函数图像,几何画板如何