日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

iris数据集实验

發布時間:2023/12/20 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 iris数据集实验 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

iris鳶尾花實驗

    • 一、實驗目的
    • 二、實驗環境
    • 三、實驗要求
    • 四、實驗過程及結果
    • 五、實驗總結

一、實驗目的

使用數據挖掘中的分類算法,對數據集進行分類訓練并測試。應用不同的分類算法,比較他們之間的不同。與此同時了解Weka平臺的基本功能與使用方法。

二、實驗環境

實驗采用Weka 3.8?平臺,數據使用給定的鳶尾花xls格式的數據集iris.xls。?對于iris數據集,它包含了150個實例(每個分類包含50個實例),共有sepal?length、sepal?width、petal?length、petal?width和class五種屬性。期中前四種屬性為數值類型,class屬性為分類屬性,表示實例所對應的類別。該數據集中的全部實例共可分為三類:Iris?Setosa、Iris?Versicolour和Iris?Virginica。

實驗所需的訓練集和測試集均為iris.arff。

三、實驗要求

1、將iris.xls轉化為iris.arff。

2、應用iris數據集,分別采用KNN、C4.5決策樹分類器和樸素貝葉斯分類器進行測試和評價,分別在訓練數據上訓練出分類模型,并對三個模型進行全面評價比較,得到一個最好的分類模型以及該模型所有設置的最優參數。

3、使用這些參數以及訓練集和校驗集數據一起構造出一個最優分類器,并利用該分類器對測試數據進行預測。

四、實驗過程及結果

1、先將數據集iris.arff放入Weka 3.8?平臺中
第一步:將原始Excel文件另存為CSV文件
第二步:在weka中打開iris數據集.csv文件,另save為.arrf文件,然后在weka中打開iris數據集.arrf文件即可。

2、在waka中應用iris數據集,分別采用KNN、C4.5決策樹分類器和樸素貝葉斯分類器進行測試和評價。
首先移除remove無關數據

(1)KNN分類器:

(2)C4.5決策樹分類器:

C4.5算法是ID3算法的改進,C4.5算法與ID3算法一樣使用了信息熵的概念,并和ID3一樣通過學習數據來建立決策樹。


在weka中右鍵可查看生成的決策樹

(3)樸素貝葉斯分類器:

關于樸素貝葉斯算法,貝葉斯方法不僅能夠計算顯式的假設概率,還能為理解多數其他方法提供一種有效的手段。貝葉斯方法的特點主要包括:增量式學習的特點;先驗知識可以與觀察到的實例一起決定假設的最終概率的特點;允許假設做出不確定性預測的特點;對新實例的分類可由多個假設以它們的概率為權重一起作出預測的特點等等。算法處理里的數據集特征之間互不相關,主要應用于文本分類、性別分類。

五、實驗總結

應用iris數據集分別利用實驗中的算法分析預測,最終結果選用C4.5算法準確率最高,準確分類率為98%。通過實驗,也讓我更深刻的學習到這三種算法的應用數據集和其優缺點,基本掌握weka平臺操作。

堅持比努力更可怕!沖沖沖

總結

以上是生活随笔為你收集整理的iris数据集实验的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。