當(dāng)前位置：首頁 > 人文社科 > 生活经验 >内容正文

生活经验

机器学习典型步骤以及训练集、验证集和测试集概念

發(fā)布時間：2023/11/27 生活经验 61 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习典型步骤以及训练集、验证集和测试集概念小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

有監(jiān)督還是無監(jiān)督，問題領(lǐng)域、數(shù)據(jù)量大小、訓(xùn)練時長、模型準(zhǔn)確度等多方面有關(guān)。

模型訓(xùn)練和測試

把數(shù)據(jù)集分成訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集，一般按照 8:2 或 7: 3 來劃分，然后用訓(xùn)練數(shù)據(jù)集來訓(xùn)練模型。訓(xùn)練出參數(shù)后再使用測試數(shù)據(jù)集來測試模型的準(zhǔn)確度。
模型評估和優(yōu)化

準(zhǔn)確性和性能多方面進行評估和優(yōu)化
模型使用

訓(xùn)練出來的模型可以把參數(shù)保存起來，下次使用時直接加載即可。一般來講，模型訓(xùn)練需要的計算量是很大的，也需要較長的時間來訓(xùn)練，這是因為一個好的模型參數(shù)，需要對大型數(shù)據(jù)集進行訓(xùn)練后才能得到。

而真正使用模型時，其計算量是比較少的，一般是直接把新樣本作為輸入，然后調(diào)用模型即可得出預(yù)測結(jié)果。

用來做訓(xùn)練的數(shù)據(jù)的集合。

在訓(xùn)練的過程中，每個訓(xùn)練輪次結(jié)束后用來驗證當(dāng)前模型性能，為進一步優(yōu)化模型提供參考的數(shù)據(jù)的集合。

用來測試的數(shù)據(jù)的集合，用于檢驗最終得出的模型的性能。

在個別情況下驗證集和測試集可以合二為一，不過當(dāng)然最好還是分開。驗證可以理解為一個小規(guī)模的對于已經(jīng)生成模型的測試，只不過已生成模型處理的數(shù)據(jù)不是測試集而是驗證集。

這三個集合可以從同一份標(biāo)注數(shù)據(jù)中隨機選取。三者的比例可以是訓(xùn)練集：驗證集：測試集=2：1：1，也可以是7：1：2。總之，訓(xùn)練集占大頭。有些情況下（整體數(shù)據(jù)量不大，模型又相對簡單時），驗證集和測試集也可以合二為一。

以上是生活随笔為你收集整理的机器学习典型步骤以及训练集、验证集和测试集概念的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。