【深度学习】训练集、测试集和验证集
碼字不易,如果各位看官感覺該文章對(duì)你有所幫助,麻煩點(diǎn)個(gè)關(guān)注,如果有任何問題,請(qǐng)留言交流。如需轉(zhuǎn)載,請(qǐng)注明出處,謝謝。
文章鏈接:https://blog.csdn.net/herocheney/article/details/118300553
目錄
一、深度學(xué)習(xí)的數(shù)據(jù)
二、訓(xùn)練集、測(cè)試集和驗(yàn)證集
三、訓(xùn)練集、測(cè)試集和驗(yàn)證集的比例
一、深度學(xué)習(xí)的數(shù)據(jù)
? ? ? ? 在深度學(xué)習(xí)或機(jī)器學(xué)習(xí)的過程中,數(shù)據(jù)無疑是驅(qū)動(dòng)模型的主要能量,通過訓(xùn)練現(xiàn)有數(shù)據(jù),得到相應(yīng)的網(wǎng)絡(luò)參數(shù),使得我們所設(shè)計(jì)的模型具有泛化性,能夠預(yù)測(cè)一些未知的,沒有出現(xiàn)的樣本,并將該參數(shù)應(yīng)用到實(shí)際當(dāng)中,是模型訓(xùn)練的主要流程,數(shù)據(jù)的干凈程度,完備程度等,是網(wǎng)絡(luò)學(xué)習(xí)好壞的重中之重。
二、訓(xùn)練集、測(cè)試集和驗(yàn)證集
? ? ? ? 我們通常把訓(xùn)練的數(shù)據(jù)分為三個(gè)文件夾:訓(xùn)練集、測(cè)試集和驗(yàn)證集。
下面這個(gè)比喻非常恰當(dāng):模型的訓(xùn)練與學(xué)習(xí),類似于老師教學(xué)生學(xué)知識(shí)的過程。
1、訓(xùn)練集(train set):用于訓(xùn)練模型以及確定參數(shù)。相當(dāng)于老師教學(xué)生知識(shí)的過程。
2、驗(yàn)證集(validation set):用于確定網(wǎng)絡(luò)結(jié)構(gòu)以及調(diào)整模型的超參數(shù)。相當(dāng)于月考等小測(cè)驗(yàn),用于學(xué)生對(duì)學(xué)習(xí)的查漏補(bǔ)缺。
3、測(cè)試集(test set):用于檢驗(yàn)?zāi)P偷?strong>泛化能力。相當(dāng)于大考,上戰(zhàn)場(chǎng)一樣,真正的去檢驗(yàn)學(xué)生的學(xué)習(xí)效果。
參數(shù)(parameters)是指由模型通過學(xué)習(xí)得到的變量,如權(quán)重和偏置。
超參數(shù)(hyperparameters)是指根據(jù)經(jīng)驗(yàn)進(jìn)行設(shè)定的參數(shù),如迭代次數(shù),隱層的層數(shù),每層神經(jīng)元的個(gè)數(shù),學(xué)習(xí)率等。
三、訓(xùn)練集、測(cè)試集和驗(yàn)證集的比例
根據(jù)吳恩達(dá)的視頻所述,如果當(dāng)數(shù)據(jù)量不是很大的時(shí)候(萬級(jí)別以下)的時(shí)候?qū)⒂?xùn)練集、驗(yàn)證集以及測(cè)試集劃分為6:2:2;若是數(shù)據(jù)很大,可以將訓(xùn)練集、驗(yàn)證集、測(cè)試集比例調(diào)整為98:1:1。
總結(jié)
以上是生活随笔為你收集整理的【深度学习】训练集、测试集和验证集的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Antd】rawData.some i
- 下一篇: 微分方程模型_天生一对,硬核微分方程与深