當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

oxford5k和paris6k数据集介绍_sklearn函数：KFold（分割训练集和测试集）

發(fā)布時間：2024/4/19 编程问答 54 豆豆

生活随笔收集整理的這篇文章主要介紹了 oxford5k和paris6k数据集介绍_sklearn函数：KFold（分割训练集和测试集）小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

上一篇介紹了train_test_split函數(shù)：

橘貓吃不胖：sklearn函數(shù)：train_test_split（分割訓(xùn)練集和測試集）?zhuanlan.zhihu.com

主要場景是，我們想要將原始數(shù)據(jù)分割為訓(xùn)練集和測試集，但是會有一些問題

比如，過渡擬合（a risk of overfittingon the test set）

其中一個方法是，再拆分出來一個驗(yàn)證集，先用訓(xùn)練集訓(xùn)練模型，然后使用驗(yàn)證集來校驗(yàn)，最后去測試集，但是這個方法很明顯的問題是，大大減少了訓(xùn)練集的樣本數(shù)。

另一種比較好的方案就是cross-validation (CV for short)，交叉驗(yàn)證

基本的思路是：k-fold CV，也就是我們下面要用到的函數(shù)KFold，是把原始數(shù)據(jù)分割為K個子集，每次會將其中一個子集作為測試集，其余K-1個子集作為訓(xùn)練集。

下圖是官網(wǎng)提供的一個介紹圖，詳情介紹參考：https://scikit-learn.org/stable/modules/cross_validation.html

下面介紹函數(shù)的使用

classsklearn.model_selection.KFold(n_splits=5,*,shuffle=False,random_state=None)

n_splits：int, default=5

表示，要分割為多少個K子集

shuffle：bool, default=False

是否要洗牌（打亂數(shù)據(jù)）

random_state：int or RandomState instance, default=None

這和前一篇中提到的隨機(jī)狀態(tài)是一樣的，需要配合shuffle參數(shù)使用

小栗子

import numpy as np from sklearn.model_selection import KFoldX = np.random.randint(1,100,20).reshape((10,2)) Xkf = KFold(n_splits=5) kffor X_train,X_test in kf.split(X):print(X_train,X_test)for X_train_i,X_test_i in kf.split(X):print(X[X_train_i],X[X_test_i])

總結(jié)

以上是生活随笔為你收集整理的oxford5k和paris6k数据集介绍_sklearn函数：KFold（分割训练集和测试集）的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： cad输入法自动切换_百度输入法 Lin
下一篇： qt messagebox退出程序_[Q

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

oxford5k和paris6k数据集介绍_sklearn函数：KFold（分割训练集和测试集）

小栗子

總結(jié)