當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

DataFrame使用pd.sample()随机选取N行数据

發布時間：2024/3/12 编程问答 66 豆豆

生活随笔收集整理的這篇文章主要介紹了 DataFrame使用pd.sample()随机选取N行数据小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在訓練深度學習或者機器學習模型時，免不了需要按照比例劃分訓練集和驗證集，有的時候使用pandas的方式讀取csv數據文件，得到的是一個DataFrame的對象df，這時可以使用pd.sample()來實現從df中隨機抽樣。

df.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
輸入參數見下表所示：

參數名稱參數說明

n	要抽取的行數
frac	抽取行的比例
replace	是否為有放回抽樣，True:有放回抽樣，False:不放回抽樣
weights	字符索引或概率數組，axis=0:為行字符索引或概率數組，axis=1:為列字符索引或概率數組
random_state	int: 隨機數發生器種子或numpy.random.RandomState
axis	選擇抽取數據的行還是列，axis=0:抽取行，axis=1:抽取列

返回值為帶有N行數據的DataFrame對象（N=1時也是DataFrame對象）

在df.sample()函數中設置frac=1.0時可以實現shuffle

以上是生活随笔為你收集整理的DataFrame使用pd.sample()随机选取N行数据的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。