DataFrame使用pd.sample()随机选取N行数据
生活随笔
收集整理的這篇文章主要介紹了
DataFrame使用pd.sample()随机选取N行数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.簡介
在訓練深度學習或者機器學習模型時,免不了需要按照比例劃分訓練集和驗證集,有的時候使用pandas的方式讀取csv數據文件,得到的是一個DataFrame的對象df,這時可以使用pd.sample()來實現從df中隨機抽樣。
2.函數說明
df.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
輸入參數見下表所示:
| n | 要抽取的行數 |
| frac | 抽取行的比例 |
| replace | 是否為有放回抽樣,True:有放回抽樣,False:不放回抽樣 |
| weights | 字符索引或概率數組,axis=0:為行字符索引或概率數組,axis=1:為列字符索引或概率數組 |
| random_state | int: 隨機數發生器種子或numpy.random.RandomState |
| axis | 選擇抽取數據的行還是列,axis=0:抽取行,axis=1:抽取列 |
3.返回值說明
返回值為帶有N行數據的DataFrame對象(N=1時也是DataFrame對象)
4.附加說明
在df.sample()函數中設置frac=1.0時可以實現shuffle
總結
以上是生活随笔為你收集整理的DataFrame使用pd.sample()随机选取N行数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PCI总线协议(一)
- 下一篇: 鼠标滑过图片抖动晃动效果(css/Sha