python sample函数_Python pandas.DataFrame.sample函数方法的使用
DataFrame.sample(n=None,?frac=None,?replace=False,?weights=None,?random_state=None,?axis=None)[source]
從對(duì)象軸返回隨機(jī)的項(xiàng)目樣本。
您可以使用random_state來實(shí)現(xiàn)重現(xiàn)性。
參數(shù):n:int, 可選
從軸返回的項(xiàng)目數(shù)。 不能與frac一起使用。
如果frac = None,則Default = 1。
frac:float, 可選
要返回的軸項(xiàng)的Fraction。不能與n一起使用。
replace:bool, 默認(rèn)為 False
允許或不允許對(duì)同一行進(jìn)行多次抽樣。
weights:?str或ndarray-like, 可選
默認(rèn)的‘None’將導(dǎo)致相等的概率權(quán)重。
如果傳遞了一個(gè)Series,將與目標(biāo)對(duì)象上的索引對(duì)齊。
權(quán)重中未被采樣對(duì)象發(fā)現(xiàn)的索引值將被忽略,
權(quán)重中未被采樣對(duì)象的索引值將被賦值為零。
如果在DataFrame上調(diào)用,
將在axis = 0時(shí)接受列的名稱。
除非權(quán)值是一個(gè)Series,
否則權(quán)值必須與被采樣的軸線長度相同。
如果權(quán)重的和不是1,它們將被規(guī)范化為和為1。
weights列中缺失的值將被視為零。不允許無限值。
random_state?:int,array-like,
BitGenerator, np.random.RandomState, 可選
如果int,array-like,或BitGenerator (NumPy>=1.17),
種子為隨機(jī)數(shù)生成器,如果np.random。隨機(jī)狀態(tài),用作numpy隨機(jī)狀態(tài)對(duì)象。
在版本1.1.0中改變:array-like和BitGenerator(用于NumPy>=1.17),
對(duì)象現(xiàn)在作為種子傳遞給np.random.RandomState()
axis?:{0或 ‘index’, 1或 ‘columns’, None}, 默認(rèn)為 None
從軸返回的項(xiàng)目數(shù)。 不能與frac一起使用。 如果frac = None,
則Default = 1。
返回值:Series或 DataFrame
與調(diào)用者相同類型的新對(duì)象,
包含從調(diào)用者對(duì)象中隨機(jī)取樣的n項(xiàng)。
Notes
如果frac >1,則應(yīng)將replacement設(shè)置為True。
例子>>> df = pd.DataFrame({'num_legs': [2, 4, 8, 0],
... 'num_wings': [2, 0, 0, 0],
... 'num_specimen_seen': [10, 2, 1, 8]},
... index=['falcon', 'dog', 'spider', 'fish'])
>>> df
num_legs num_wings num_specimen_seen
falcon 2 2 10
dog 4 0 2
spider 8 0 1
fish 0 0 8
從中提取3個(gè)隨機(jī)元素Series?df['num_legs']:請(qǐng)注意,我們使用random_state來確保示例的可重復(fù)性>>> df['num_legs'].sample(n=3, random_state=1)
fish 0
spider 8
falcon 2
Name: num_legs, dtype: int64
隨機(jī)DataFrame替換的50%樣品:>>> df.sample(frac=0.5, replace=True, random_state=1)
num_legs num_wings num_specimen_seen
dog 4 0 2
fish 0 0 8
DataFramewith替換的upsample樣本:請(qǐng)注意,對(duì)于frac參數(shù)> 1?,replace參數(shù)必須為True>>> df.sample(frac=2, replace=True, random_state=1)
num_legs num_wings num_specimen_seen
dog 4 0 2
fish 0 0 8
falcon 2 2 10
falcon 2 2 10
fish 0 0 8
dog 4 0 2
fish 0 0 8
dog 4 0 2
使用DataFrame列作為權(quán)重。num_specimen_seen列中值較大的行?更可能被采樣>>> df.sample(n=2, weights='num_specimen_seen', random_state=1)
num_legs num_wings num_specimen_seen
falcon 2 2 10
fish 0 0 8
總結(jié)
以上是生活随笔為你收集整理的python sample函数_Python pandas.DataFrame.sample函数方法的使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Excel 表格有重复内容怎么办?
- 下一篇: Python:sample函数 如何使用