python数据框 命名_Python-根据列值将数据框分为多个数据框,并用这些值命名 - python...
我有一個大型數據集,列出了在全國不同地區銷售的競爭對手產品。我希望通過使用這些新數據幀名稱中的列值的迭代過程,根據區域將該數據幀分成幾個其他區域,以便我可以分別處理每個數據幀-例如根據價格對每個地區的信息進行排序,以了解每個地區的市場情況。我給出了以下數據的簡化版本:
Competitor Region ProductA ProductB
Comp1 A £10 £15
Comp1 B £11 £16
Comp1 C £11 £15
Comp2 A £9 £16
Comp2 B £12 £14
Comp2 C £14 £17
Comp3 A £11 £16
Comp3 B £10 £15
Comp3 C £12 £15
我可以使用以下內容創建區域列表:
region_list=df['Region'].unique().tolist()
我希望在產生大量數據幀的迭代循環中使用它,例如
df_A :
Competitor Region ProductA ProductB
Comp1 A £10 £15
Comp2 A £9 £16
Comp3 A £11 £16
我可以使用代碼針對每個區域手動執行此操作
df_A=df.loc[df['Region']==A]
但是實際情況是,該數據集包含大量區域,這會使此代碼變得乏味。有沒有一種方法可以創建可重復此過程的迭代循環?有一個類似的問題詢問有關拆分數據幀的問題,但答案并未顯示如何根據每個列的值來標記輸出。
我對Python還是很陌生,并且仍然在學習,因此,如果實際上有另一種更明智的方法來解決此問題,那么我很樂意提出建議。
參考方案
通過不同值進行子集稱為groupby,如果僅想通過for循環遍歷各個組,則語法為:
for region, df_region in df.groupby('Region'):
print(df_region)
Competitor Region ProductA ProductB
0 Comp1 A £10 £15
3 Comp2 A £9 £16
6 Comp3 A £11 £16
Competitor Region ProductA ProductB
1 Comp1 B £11 £16
4 Comp2 B £12 £14
7 Comp3 B £10 £15
Competitor Region ProductA ProductB
2 Comp1 C £11 £15
5 Comp2 C £14 £17
8 Comp3 C £12 £15
pandas DataFrame:根據另一列中的布爾值計算總和 - python
我對Python相當陌生,我嘗試在pandas中模擬以下邏輯我目前正在循環拋出行,并希望對前幾行的AMOUNT列中的值求和,但只求和最后一次看到的“ TRUE”值。實際數據似乎效率低下(我的數據框大約有500萬行)?想知道用Python處理這種邏輯的有效方法是什么?邏輯:邏輯是,如果FLAG為TRUE,我想對前幾行的AMOUNT列中的值求和,但只求和最后一次…Pandas Dataframe:在越來越多的列上循環并計算均值和標準差 - python
基本上,我有一個包含20個屬性和一個值的表。我想找到std = 0-(即粒度級別完美允許1:1)所需的最少數量的屬性。我想建立一個循環如果使用列名進行硬編碼,則看起來像這樣:for iter in range(1,21): dfcalc = df.groupby("LINE_NUM")["RATIO"].agg([np…pandas.DataFrame.replace更改列的dtype - python
因此,我試圖用np.nan替換數據框中的None值,并注意到在此過程中,即使數據框中的float列的數據類型不包含任何丟失的數據,它們也都更改為object。舉個例子:import pandas as pd import numpy as np data = pd.DataFrame({'A':np.nan,'B':1…重命名默認ID python - python
我想連接兩個dataFrames,但是兩個數據具有不同的ID,所以結果是錯誤的這是我的代碼data=pd.DataFrame(df.columns) data1=data.drop(axis=1,index=[0,1,2,3]).transpose() data1 這是dataframe1另一個數據框:y=sma_algo(df.loc['H+L&…Python GPU資源利用 - python
我有一個Python腳本在某些深度學習模型上運行推理。有什么辦法可以找出GPU資源的利用率水平?例如,使用著色器,float16乘法器等。我似乎在網上找不到太多有關這些GPU資源的文檔。謝謝! 參考方案 您可以嘗試在像Renderdoc這樣的GPU分析器中運行pyxthon應用程序。它將分析您的跑步情況。您將能夠獲得有關已使用資源,已用緩沖區,不同渲染狀態上…
總結
以上是生活随笔為你收集整理的python数据框 命名_Python-根据列值将数据框分为多个数据框,并用这些值命名 - python...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: url获取网站信息不包含网页源文件内的标
- 下一篇: ttc转换ttf字体在线_R 语言画图中