當(dāng)前位置：首頁 >

python中dtypes_关于python：如何通过pandas DataFrame中的列设置dtypes

發(fā)布時間：2025/4/5 44 豆豆

生活随笔收集整理的這篇文章主要介紹了 python中dtypes_关于python：如何通过pandas DataFrame中的列设置dtypes 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

我想將一些數(shù)據(jù)帶入pandas DataFrame，并為導(dǎo)入時的每一列分配dtypes。我希望能夠?qū)哂性S多不同列的較大數(shù)據(jù)集執(zhí)行此操作，但是，例如：

myarray = np.random.randint(0,5,size=(2,2))

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype=[float,int])

mydf.dtypes

結(jié)果是：

TypeError: data type not understood

我嘗試了其他一些方法，例如：

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype={'a': int})

TypeError: object of type 'type' has no len()

如果我放dtype=(float,int)，它將浮點(diǎn)格式應(yīng)用于兩列。

最后，我希望能夠?qū)⑵鋫鬟f給數(shù)據(jù)類型列表，就像我將其傳遞給列名稱列表一樣。

dtype的參數(shù)應(yīng)該是有效的numpy dtype(并且不支持結(jié)構(gòu)化dtype)，因此列表或字典將不起作用。一種可能的方法是分別為每個列進(jìn)行分類。或者首先創(chuàng)建一個結(jié)構(gòu)化的numpy數(shù)組，并將其提供給DataFrame。

我知道我可以在循環(huán)中分別分配每個對象，但令我驚訝的是dtype =不夠靈活，無法容納列表。不過感謝您的回答，很高興得到確認(rèn):)

github.com/pydata/pandas/issues/4464目前是一個未解決的問題(如果您想執(zhí)行拉取請求，那就太好了)

只是為了好玩：有人使用read_csv解決了這個問題：stackoverflow.com/a/38524255/6646912：D

我剛遇到這個問題，而熊貓問題仍未解決，所以我發(fā)布了解決方法。假設(shè)df是我的DataFrame，而dtype是將列名稱映射到類型的字典：

for k, v in dtype.items():

df[k] = df[k].astype(v)

(注意：在python 2中使用dtype.iteritems())

供參考：

允許的數(shù)據(jù)類型列表(NumPy dtypes)：https://docs.scipy.org/doc/numpy-1.12.0/reference/arrays.dtypes.html

熊貓還支持其他一些類型。例如category：http://pandas.pydata.org/pandas-docs/stable/categorical.html

相關(guān)的GitHub問題：https://github.com/pandas-dev/pandas/issues/9287

我需要使用for k, v in dtype.iteritems():才能正常工作。

可以將其更改為df.astype(dtype)

對于某些類型轉(zhuǎn)換，此方法嚴(yán)重失敗：stackoverflow.com/questions/54393266/

您可能希望嘗試將Series對象的字典傳遞給DataFrame構(gòu)造函數(shù)-它會為您提供對創(chuàng)建的更多具體控制，并且希望可以更清楚地了解發(fā)生了什么。模板版本(data1可以是數(shù)組等)：

df = pd.DataFrame({'column1':pd.Series(data1, dtype='type1'),

'column2':pd.Series(data2, dtype='type2')})

并舉例說明數(shù)據(jù)：

df = pd.DataFrame({'A':pd.Series([1,2,3], dtype='int'),

'B':pd.Series([7,8,9], dtype='float')})

print (df)

A ?B

0 ?1 ?7.0

1 ?2 ?8.0

2 ?3 ?9.0

print (df.dtypes)

A ? ? int32

B ? ?float64

dtype: object

從pandas 0.24.2版本(當(dāng)前的穩(wěn)定版本)開始，無法將docs類型的數(shù)據(jù)類型的顯式列表傳遞給DataFrame構(gòu)造函數(shù)：

dtype : dtype, default None

Data type to force. Only a single dtype is allowed. If None, infer

但是，dataframe類確實(shí)具有靜態(tài)方法，允許您將numpy結(jié)構(gòu)化數(shù)組轉(zhuǎn)換為數(shù)據(jù)框，因此您可以執(zhí)行以下操作：

>>> myarray = np.random.randint(0,5,size=(2,2))

>>> record = np.array(map(tuple,myarray),dtype=[('a',np.float),('b',np.int)])

>>> mydf = pd.DataFrame.from_records(record)

>>> mydf.dtypes

a ? ?float64

b ? ? ?int64

dtype: object

在處理數(shù)據(jù)類型時，應(yīng)將它們作為字符串傳遞。

例如，您遵循的后一種方法應(yīng)修改為

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype={'a': **'int'**})

代替

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype={'a': **int**})。

dtype (int, float etc.)應(yīng)該以字符串形式給出。

或者作為替代方法(如果您不想作為字符串傳遞)

將numpy導(dǎo)入為np并使用

mydf = pd.DataFrame(myarray,columns=['a','b'], dtype={'a': **np.int**})

我不明白為什么**在那里。那是不正確的語法。將它們?nèi)〕?#xff0c;放在mydf = pd.DataFrame(myarray,columns=[a,b], dtype={a: **np.int**})的最后一行，它仍然不起作用：它給出了TypeError: data type not understood。

總結(jié)

以上是生活随笔為你收集整理的python中dtypes_关于python：如何通过pandas DataFrame中的列设置dtypes的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：什么是过桥贷是一种短期贷款
下一篇： python heap_python t

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

python中dtypes_关于python：如何通过pandas DataFrame中的列设置dtypes

總結(jié)