日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略

發布時間:2025/3/21 python 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Python之pandas:數據類型變換之object、category、bool、int32、int64、float64以及數據類型標準化之詳細攻略

?

?

?

?

?

目錄

數據類型變換之object、category、bool、int32、int64、float64以及數據類型標準化

知識點

1、category類型與object類型

輸出結果

實現代碼


?

?

?

?

推薦文章
???????Python之pandas:在pandas中創建category類型數據的幾種方法之詳細攻略
ML之FE:將dataframe中的數據類型進行標準化

數據類型變換之object、category、bool、int32、int64、float64以及數據類型標準化

知識點

在pandas中,如果某個字段下,數據類型不一致導致整個字段類型不相同,可以進行字段類型轉換!,在pandas中,進行數據類型轉換非常簡單,只需要使用astype函數即可!

?

1、category類型與object類型

?object類型(python中)category類型(pandas中特有)
簡介

? ? ? python是面向對象的語言。在python里面,一切皆為對象。

在python中,

  • object類型,一般表示文本類型數據。
  • 有些難以被自動判別的數據類型,或者由不止一種數據類型組成;由于Python一切皆對象,因此都會被處理為最寬泛的"對象"也就是object類型數據。
  • 其實,在數據分析中,有時候會遇到某個字段的數據類型與初始設置的不相符,此時,就要去分析是否是數據不規整造成的。
  • category是 pandas 的一種數據類型,對應著被統計的變量。它實際上是動態枚舉的一種形式。如果某個字段的內容中,其可能值的范圍是固定且有限的,則category類型數據最為適用;
  • category是由固定的且有限數量的變量組成的。比如:性別、血型、等級等;
  • category類型數據的每一個元素的值,要么是預設好的類型中的某一個,要么是空值(np.nan);
  • 在比較大的數據集中,可以通過使用category類型數據來加快速度
屬性具有object類型數據的基本屬性。
  • .describe()
  • .cat.categories  
  • .cat.rename_categories  
  • .value_counts()
  • .str 屬性  
  • pd.concat
  • union_categoricals   
  • 內存使用量
轉換df["col"].astype(‘category‘)

?

?

?

?

輸出結果

?

?

實現代碼

import pandas as pd import numpy as npcontents={"name": ['Bob', 'LiSa', 'Mary', 'Alan'],"ID": [1, 2, ' ', None], # 輸出 NaN"age": [np.nan, 28, 38 , '' ], # 輸出 "age02": [14, 26, 24 , 6], "born": [pd.NaT, pd.Timestamp("1990-01-01"), pd.Timestamp("1980-01-01"), ''], # 輸出 NaT"sex": ['男', '女', '女', None,], # 輸出 None"hobbey":['打籃球', '打羽毛球', '打乒乓球', '',], # 輸出 "money":[200.0, 240.0, 290.0, 300.0], # 輸出"weight":[140.5, 120.8, 169.4, 155.6], # 輸出"test01":[1, 2.123456789, 3.123456781011126, 4.123456789109999], # 輸出"test02":[1, 2.123456789, 3.123456781011126, 4.123456789109999], # 輸出} data_frame = pd.DataFrame(contents)print('Init-------------------------------') print(data_frame.dtypes) print(data_frame)# 將dataframe格式中的數據類型轉為object數據類型 data_frame['test02'] = data_frame['test02'].astype('object') # 關鍵字bool,'object'、'category'、str data_frame['test02'] = data_frame['test02'].apply(str) data_frame.to_excel("data_demo.xls")print('after astype-------------------------------') print(data_frame.dtypes) print(data_frame) data_frame_temp=data_frame.copy()# ML之FE:將dataframe中的數據類型進行標準化 print('after Categorical-------------------------------') data_frame=cols2DfCatAndNum(data_frame) print(data_frame.dtypes)

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

?

總結

以上是生活随笔為你收集整理的Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。