pandas dataframe 字符映射为数字
生活随笔
收集整理的這篇文章主要介紹了
pandas dataframe 字符映射为数字
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
在機器學習中對于有序的類別型變量可以不采用onehot編碼,直接使用有序數(shù)字代替即可,這個目的可以在pandas中使用map方法實現(xiàn)。
import pandas as pd
創(chuàng)建數(shù)據(jù)框
raw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller', 'Jacobson', 'Ali', 'Milner', 'Cooze'], 'age': [42, 52, 36, 24, 73], 'city': ['San Francisco', 'Baltimore', 'Miami', 'Douglas', 'Boston']}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age', 'city'])
df
在這里假定是有序的,將城市名映射為數(shù)字,當然也可是是其它字符中:
創(chuàng)建用于map的字典
city_to_state = { 'San Francisco' : 0, 'Baltimore' : 1, 'Miami' : 2, 'Douglas' : 3, 'Boston' : 4}
城市名map到洲名,保存到state變量中:
df['state'] = df['city'].map(city_to_state)
df
總結(jié)
以上是生活随笔為你收集整理的pandas dataframe 字符映射为数字的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习网络模型可视化netron
- 下一篇: iloc loc 区别