日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人文社科 > 生活经验 >内容正文

生活经验

机器学习(实战)泰坦尼克号(游客存活率预估)

發布時間:2023/11/27 生活经验 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习(实战)泰坦尼克号(游客存活率预估) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

一、讀取數據

二、設置特征值和目標值

三、數據處理

1、缺失值處理

2、特征值轉換為字典

3、劃分數據集

四、特征工程(字典特征值提取)

五、獲取決策樹預估器,訓練

六、模型評估

方法一:比對

方法二:計算得分

總代碼


一、讀取數據

資源下載鏈接1(推薦):https://download.csdn.net/download/great_yzl/22363793

資源下載鏈接2(不推薦):

https://pan.baidu.com/s/17DeVm48VRG0tlEzQM0KfSA?
提取碼:gx4a

# 1、讀取數據
data = pd.read_csv('titanic.csv')

二、設置特征值和目標值

# 2、設置特征值和目標值
train = data[['pclass', 'age', 'room', 'sex']]
test = list(data['survived'])

三、數據處理

1、缺失值處理

?可以看出來,上面這些明顯是缺失了一些數據,這樣在后面運行的時候會報錯。

# 3-1、缺失值處理
train['age'].fillna(train['age'].mean(), inplace=True)
train['room'].fillna(train['room'][0], inplace=True)

2、特征值轉換為字典

# 3-2、特征值轉換為字典
train = train.to_dict(orient='records')
print(train)

3、劃分數據集

# 4、劃分數據集
train_data, test_data, train_target, test_target = train_test_split(train, test)

四、特征工程(字典特征值提取)

# 4、特征工程(字典特征值提取)
transfer = DictVectorizer()
train_data = transfer.fit_transform(train_data)
test_data = transfer.transform(test_data)
# print(train_data)

五、獲取決策樹預估器,訓練

# 6、決策樹預估器,訓練
estimator = DecisionTreeClassifier()
estimator.fit(train_data, train_target)

六、模型評估

方法一:比對

# 方法一:比對
predict = estimator.predict(test_data)
print(predict == test_target)

方法二:計算得分

# 方法二:計算分數(正確率)
score = estimator.score(test_data, test_target)
print('準確率為:', score)

總代碼

# 泰坦尼克號(游客存活率預估)
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer
from sklearn.tree import DecisionTreeClassifier# 1、讀取數據
data = pd.read_csv('titanic.csv')
# print(data)# 2、設置特征值和目標值
train = data[['pclass', 'age', 'room', 'sex']]
test = list(data['survived'])# 3、數據處理
# 3-1、缺失值處理
train['age'].fillna(train['age'].mean(), inplace=True)
train['room'].fillna(train['room'][0], inplace=True)# 3-2、特征值轉換為字典
train = train.to_dict(orient='records')# 3-3、劃分數據集
train_data, test_data, train_target, test_target = train_test_split(train, test)
# print(train_data)# 4、特征工程(字典特征值提取)
transfer = DictVectorizer()
train_data = transfer.fit_transform(train_data)
test_data = transfer.transform(test_data)
# print(train_data)# 5、決策樹預估器,訓練
estimator = DecisionTreeClassifier()
estimator.fit(train_data, train_target)# 6、模型評估
# 方法一:比對
predict = estimator.predict(test_data)
print(predict == test_target)# 方法二:計算分數(正確率)
score = estimator.score(test_data, test_target)
print('準確率為:', score)

總結

以上是生活随笔為你收集整理的机器学习(实战)泰坦尼克号(游客存活率预估)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。