當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习-分类算法-模型选择与调优09

發布時間：2024/9/15 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习-分类算法-模型选择与调优09 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

模型選擇與調優
交叉驗證：為了讓被評估的模型更加準確可信

網格搜索

from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import train_test_split,GridSearchCV from sklearn.preprocessing import StandardScaler import pandas as pddef knncls():# k-近鄰預測用戶簽到位置# 1，讀取數據data = pd.read_csv("train.csv")# print(data.head(10))#,2，處理數據# 縮小數據,查詢數據篩選data = data.query("x > 1.0 & x <1.25 & y >2.5 & y < 2.75")# 處理時間數據time_value = pd.to_datetime(data["time"],unit="s")# print(time_value)# 把日期格式轉換成字典格式time_value = pd.DatetimeIndex(time_value)# 3，構造一些特征data["day"] = time_value.daydata["hour"] = time_value.hourdata["weekday"] = time_value.weekday# 把時間戳特征刪除data = data.drop(["time"],axis=1) # sklearn中1表示列和pandas不一樣# print(data)#把簽到數量少于n個目標位置刪除place_count = data.groupby("place_id").count()tf = place_count[place_count.row_id > 3].reset_index()data = data[data["place_id"].isin(tf.place_id)]data = data.drop(["row_id"],axis=1)print(data)# 取出數據當中的特征值和目標值y = data["place_id"]x = data.drop(["place_id"],axis=1)# 進行數據的分割訓練集和測試集x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.25)# 特征工程（標準化）std = StandardScaler()# 對測試集和訓練集的特征值進行標準化x_train = std.fit_transform(x_train)x_test = std.transform(x_test)# 進行算法流程 # 超參數knn = KNeighborsClassifier()# # fit,predict,score# knn.fit(x_train,y_train)# # 得出預測結果# y_predict = knn.predict(x_test)## print("預測的目標簽到位置為:",y_predict)## # 得出準確率# print("預測的準確率:",knn.score(x_test,y_test))# 進行網格搜索# 構造一些參數的值進行搜索param = {"n_neighbors":[3,5,10]}gc = GridSearchCV(knn,param_grid=param,cv=10)gc.fit(x_train,y_train)# 預測準確率gc.score(x_test,y_test)print("在測試集上的準確率:",gc.score(x_test,y_test))print("在交叉驗證中最好的結果:",gc.best_score_)print("最好的模型是:",gc.best_estimator_)print("每個超參數每次交叉驗證的結果:",gc.cv_results_)return Noneif __name__=="__main__":knncls()

與50位技術專家面對面20年技術見證，附贈技術全景圖

總結

以上是生活随笔為你收集整理的机器学习-分类算法-模型选择与调优09的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：机器学习-分类算法-朴素贝叶斯算法07
下一篇：机器学习-分类算法-决策树，随机森林10

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

机器学习-分类算法-模型选择与调优09

總結