日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据挖掘竞赛-美国King County房价预测训练赛

發布時間:2024/4/11 编程问答 70 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据挖掘竞赛-美国King County房价预测训练赛 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

美國King County房價預測訓練賽

  • 簡介
    • DC上的一個回歸題(正經的回歸題)。
    • 比較簡單。
    • 時間原因(暫時沒什么時間看國內舊賽),看了一下網上的解答,改善了一下神經網絡就提交了。
  • 過程
    • 數據獲取
      • 報名成功后到官網提供的入口下載,或者我的Github也上傳了。
    • 數據探索
      • 簡單了解數據格式。
        • 訓練集有10000條記錄,14個特征,描述如下。(注意,官方數據集沒有表頭)
          • 其中,第二列“銷售價格”就是目標。
        • 測試集有3000條記錄,利用訓練好的模型預測這3000條記錄的房價。
    • 數據預處理
      • 設置表頭
        • 原數據沒有表頭,自己補充即可。
      • 顯然,實際數據銷售日期是有意義的,但是,對模型建立不方便,提取年份,刪除月日。
      • 利用銷售日期組合修理及建造日期構建新特征。
      • 處理后數據集落地。
    • 數據挖掘建模
      • 幾種回歸嘗試
        • 隨機森林(RFR)
        • 線性回歸
      • 神經網絡
        • 由于幾種回歸表現一般,沒有再嘗試,看網上分享很多神經網絡做法,參考設計了一個前饋網絡。
        • 使用Keras(TensorFlow作為后端,GPU訓練)
        • 訓練5000次左右提交為100名成績。
        • 注意:**5000次之前就已經收斂,為了效率可以加入EarlyStopping。(時間原因,沒有處理)
      • 網絡代碼
        • model = Sequential()input_size = len(df_train.columns)model.add(Dense(units=90, activation='relu', input_shape=(input_size, )))model.add(Dropout(0.5))model.add(Dense(units=45, activation='relu'))model.add(Dropout(0.5))model.add(Dense(units=30,activation='relu'))model.add(Dropout(0.25))model.add(Dense(units=15, activation='relu'))model.add(Dropout(0.1))# 此處不能使用激活函數,因為放假是放射的model.add(Dense(units=1,activation=None))# 官網使用mse計算損失model.compile(loss='mean_squared_error',optimizer='adam',metrics=[metrics.mae])model.summary()
  • 補充說明
    • 排名靠前的應該不少使用機器學習算法回歸調參,有時間的不妨一試。
    • 具體數據集和代碼見我的Github,歡迎Star或者Fork(環境為Jupyter)。
    • 附上提交時的排名。

總結

以上是生活随笔為你收集整理的数据挖掘竞赛-美国King County房价预测训练赛的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。