日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

2021科大讯飞_环境空气质量评价挑战赛_LineRegression_baseline0.04385

發布時間:2023/12/29 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 2021科大讯飞_环境空气质量评价挑战赛_LineRegression_baseline0.04385 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • 前言
  • 一、環境空氣質量評價挑戰賽
  • 二、源碼
    • 1.LineRegression
  • 總結


前言

沒事的話就也來參加一下這些比賽吧,只要進入前20%就有證書發啦,以后說不定有用噢


一、環境空氣質量評價挑戰賽


數據預覽:

參賽鏈接
這是一個時間序列問題,數據是沒有缺失的,是一個典型的回歸問題,后續可能考慮提升樹啊,XGBoost,lightGBM,DNN,LSTM等等

好吧,更一下這里有個XGBoost的鏈接,不過只有0.08的分數。
https://blog.csdn.net/qq_44694861/article/details/118240970

二、源碼

1.LineRegression

代碼如下(示例):

import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import KFold from sklearn.metrics import mean_squared_errordef rmse(y_true, y_pred):return mean_squared_error(y_true=y_true, y_pred=y_pred) ** 0.5train = pd.read_csv('C:/Usersx/Desktop/環境空氣質量評價挑戰賽/初賽_訓練集/保定2016年.csv') test = pd.read_csv('C:/Usersx/Desktop/環境空氣質量評價挑戰賽/初賽_測試集/石家莊20160701-20170701.csv')data = pd.concat([train, test]).reset_index(drop=True) data['month'] = data['日期'].apply(lambda x: str(x).split('/')[1]) data_onehot = pd.get_dummies(data['質量等級']) data = pd.concat([data, data_onehot], axis=1)feature = ['AQI', 'PM2.5', 'PM10', 'SO2', 'CO', 'NO2', 'O3_8h','month', '嚴重污染', '中度污染', '優', '良', '輕度污染', '重度污染' ] label = 'IPRC'train = data[:train.shape[0]] test = data[train.shape[0]:]oof_train = np.zeros((train.shape[0],)) oof_test = np.zeros((test.shape[0],))kf = KFold(n_splits=2, random_state=66, shuffle=True) for index, (tr_index, vl_index) in enumerate(kf.split(train)):X_train, X_valid = train.iloc[tr_index][feature].values, train.iloc[vl_index][feature].valuesy_train, y_valid = train.iloc[tr_index][label], train.iloc[vl_index][label]lf = LinearRegression()lf.fit(X_train, y_train)oof_train[vl_index] = lf.predict(X_valid)oof_test = oof_test + lf.predict(test[feature].values) / kf.n_splitsr = rmse(train[label], oof_train) print('RMSE:%f'%r)submit = test[['日期']] submit = submit.reset_index() submit.drop('index', axis=1, inplace=True)temp = pd.DataFrame(oof_test) submit = pd.concat([submit,temp],axis=1)submit.columns = ['date', 'IPRC'] submit.to_csv('C:/Usersx/Desktop/環境空氣質量評價挑戰賽/submit.csv', index=False)

總結

提示:返回分數一般是0.04左右啦。

總結

以上是生活随笔為你收集整理的2021科大讯飞_环境空气质量评价挑战赛_LineRegression_baseline0.04385的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。