Kaggle-预测降雨量Bi-LSTM模型
Kaggle-How Much Did it Rain? II
Predict hourly rainfall using data from polarimetric radars
(比賽鏈接:https://www.kaggle.com/c/how-much-did-it-rain-ii)
關(guān)于雙向LISTM層模型請(qǐng)參照如下鏈接:
http://simaaron.github.io/Estimating-rainfall-from-weather-radar-readings-using-recurrent-neural-networks/
Description
自從收到來(lái)自Kaggle社區(qū)的科學(xué)界和教育界朋友的反饋后,美國(guó)氣象學(xué)會(huì)人工智能委員會(huì)迫不及待開展How Much Did it Rain?第二版競(jìng)賽。
How Much Did it Rain?II聚焦于解決同樣的降雨測(cè)量預(yù)測(cè)的核心問(wèn)題,但這次使用一個(gè)新的經(jīng)過(guò)改進(jìn)的數(shù)據(jù)集和評(píng)估指標(biāo)來(lái)達(dá)到目的。這次競(jìng)賽將進(jìn)一步為大學(xué)構(gòu)建一個(gè)有用的教育工具,并對(duì)氣象研究產(chǎn)生有意義的推進(jìn)作用。
最近,為了提高他們的降雨量預(yù)報(bào)器,美國(guó)國(guó)家氣象局將他們的雷達(dá)網(wǎng)絡(luò)升級(jí)為偏振雷達(dá)。這些偏振雷達(dá)可以相比于傳統(tǒng)多普勒雷達(dá)能夠提供更高質(zhì)量的數(shù)據(jù),因?yàn)槠窭走_(dá)能以水平和垂直方向發(fā)射無(wú)線電波脈沖。
雙脈沖更容易推斷降雨量的大小和類型,因?yàn)橛甑坞S著尺寸的增加變得扁平,而冰晶趨向于垂直拉長(zhǎng)。
在這個(gè)競(jìng)賽中,你被提供偏振雷達(dá)值的快照并要求預(yù)測(cè)每小時(shí)降雨量總計(jì)。注意:許多訓(xùn)練集中的許多計(jì)量值都不可信(例如儀表會(huì)堵塞),更多信息在data page。
Evaluation
這個(gè)比賽的評(píng)估指標(biāo)是Mean Absolute(MAE)。關(guān)于選擇MAE而非RMSE的選擇,請(qǐng)參閱本文(http://climate.geog.udel.edu/~climate/publication_html/Pdf/WM_CR_05.pdf)。
Submission File
對(duì)于數(shù)據(jù)集中的每一個(gè)儀表小時(shí),提交文件包含兩列:Id和Excepted 。Id對(duì)應(yīng)于test.csv中該名稱的列。Excepted是預(yù)測(cè)儀表值。文件應(yīng)該包含以后header和如下格式:
Id,Expected
1,0.73
2,1.23
3,0.49
etc.
Data
訓(xùn)練集數(shù)據(jù)包含2014年4月到8月期間美國(guó)中西部玉米種植州的20天內(nèi)收集的NEXRD和MADIS數(shù)據(jù)。時(shí)間和位置信息已經(jīng)被審查,數(shù)據(jù)已經(jīng)被洗牌,因此他們不會(huì)按照時(shí)間和地點(diǎn)排序。測(cè)試數(shù)據(jù)由該月剩余天數(shù)的相同雷達(dá)和儀表數(shù)據(jù)組成。請(qǐng)參見本文以更好理解偏振雷達(dá)測(cè)量。
File description
train.zip - 訓(xùn)練集。這個(gè)文件包括玉米成長(zhǎng)季節(jié)每月超過(guò)20天在美國(guó)中西部?jī)x表上進(jìn)行的雷達(dá)觀測(cè)。同時(shí)還提供了每個(gè)小時(shí)結(jié)束時(shí)的儀表觀測(cè)值。
test.zip - 測(cè)試集。這個(gè)文件包括與訓(xùn)練集相同時(shí)間的美國(guó)中西部每月剩余10天或11天的雷達(dá)觀測(cè)值。你需要預(yù)測(cè)每個(gè)小時(shí)結(jié)束時(shí)的儀表觀測(cè)值。
sample_solution.zip - 一個(gè)正確格式的提交文件。
sample_dask.py - 將生成示例提交文件的python示例程序。這個(gè)程序使用Marshall-Palmer關(guān)系于雷達(dá)觀測(cè)值以預(yù)測(cè)儀表觀測(cè)值。
Data column
為了理解數(shù)據(jù),你必須意識(shí)到一小時(shí)內(nèi)有多次雷達(dá)觀測(cè),只有一個(gè)儀表觀測(cè)值(’Excepted‘)。這就是為什么有多行有著相同’Id'。
數(shù)據(jù)集中columns如下所示:
Id:儀表上一小時(shí)后的一組觀測(cè)值的唯一編號(hào)
minutes_past:對(duì)于每一組雷達(dá)觀測(cè)值,進(jìn)行雷達(dá)觀測(cè)的之間剛過(guò)一小時(shí)的分鐘數(shù)。雷達(dá)觀測(cè)是那個(gè)時(shí)間點(diǎn)的快照。
radar_km:雷達(dá)上儀表距離地面的距離。
Ref:以公里為單位的雷達(dá)反射率
Ref_5x5_10th:儀表周圍5x5領(lǐng)域中10%反射率
Ref_5x5_50th:儀表周圍5x5領(lǐng)域中50%反射率
Ref_5x5_90th:儀表周圍5x5領(lǐng)域中90%反射率
RefCompsite:儀表上方垂直列中的最大反射率,以dBZ為單位
RefCompsite_5x5_10th
RefCompsite_5x5_50th
RefCompsite_5x5_90th
RhoHV:相關(guān)系數(shù)(無(wú)單位)
RhoHV_5x5_10th
RhoHV_5x5_50th
RhoHV_5x5_90th
Zdr:以dB為單位的差分反射率
Zdr_5x5_10th
Zdr_5x5_50th
Zdr_5x5_90th
Kdp:特定微分相位(度/公里)
Kdp_5x5_10th
Kdp_5x5_50th
Kdp_5x5_90th
Expected:小時(shí)結(jié)束時(shí)以毫米為實(shí)際儀表觀測(cè)值
Code:
https://github.com/LiuChar1esM/how-much-did-it-rain
總結(jié)
以上是生活随笔為你收集整理的Kaggle-预测降雨量Bi-LSTM模型的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: vue+go.js项目流程图 (外呼项目
- 下一篇: Apple推送通知服务教程