降雨预测方法
降雨預(yù)測(cè)方法
-
DBNPF (Deep Belief Network for Precipitation Forecast)
來源:張雷師兄論文:A deep-learning based precipitation forecasting
模型:
比較:RBF、SVM、ARIMA、ELM(extreme learning machine)、SAE(Sparse AutoEncoder)
數(shù)據(jù)集:
遵義市1956-2010
train data:1956-2000
test data:2000-2010
-
動(dòng)態(tài)區(qū)域組合MLP
來源:賈旸旸師兄論文:Short-term Rainfall Forecasting Using Multi-layer Perceptron
模型:
PCA:13個(gè)物理因子進(jìn)行降維,輸入到MLP中
貪婪算法決定MLP的結(jié)構(gòu),
該模型的初始數(shù)據(jù)包括五個(gè)高空因素和八個(gè)地表因素。
在氣象學(xué)中,通常用位勢(shì)高度代替實(shí)際高度,用等壓面代替水平高度,因此,氣象數(shù)據(jù)總是采用等壓面格式。例如,500hpa通常相當(dāng)于5.5km的高度。降雨系統(tǒng)通常由500hpa的天氣系統(tǒng)控制。根據(jù)區(qū)域經(jīng)驗(yàn),該模型選擇的五個(gè)海拔因子分別是500hpa高度下的實(shí)際高度(x1)、溫度(x2)、溫度露點(diǎn)差(x3)、風(fēng)向(x4)和風(fēng)速(x5)。風(fēng)向和風(fēng)速影響著降雨系統(tǒng)的運(yùn)動(dòng)方向和速度。溫度露點(diǎn)差與濕度直接相關(guān)。溫度露點(diǎn)差、溫度和實(shí)際高度值影響著降雨系統(tǒng)的內(nèi)能。地表因子代表該地區(qū)的局部大氣條件。不同地區(qū)地表因子的差異導(dǎo)致降雨不同。該模型中所用的八個(gè)面因子包括總云量(X6)、地表風(fēng)速(X7)、地面風(fēng)向(X8)、地面氣壓(X9)、地表3小時(shí)壓力變化(X10)、地表溫度露點(diǎn)差(X11)、地表溫度(X12)和過去三小時(shí)的降雨。周圍區(qū)域(x13)。對(duì)于同一個(gè)預(yù)測(cè)區(qū)域,每個(gè)周邊區(qū)域都與該預(yù)測(cè)區(qū)域建立一個(gè)MLP。表1顯示了所有13個(gè)因素。這些因素是我們模型的初始輸入。
最小-最大規(guī)范化。最常用的數(shù)據(jù)規(guī)范化方法之一是最小-最大規(guī)范化。它可以在0和1之間標(biāo)準(zhǔn)化數(shù)據(jù)。由于不同因素的大小不同,有必要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。對(duì)于要處理的序列,序列的最大值對(duì)應(yīng)于1,最小值對(duì)應(yīng)于0,其余值在0和1之間按比例轉(zhuǎn)換。
主成分分析。歸一化后,PCA用于減小輸入的維數(shù)。確定新因子個(gè)數(shù)的標(biāo)準(zhǔn)是99%,即所選因子的特征值之和占總特征值的99%以上。經(jīng)計(jì)算,新因子的總信息可以代表原始數(shù)據(jù)的99%以上。此標(biāo)準(zhǔn)定義了保留的信息量,但沒有指定所需的因子數(shù)量。對(duì)于不同的預(yù)測(cè)區(qū)域,因子的數(shù)量可能不同,但不會(huì)超過初始輸入,即13。在大多數(shù)情況下,需要的因素?cái)?shù)量在3到8之間。PCA處理后,所需的計(jì)算資源大大減少。
MLP的輸入是Z1-Z4四個(gè)參數(shù),輸出是降雨量
step1:
step2:中心預(yù)測(cè)點(diǎn)與其他地區(qū)各有一個(gè)MLP,兩個(gè)地區(qū)的距離決定了周圍MLP的數(shù)量。周圍多個(gè)MLP模型一起決策,如果預(yù)測(cè)降雨的MLP超過1,取均值。
比較:
數(shù)據(jù)集:
2015-2017年海拔(500hPa)測(cè)繪數(shù)據(jù)和數(shù)值預(yù)報(bào)結(jié)果。
train data:2015-2016
test data:2016-2017
-
基于雷達(dá)回波圖像的短期降雨預(yù)測(cè)
來源:基于雷達(dá)回波圖像的短期降雨預(yù)測(cè)
模型:
卷積自編碼器的編碼模塊首先提取每幀輸入圖像特征,送入LSTM預(yù)報(bào)網(wǎng)絡(luò);LSTM預(yù)報(bào)網(wǎng)絡(luò)的編碼模塊,對(duì)輸入信息提取時(shí)序特征,在此基礎(chǔ)上,由LSTM預(yù)測(cè)模塊產(chǎn)生關(guān)于未來時(shí)段回波圖像時(shí)序特征預(yù)測(cè)。
比較:
在MINIST數(shù)據(jù)集上對(duì)自編碼器的層數(shù)和LSTM層數(shù)預(yù)測(cè)效果進(jìn)行對(duì)比
數(shù)據(jù)集:
石家莊地區(qū) 2010 -2017 年之間降雨天氣的雷達(dá)回波圖像 。
回波圖像每6分鐘采集一幀, 1個(gè)小時(shí)內(nèi)得到 10 幀雷達(dá)回波圖像,構(gòu)成一個(gè)時(shí)間序列。
-
常用方法
常用的基于觀測(cè)和預(yù)報(bào)場(chǎng)的統(tǒng)計(jì)評(píng)分:
偏差值,均方根誤差,POD指數(shù),CSI指數(shù),FAR指數(shù),TS評(píng)分,ETS評(píng)分
xgboost特性:
-
- 允許用戶在交叉驗(yàn)證時(shí)自定義誤差衡量方法,例如回歸中使用RMSE還是RMSLE,分類中使用AUC,分類錯(cuò)誤率或是F1-score。
- 允許用戶先迭代1000次,查看此時(shí)模型的預(yù)測(cè)效果,然后繼續(xù)迭代1000次,最后模型等價(jià)于一次性迭代2000次。
- xgboost的模型和傳統(tǒng)的GBDT相比加入了對(duì)于模型復(fù)雜度的控制以及后期的剪枝處理,使得學(xué)習(xí)出來的模型更加不容易過擬合。
總結(jié)
- 上一篇: 超市计算机主管总结报告,超市电脑员工作总
- 下一篇: CDT规约解读