日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python预测随机数据_随机森林预测

發布時間:2025/3/20 python 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python预测随机数据_随机森林预测 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Python部落(python.freelycode.com)組織翻譯,禁止轉載,歡迎轉發。

當涉及到預測數據(時間序列或其他類型的序列)時,人們會關注基本回歸、ARIMA、ARMA、GARCH,甚至Prophet,但不排除使用隨機森林來預測數據。

隨機森林通常被認為是一種分類技術,但回歸問題絕對是隨機森林可以處理的。

在本文中,我打算使用在網上找到的一個數據集,叫做溫莎市房屋銷售價格。出于寫作的目的,我將只使用價格(price)和批量(lotsize)列。注:在以后的文章中,我打算摒棄這些數據,并對隨機森林進行多元回歸。

為了開始,先讓我們導入項目開始所需的所有庫。和往常一樣,你可以在這里使用jupyter筆記本來運行這個分析。

現在來加載數據:

同樣,我們只使用數據集中的兩列—價格(price)和批量(lotsize)。讓我們把這些數據畫出來,直觀地看一看,用批量(lotsize)來預測價格(price)是否有意義。

從數據來看,使用批量來預測價格似乎是一個不錯的猜測。

現在,讓我們準備好數據集來訓練和測試數據。

在上面,我們把隨機森林回歸量設置為X和y,然后設置我們的訓練和測試數據。對于訓練數據,我們將取前400個數據點來進行隨機森林訓練,然后對最后146個數據點進行測試。

現在,讓我們運行隨機森林回歸模型。首先,我們需要從sklearn中導入Random Forest regression:

現在是時候讓我們來運行隨機森林回歸看看會得到什么。

讓我們可視化價格(price)和預測價格(predicted_price)。

對于批量(lotsize)預測價格(price)這個大膽的猜測來說,結果確實差強人意。從視覺上,它看起來相當不錯(盡管肯定有錯誤)。

讓我們看看基本級別的錯誤。首先,快速地畫出兩者之間的“區別”。

這里的錯誤相當大。我們來看一些值,比如R的平方(R-Squared )和均方誤差(Mean Squared Error)。首先,讓我們從sklearn導入適當的函數。

現在,讓我們來看看R的平方(R-Squared):

R-Squared是0.6976,也就是0.7。對于隨機猜測來說,結果不是很好,但也不是很糟糕。0.7(或70%)是為了告訴你,大約70%的“信號”變化是由用作預測器的變量解釋的。從全局來看,這還不錯。

我可以繼續進行其他錯誤的計算,但這篇文章的重點不是展示“準確性”,而是展示如何使用隨機森林進行預測的“過程”。

英文原文:https://pythondata.com/forecasting-with-random-forests/

譯者:任宇は神様

總結

以上是生活随笔為你收集整理的python预测随机数据_随机森林预测的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。