基于神经网络的房屋价格预测
??? 本課題的主要任務(wù)就是通過神經(jīng)網(wǎng)絡(luò)對房屋的價格進(jìn)行預(yù)測,這里,我們采用的數(shù)據(jù)是奧克蘭其中一個郊區(qū)的房屋價格的數(shù)據(jù)。在MATLAB中,使用load函數(shù),將數(shù)據(jù)進(jìn)行導(dǎo)入,可以看到房屋價格數(shù)據(jù)如圖2.1所示。
圖2.1 奧克蘭一郊區(qū)房屋價格
???? 這里我們采用的影響房屋價格的因素主要有13項,其分別為:每個城鎮(zhèn)的平均犯罪率;住宅用地超過500平米的比例;每個城鎮(zhèn)非商業(yè)用地的比例;距離海洋的距離在1公里內(nèi),則為1,否則為0;氧化物濃度;每個房子的平均房間數(shù);1940前自建房屋的比例;到購物中心的權(quán)值距離;高速公里的標(biāo)號;每1萬美元產(chǎn)出的值;教師比例;20歲以下的人口比例;退休人口比例。這些數(shù)據(jù)都是影響其房屋價格的因素。
·每個城鎮(zhèn)的平均犯罪率;
圖2.2每個城鎮(zhèn)的平均犯罪率
?從圖2.2可以看到當(dāng)一個城鎮(zhèn)的犯罪率較高的時候,其房屋價格會相應(yīng)的較低,因此犯罪率是影響房屋價格的一個因素。
·住宅用地超過500平米的比例;
圖2.3住宅用地超過500平米的比例
?從圖2.3可以看到,住宅用地越多,那么房屋的價格也就相應(yīng)的低,當(dāng)住宅用地較少的時候,房屋價格會相應(yīng)的高。
·每個城鎮(zhèn)非商業(yè)用地的比例;
圖2.4每個城鎮(zhèn)非商業(yè)用地的比例
??? 從圖2.4可以看到,商業(yè)用地較多的時候,城鎮(zhèn)的房屋價格會較低,反之,城鎮(zhèn)的房屋價格較高。
·距離海洋的距離在1公里內(nèi),則為1,否則為0;
圖2.5距離海洋的距離在1公里內(nèi),則為1,否則為0
? 對比房屋價格,可以看到,房屋距離海邊較近的時候,房屋價格會較高,這是由于較好的生活環(huán)境導(dǎo)致的,離海邊較遠(yuǎn)的地方,價格相應(yīng)的較低。
·氧化物濃度;
圖2.6 氧化物濃度
很顯然,當(dāng)空氣質(zhì)量較差的時候,房屋價格也較低。
·每個房子的平均房間數(shù);
圖2.7每個房子的平均房間數(shù)
每棟公寓的房價數(shù)較多的時候,這說明人氣較高,相應(yīng)的房屋價格也會較高,反之,房屋價格就會較低
·1940前自建房屋的比例;
圖2.8 1940前自建房屋的比例
? 從圖2.8可知,年代久遠(yuǎn)的建筑,其價格必然就會較低,而較新的建筑,其價格就較貴。
·到購物中心的權(quán)值距離;
圖2.9到購物中心的權(quán)值距離
??? 從圖2.9可以看到,當(dāng)購物中心較多的時候,那么房屋價格就高反之就低。
·高速公里的標(biāo)號;
圖2.10高速公里的標(biāo)號
??? 從圖2.10可知,房屋周圍高速公路較多的時候, 房屋價格必然偏低,但是周圍高速公路較少的時候,房屋價格會略有變高。
·每1萬美元的管理費;
圖2.11每1萬美元的管理費
?從圖2.11可知,當(dāng)某個區(qū)域市政管理成本較高的時候,那么該區(qū)域的房屋價格就會變低。
·教師比例;
圖2.12學(xué)生教師比例
?從圖2.12可知,當(dāng)學(xué)生與教師數(shù)量比值較大的時候,也就意味著該地區(qū)師資力量缺乏,教育水平較低,那么其房價就會較低。
·20歲以下的人口比例;
圖2.13 20歲以下的人口數(shù)量
當(dāng)20歲的人口數(shù)量較小的時候,房屋價格就會較低。由此可見,年輕人的數(shù)量也決定了房屋的價格。
·退休人口比例;
圖2.14退休人口比例
這個說明老年人多的地方,房屋價格就較低。
從以上的分析可知,房屋的價格的決定因素如下表所示:
表2.1 房屋價格決定因素
| ? | 影響因素 | 影響分析 |
| 1 | 平均犯罪率 | 該因素值較高,則房價較低 |
| 2 | 住宅用地 | 該因素值較高,則房價較低 |
| 3 | 非商業(yè)用地 | 該因素值較高,則房價較低 |
| 4 | 距離海洋的距離 | 該因素值較高,則房價較高 |
| 5 | 氧化物濃度 | 該因素值較高,則房價較低 |
| 6 | 每個房子的平均房間數(shù) | 該因素值較高,則房價較高 |
| 7 | 1940前自建房屋的比例 | 該因素值較高,則房價較低 |
| 8 | 購物中心 | 該因素值較高,則房價較高 |
| 9 | 高速公里 | 該因素值較高,則房價較低 |
| 10 | 每1萬美元管理費 | 該因素值較高,則房價較低 |
| 11 | 教師比例 | 該因素值較高,則房價較低 |
| 12 | 20歲以下的人口比例 | 該因素值較高,則房價較高 |
| 13 | 退休人口比例 | 該因素值較高,則房價較低 |
神經(jīng)網(wǎng)絡(luò)的工作過程主要由兩個階段組成,一個階段是學(xué)習(xí)期,即訓(xùn)練階段,此時連接權(quán)值可調(diào)整,另一個階段就是工作期,此時,其各個權(quán)值固定。
在學(xué)習(xí)階段,訓(xùn)練集中已知類別的輸入向量將隨機(jī)輸入給神經(jīng)網(wǎng)絡(luò),每次的輸入使得PE之間的連接權(quán)重根據(jù)一種固定的學(xué)習(xí)規(guī)則得到細(xì)致的調(diào)整,使得網(wǎng)絡(luò)的輸出向正確的方向轉(zhuǎn)變。隨著訓(xùn)練過程的推進(jìn),網(wǎng)絡(luò)的性能得到的改善,直到網(wǎng)絡(luò)中每一個PE都收斂到合適的權(quán)重為止。
在神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)階段,當(dāng)網(wǎng)絡(luò)做出錯誤的判決的時候,那么通過神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),應(yīng)使得網(wǎng)絡(luò)減少下次犯同樣錯誤的可能性,通常情況下,系統(tǒng)將會給網(wǎng)絡(luò)一個隨機(jī)的權(quán)值,然后將信號輸入到神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)將輸入的模式進(jìn)行加權(quán)求和、并與門限進(jìn)行比較,然后進(jìn)行非線性運算從而得到網(wǎng)絡(luò)的輸出。這個時候系統(tǒng)輸出正確和錯誤的概率是相同的,那么這個時候,系統(tǒng)將正確的輸出結(jié)果的連接權(quán)值增大,從而使下次輸入同一個信號的時候,得到正確的輸出結(jié)果。
通常情況下,按這種方法學(xué)習(xí)幾次后,神經(jīng)網(wǎng)絡(luò)將判斷的正確率大大提高,一般來說,網(wǎng)絡(luò)中所含的神經(jīng)元個數(shù)就越多,那么它能夠記憶和識別的模式也越多。
當(dāng)訓(xùn)練結(jié)束進(jìn)入工作期時,權(quán)重系數(shù)保持不變,此外神經(jīng)網(wǎng)絡(luò)的輸入是未知類別的向量,輸入的信息經(jīng)過神經(jīng)元層層傳播,最后在輸出層上產(chǎn)生輸出向量,根據(jù)此輸出向量可以將對象劃分到某一類中,從而實現(xiàn)對象的模式識別。
以上就是神經(jīng)網(wǎng)絡(luò)的基本工作過程。
3.3 基于神經(jīng)網(wǎng)絡(luò)的預(yù)測
在自然科學(xué)和社會科學(xué)中,限于人們的認(rèn)識能力,許多問題的內(nèi)在規(guī)律還不能被揭示出來。對于這類問題的分析和預(yù)測,人們較多的采取回歸分析與時間序列分析的方法,在時間序列分析方面,一般用ARMA模型擬合時間序列進(jìn)行建模和分析。然而,ARMA模型是一種平穩(wěn)的,線性的模型。對于經(jīng)濟(jì)模型(比如房屋價格預(yù)測模型)中常出現(xiàn)的非線性,非平穩(wěn)的時間序列的分析不再合適。雖然目前也有一些處理某類非線性或非平穩(wěn)時間序列的方法,但還不存在統(tǒng)一的模型及方法。
人工神經(jīng)網(wǎng)絡(luò)作為一種模擬生物神經(jīng)系統(tǒng)結(jié)構(gòu)的人工智能技術(shù),能夠從訓(xùn)練數(shù)據(jù)樣本中自動地學(xué)習(xí)以前的經(jīng)驗而無需復(fù)雜的查詢和表述過程,并能自動地逼近那些最佳刻畫了訓(xùn)練樣本數(shù)據(jù)規(guī)律的函數(shù),揭示出數(shù)據(jù)樣本中所蘊含的非線性關(guān)系,而不論這些函數(shù)具有怎樣的形式。由于神經(jīng)網(wǎng)絡(luò)的這種非線性映射能力以及對任意函數(shù)的一致逼近性能,此項技術(shù)在經(jīng)濟(jì)建模研究中日益受到重視。近幾年來,人工神經(jīng)網(wǎng)絡(luò)作為一種建模
工具被廣泛的應(yīng)用于非線性模型問題中,取得了一定的成果。
??? 在前面,我們分析影響房屋價格的多個因素,對住宅價格分析與預(yù)測中出現(xiàn)的非線性或非平穩(wěn)的時間序列分析中,以往傳統(tǒng)的預(yù)測方法已不能勝任,而人工神經(jīng)元網(wǎng)絡(luò),正彌補(bǔ)了這一缺點。從本質(zhì)上講,人工神經(jīng)網(wǎng)絡(luò)模型就是一種非線性的動態(tài)系統(tǒng),并可通過對數(shù)據(jù)樣本的訓(xùn)練來建立模型。因此人工神經(jīng)網(wǎng)絡(luò)也為非線性,非平穩(wěn)時間序列的建模和預(yù)測提供了一種新的解決思路,使其對住宅價格的預(yù)測成為可能。
下面我們將結(jié)合本課題的要求進(jìn)行研究基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)預(yù)測。
4.基于神經(jīng)網(wǎng)絡(luò)的房屋價格預(yù)測與分析
4.1 價格影響因素的選取
影響商品住宅價格變動的因素是復(fù)雜、多變的,將所有因素納入分析研究是困難的。但是可以認(rèn)為在一段經(jīng)濟(jì)、政治比較平穩(wěn)時期,商品住宅價格的變動是由一些基本因素決定的。根據(jù)本文第二章介紹的,考慮到奧克蘭地區(qū)的實際情況,將選取13個主要的因素作為影響房屋價格的主要因素:
·每個城鎮(zhèn)的平均犯罪率;
·住宅用地超過500平米的比例;
·每個城鎮(zhèn)非商業(yè)用地的比例;
·距離海洋的距離在1公里內(nèi),則為1,否則為0;
·氧化物濃度;
·每個房子的平均房間數(shù);
·1940前自建房屋的比例;
·到購物中心的權(quán)值距離;
·高速公里的標(biāo)號;
·每1萬美元的管理費;
·教師比例;
·20歲以下的人口比例;
·退休人口比例。
將以上因素分別表示為:。
這里將原始的樣本數(shù)據(jù)和通過神經(jīng)網(wǎng)絡(luò)預(yù)測得到的數(shù)據(jù)進(jìn)行對比,其結(jié)果如下:
圖4.7 原始樣本數(shù)據(jù)和預(yù)測后的數(shù)據(jù)對比圖
??? 從圖4.7可以看到,通過神經(jīng)網(wǎng)絡(luò)預(yù)測后的數(shù)據(jù)和原始的數(shù)據(jù)基本相似,通過相減得到其誤差信息如下所示:
圖4.8 誤差曲線
從圖4.8可知,通過神經(jīng)網(wǎng)絡(luò)之后,其預(yù)測輸出值和樣本值之間的誤差都在0附近,但是對于部分值,如房屋價格中幾個跳變的區(qū)域,誤差較大,這就是對突發(fā)情況的預(yù)測能力較弱導(dǎo)致的。
4.4實際價格的預(yù)測與分析
??? 以上,我們已經(jīng)實現(xiàn)了預(yù)測模型,下面將使用別的數(shù)據(jù)進(jìn)行測試,來驗證系統(tǒng)的正確性。
圖4.9 區(qū)域1的房間預(yù)測仿真
圖4.10 區(qū)域2的房間預(yù)測仿真
圖4.11 區(qū)域3的房間預(yù)測仿真
??? 通過以上的仿真,說明系統(tǒng)是正確,通過神經(jīng)網(wǎng)絡(luò)得到的預(yù)測數(shù)據(jù)和實際的數(shù)據(jù)十分接近。通過這個模塊,可以預(yù)測其他一些因素相似的區(qū)域的房屋價格
總結(jié)
以上是生活随笔為你收集整理的基于神经网络的房屋价格预测的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WIN7安装npm的问题
- 下一篇: 5G标准——3GPP TS 38.401