《Python数据分析与应用》第7章 机器学习模型的应用 实训部分
《Python數(shù)據(jù)分析與應(yīng)用》第7章 機器學習模型的應(yīng)用 實訓部分(源于大學課程python數(shù)據(jù)分析)
【目的及要求】
以股票價格預(yù)測為主題,利用所學的機器學習方法建立模型對股價進行預(yù)測,股票價格既可以是個股價格,也可以是股票指數(shù)。
1、到知網(wǎng)查閱文獻資料,確定影響因素,即自變量;
2、定義因變量和自變量;
3、收集變量數(shù)據(jù);
4、建立多種回歸預(yù)測模型;
5、對模型結(jié)果進行比評價和比較
1.有下圖文獻所得八個自變量(人民幣兌美元匯率、國民生產(chǎn)總值、貨幣(M1)供應(yīng)量(億元)、一年期存款利率(%)、基本每股收益(元)、凈資產(chǎn)收益率(%)、速動比率(%) 、企業(yè)資產(chǎn)凈值(萬元)、總市值),因變量為收盤價)
2.利用灰色預(yù)測和SVR模型,支持向量機模型、線性回歸模型、梯度回歸模型對股票相關(guān)因子進行建模
(1)灰色預(yù)測和SVR模型
由上圖所得需要利用Lasso回歸方法識別影響股票收盤價格的關(guān)鍵影響因素是國民生產(chǎn)總值、貨幣(M1)供應(yīng)量(億元)、一年期存款利率(%)、基本每股收益(元)、凈資產(chǎn)收益率(%)、企業(yè)資產(chǎn)凈值(萬元)、總市值),因變量為收盤價,剔除兩個自變量(人民幣兌美元匯率、速動比率)
由于上圖可知,方差比率來檢驗隨機游走,方差比越大,說明可預(yù)測性越好;多數(shù)自變量的小殘差概率接近1,說明除了凈資產(chǎn)收益率,其它變量的異常點較少。
由上述評價指標可知,利用可解釋方差值和R方值等相對指標評判效果更好
(2)支持向量機模型
由上述指標可知,支持向量機所建立模型的準確率很低。
(3)線性回歸模型
由于上述指標可知,線性回歸的可解釋方差值為0.70,R方(決定系數(shù))為0.69
(5)梯度回歸模型
由上述評價指標可知,梯度回歸模型的可解釋方差值和為R方值均為0.98
3.因為平均絕對誤差、均方誤差、中值絕對誤差為絕對數(shù),評判較為困難,因此主要運用可解釋方差值和R方值。可解釋方差值為越大表示預(yù)測和樣本值的分散分布程度越相近,R方值(決定系數(shù))計算出來越是接近1,預(yù)測值越接近真實樣本值。因此,綜上所述,梯度回歸的可解釋方差更大,R方值更大,說明梯度回歸模型更適合對股票收盤價的預(yù)測。
總結(jié)
以上是生活随笔為你收集整理的《Python数据分析与应用》第7章 机器学习模型的应用 实训部分的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python csv写文件,用Excel
- 下一篇: python输出二进制数_Python计