當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

基于梯度下降法的——线性回归拟合

發(fā)布時(shí)間：2024/9/15 编程问答 41 豆豆

生活随笔收集整理的這篇文章主要介紹了基于梯度下降法的——线性回归拟合小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

點(diǎn)擊“小詹學(xué)Python”，選擇“置頂”公眾號

重磅干貨，第一時(shí)間送達(dá)

本文轉(zhuǎn)載自數(shù)據(jù)分析挖掘與算法，禁二次轉(zhuǎn)載

閱讀本文需要的知識(shí)儲(chǔ)備：

高等數(shù)學(xué)
運(yùn)籌學(xué)
Python基礎(chǔ)

引出梯度下降

對于，線性回歸問題，上一篇我們用的是最小二乘法，很多人聽到這個(gè)，或許會(huì)說：天殺的最小二乘法，因?yàn)楹芏嗳藢λ?/span>敏感了。是的，從小到大，天天最小二乘法，能不能來點(diǎn)新花樣。這里就用數(shù)學(xué)算法——梯度下降，來解決，尋優(yōu)問題。

當(dāng)然了，我們的目標(biāo)函數(shù)還是：

在開始之前，我還是上大家熟知常見的圖片。

梯度下山圖片（來源：百度圖片）

找了好久，我選了這張圖片，因?yàn)槲矣X得這張圖片很形象：天氣驟變，一個(gè)人需要快速下山回家，但是他迷路了，不知道怎么回家，他知道自己家位于這座山海拔最低處。環(huán)顧四周，怎么樣最快下山回家呢。他個(gè)子一定（假設(shè)1.8m大個(gè)子吧），每次邁步子為平時(shí)走路最大步長了，哈哈！（假設(shè)保持不變），要往哪個(gè)方向走才能使得：每邁出一步，自己下降的高度最大呢？只要每步有效下降高度最大，我們完全有理由相信，他會(huì)最快下山回家。

所以：他會(huì)告訴自己，我每次要找一個(gè)最好的下山方向（有點(diǎn)像“貪心”）。

其實(shí)，這個(gè)圖還反映了另外一個(gè)問題，對于有多個(gè)極值點(diǎn)的情況，不同的初始出發(fā)點(diǎn)，梯度下降可能會(huì)陷入局部極小值點(diǎn)。就像一句古詩：不識(shí)廬山真面目，只緣身在此山中！這時(shí)候，就需要多點(diǎn)隨機(jī)下山解決。當(dāng)然了，解決線性回歸問題的梯度下降是基于誤差平方和，只有二次項(xiàng)，不存在多峰問題。

梯度下降的理論基礎(chǔ)

我們都現(xiàn)在都知道這個(gè)人的任務(wù)是什么了：每次要找一個(gè)最好的下山方向。數(shù)學(xué)微分學(xué)告訴我們：其實(shí)這里的方向就是我們平時(shí)所說的：方向?qū)?shù)，它可以衡量函數(shù)值沿著某個(gè)方向變化的快慢，只要選擇了好的方向（導(dǎo)數(shù)），就能快速達(dá)到（最大/最小值）。

（1）、梯度的定義

這里還是擺一個(gè)公式吧，否則看著不符合我的風(fēng)格。方向?qū)?shù)定義就不扯遠(yuǎn)了，那是個(gè)關(guān)于極限的定義。這里給出三元函數(shù)梯度定義公式：

顯然，讓沿著與梯度方向，夾角為0或者180°時(shí)函數(shù)值增減最快。

其實(shí)，每個(gè)多元函數(shù)在任一點(diǎn)會(huì)有一個(gè)梯度。函數(shù)在某一點(diǎn)沿著梯度方向，函數(shù)值是變化最快的。這里就不過多證明了。

（2）、步長的求法

其實(shí)，我們可以設(shè)定一個(gè)指定步長。但是，這個(gè)指定步長到底設(shè)為多大合適。眾所周知，過大會(huì)導(dǎo)致越過極小值點(diǎn)；過小在數(shù)據(jù)量大時(shí)會(huì)導(dǎo)致迭代次數(shù)過多。所以我們需要一套理論可以來科學(xué)得計(jì)算步長。保證在步長變換過程中，盡管有時(shí)可能會(huì)走回頭路，但總體趨勢是向駐點(diǎn)逼近。

這里簡單說一下，假設(shè)在圖中一點(diǎn)沿著梯度方向存在二階偏導(dǎo)數(shù)，就可以泰勒展開到平方項(xiàng)，進(jìn)而對這個(gè)關(guān)于步長的函數(shù)求導(dǎo)數(shù)，導(dǎo)函數(shù)零點(diǎn)就是此時(shí)最佳步長。詳細(xì)可以參見運(yùn)籌學(xué)推導(dǎo)。我盡量少寫公式，多說明，哈哈。

用到的公式主要是步長lambda公式如下：

說明：下三角f表示梯度，海賽矩陣，X1，X2這里表示各個(gè)變量（這里是兩個(gè)），對于連續(xù)函數(shù)，偏導(dǎo)數(shù)不分先后，所以不要算兩遍，后面寫程序會(huì)用到！這樣每走一步，都會(huì)重新設(shè)置步長，與定步長相比，是不是更加智能了？

下降停止標(biāo)志：梯度趨于0，或者小于給定的eps。

有了這些理論基礎(chǔ)后，編程實(shí)現(xiàn)就容易多了，下面就編程實(shí)現(xiàn)了。

線性關(guān)系呢。最著名的當(dāng)數(shù)最小二乘法了，很多人都知道。

梯度下降的Python實(shí)現(xiàn)

這里用的與上一片一樣的數(shù)據(jù)。

（1）、用到的函數(shù)：

不同點(diǎn)的梯度函數(shù)，海賽矩陣函數(shù)，迭代主函數(shù)

這里用到的比如點(diǎn)乘函數(shù)，在第一篇《基于最小二乘法的——線性回歸擬合（一）》里面有我是放在一個(gè)腳本里面的，所以這里沒有寫兩次，你們可以把兩個(gè)腳本放在一起是沒有問題的。

程序代碼：

1#-----------------梯度下降法----------------
2#返回梯度向量
3def?dif(alpha,beta,x,y):
4???dif_alpha?=?-2*sum(err(alpha,beta,x,y))
5???dif_beta?=?-2*dot(err(alpha,beta,x,y),x)
6???return(dif_alpha,dif_beta)
7#返回海賽矩陣
8def?hesse(x):
9???return([[2*len(x),2*sum(x)],[2*sum(x),2*dot(x,x)]])
10#計(jì)算lambda
11def?lam(x1,x2):
12???s1?=?dot(x1,[x2[0][0],x2[1][0]])
13???s2?=?dot(x1,[x2[0][1],x2[1][1]])
14???return(dot(x1,x1)/dot([s1,s2],x1))
15#導(dǎo)入數(shù)學(xué)、隨機(jī)數(shù)模塊
16import?math
17import?random
18def?grad(x,y):
19???#設(shè)置最大計(jì)算次數(shù)
20???n_max?=?100
21???k?=?0
22???error_?=?0.001
23???alpha,beta?=?random.random(),random.random()
24???#計(jì)算梯度向量
25???d_f?=?dif(alpha,beta,x,y)
26???while(math.sqrt(dot(d_f,d_f))>error_?and?k<n_max):
27??????h?=?hesse(x)
28??????lamb?=?lam(d_f,h)
29??????alpha,beta?=?[alpha-lamb*d_f[0],beta-lamb*d_f[1]]
30??????d_f?=?dif(alpha,beta,x,y)
31??????k+=1
32???else:
33??????return(alpha,beta,k,math.sqrt(dot(d_f,d_f)))
34alpha,beta,k,error?=?grad(x,y)
35print('
*------------梯度下降-----------*')
36print('系數(shù)為：',alpha,beta)
37print('梯度下降擬合次數(shù)為：',k)
38print('梯度為：',error)
39print('誤差為：',error_total(alpha,beta,x,y))
40R_square?=?r_square(alpha,beta,x,y)
41print('R方：',R_square)
42if(R_square>0.95):
43???print('在0.05置信水平下，該線性擬合不錯(cuò)!')
44else:
45???print('在0.05置信水平下，該線性擬合效果不佳!')
46#可視化
47plt.figure(2)
48plt.scatter(x,y,marker?=?'*',color?=?'b')
49plt.xlabel('x?label')
50plt.ylabel('y?label')
51plt.title('Linear?Fit')
52plt.plot(x,[alpha+beta*x_i?for?x_i?in?x],color?=?'r')
53plt.show()
54
55print('
#-------------多個(gè)初始點(diǎn)下山---------------#')
56for?i?in?range(10):
57???alpha,beta,k,error?=?grad(x,y)
58???R_square?=?r_square(alpha,beta,x,y)
59??print('系數(shù)為：',alpha,beta,'
誤差為：',error_total(alpha,beta,x,y),'
R方：',R_square)
60???if(R_square>0.95):
61??????print('在0.05置信水平下，該線性擬合不錯(cuò)!')
62???else:
63??????print('在0.05置信水平下，該線性擬合效果不佳!')
64???print('*********************************************')

（2）、結(jié)果

*------------梯度下降-----------*
系數(shù)為：2.1672851935 2.5282506525292012
梯度下降擬合次數(shù)為：5
梯度為：1.2745428915606112e-05
誤差為：9.898083702910405
R方：0.9558599578256541
在0.05置信水平下，該線性擬合不錯(cuò)!

擬合圖如下

1#-------------多個(gè)初始點(diǎn)下山---------------#
2系數(shù)為：2.167285891989479 2.528250598680116
3誤差為：9.898083702904094
4R方：0.9558599578256822
5在0.05置信水平下，該線性擬合不錯(cuò)!
6*********************************************
7系數(shù)為：2.167282336941068 2.5282508727544775
8誤差為：9.898083702990858
9R方：0.9558599578252953
10在0.05置信水平下，該線性擬合不錯(cuò)!
11*********************************************
12系數(shù)為：2.167285928067579 2.5282505958987773
13誤差為：9.898083702903905
14R方：0.9558599578256831
15在0.05置信水平下，該線性擬合不錯(cuò)!
16*********************************************
17系數(shù)為：2.1672811054772247 2.528250967694748
18誤差為：9.898083703052635
19R方：0.9558599578250199
20在0.05置信水平下，該線性擬合不錯(cuò)!
21*********************************************
22系數(shù)為：2.1672836911979947 2.528250768347593
23誤差為：9.898083702941747
24R方：0.9558599578255144
25在0.05置信水平下，該線性擬合不錯(cuò)!
26*********************************************
27系數(shù)為：2.1672838440861364 2.5282507565614916
28誤差為：9.898083702937456
29R方：0.9558599578255335
30在0.05置信水平下，該線性擬合不錯(cuò)!
31*********************************************
32系數(shù)為：2.1672853294236947 2.5282506420502253
33誤差為：9.898083702908751
34R方：0.9558599578256615
35在0.05置信水平下，該線性擬合不錯(cuò)!
36*********************************************
37系數(shù)為：2.1672857750441694 2.5282506076959184
38誤差為：9.898083702904778
39R方：0.9558599578256792
40在0.05置信水平下，該線性擬合不錯(cuò)!
41*********************************************
42系數(shù)為：2.16728609101821 2.5282505833364226
43誤差為：9.89808370290327
44R方：0.9558599578256859
45在0.05置信水平下，該線性擬合不錯(cuò)!
46*********************************************
47系數(shù)為：2.1672842715049874 2.528250723609833
48誤差為：9.898083702926757
49R方：0.9558599578255812
50在0.05置信水平下，該線性擬合不錯(cuò)!
51*********************************************

當(dāng)然了，這里多個(gè)初始點(diǎn)隨機(jī)梯度下降不需要，以后對于多元多峰函數(shù)這是有必要的

結(jié)果分析

1*----------梯度下降----------*
2系數(shù)為：2.1672851935?2.5282506525292012
3梯度下降擬合次數(shù)為：5
4梯度為：1.2745428915606112e-05
5誤差為：9.898083702910405
6R方：0.9558599578256541
7在0.05置信水平下，該線性擬合不錯(cuò)!

可以對比最小二乘法與梯度下降誤差，我們猜測肯定是梯度下降誤差大一些，因?yàn)樽钚《朔ɑ诤瘮?shù)極值點(diǎn)求法肯定是全局最優(yōu)的，梯度下降由于隨機(jī)原因與步長可能是靠近最優(yōu)，哈哈！在有多個(gè)極值點(diǎn)的情況下可能是局部最優(yōu)解。

1*----------最小二乘法-------*
2
3系數(shù)為：2.6786542252575067?2.538861110659364
4
5誤差為：6.8591175428159215
6
7R方：0.9696451619135048
8
9在0.05置信水平下，該線性擬合不錯(cuò)!
10
11*------------梯度下降-----------*
12
13系數(shù)為：2.1672851935?2.5282506525292012
14
15梯度下降擬合次數(shù)為：5
16
17梯度為：1.2745428915606112e-05
18
19誤差為：9.898083702910405
20
21R方：0.9558599578256541
22
23在0.05置信水平下，該線性擬合不錯(cuò)!

可以看出，梯度為：1.2745428915606112e-05，已經(jīng)接近0了，跟據(jù)實(shí)際精度會(huì)有不同。顯然，梯度下降這里不存在局部極值點(diǎn)問題，只能是步長邁過去了，但這個(gè)點(diǎn)一定是靠近最優(yōu)解的，誤差非常小。

推薦閱讀：某坤學(xué)學(xué)吳亦凡，Python可視化分析「大碗寬面」b站彈幕和網(wǎng)易云音樂評論

總結(jié)

以上是生活随笔為你收集整理的基于梯度下降法的——线性回归拟合的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：走在前沿的弄潮儿，怎能不会Git的那些奇
下一篇：极力推荐5款我一直在使用的Chrome优

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

基于梯度下降法的——线性回归拟合

總結(jié)