當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

线性回归的补充与变量归一化

發(fā)布時間：2023/12/15 编程问答 34 豆豆

生活随笔收集整理的這篇文章主要介紹了线性回归的补充与变量归一化小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

緊接上一篇博客，多變量梯度下降法的表達式形式與單變量一致，只是變量的擴充以及每次迭代需要對每個變量進行操作（同樣是所有變量一次性更新）。假設(shè)函數(shù)、代價函數(shù)和梯度下降的表達式分別如下：
$hθ(x)=θTxh_\theta(x)=\theta^Tx$ $J(θ)=12m∑i=0m(hθ(xi)?yi)2J(\theta)=\frac{1}{2m}\sum_{i=0}^{m}(h_\theta(x_i)-y_i)^2$ $KaTeX parse error: No such environment: align at position 7: \begin{?a?l?i?g?n?}?\theta_j:=\thet…$
對于多變量，往往每個特征變量的取值范圍差異很大，在利用梯度下降法進行迭代運算求 $J(θ)J(\theta)$ 的最小值時，迭代路徑受數(shù)值大的變量影響較大，而數(shù)值小的變量可能會在最優(yōu)值附近反復振蕩，造成迭代路徑的曲折，收斂緩慢。因此為了更快收斂，一般把各變量歸一化成取值范圍大概一致（feature scaling）。一般取 $?1≤xi≤1-1\leq x_i \leq 1$ 或者 $\leq x_i \leq 0.5$ ，（不是嚴格規(guī)定）。對于一個一般變量，通常取 $xi:=xi?μisix_i:=\frac{x_i-\mu_i}{s_i}$ 這里 $μi\mu_i$ 是 $x_i$ 的樣本平均值， $s_i$ 是取值范圍（max - min），或者 $s_i$ 取為標準差。

[外鏈圖片轉(zhuǎn)存失敗(img-69raoK7f-1562665150709)(https://img-my.csdn.net/uploads/201206/28/1340891220_5273.jpg)]

對于回歸問題，顯然假設(shè)函數(shù) $hθ(x)h_\theta(x)$ 并不是與每個特征變量均成線性關(guān)系，可能會出現(xiàn)如$h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2^2 $的形式，這稱為多項式回歸（Polynomial Regression）。

但是，可以通過適當變形把其轉(zhuǎn)變?yōu)榫€性回歸。在此例子中，令 $x_2=x_2^2$ ，則 $hθ(x)=θ0+θ1x1+θ2x2h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2$ 。此外，可令 $x_3=x_1x_2$ ， $x4=x1x_4=\sqrt{x_1}$ 等各種不同方式對變量變形，使其成為線性回歸問題。運用變形后，變量范圍的歸一化就變得尤為重要。

另一種解線性回歸問題的方法是標準方程法（Normal Equation），運用該方法，可以不需要迭代而直接求出 $θ\theta$ 。該方程如下： $θ=(XTX)?1XTy\theta=(X^TX)^{-1}X^{T}y$
這里 $θ=[θ0θ1θ2...]\theta =\left[\begin{matrix}\theta_0\\\theta_1\\\theta_2\\...\end{matrix}\right]$ ， $y=[y0y1y2...]y=\left[\begin{matrix}y_0\\y_1\\y_2\\...\end{matrix}\right]$ ， $X=[x0(1)x1(1)x2(1)...x0(2)x1(2)x2(2)...x0(3)x1(3)x2(3)...............]X=\left[\begin{matrix}x_0^{(1)}&x_1^{(1)}&x_2^{(1)}&...\\x_0^{(2)}&x_1^{(2)}&x_2^{(2)}&...\\x_0^{(3)}&x_1^{(3)}&x_2^{(3)}&...\\...&...&...&...\end{matrix}\right]$
例子如下：

這個結(jié)論來源于線性代數(shù)中的投影，具體推導參考http://open.163.com/movie/2010/11/J/U/M6V0BQC4M_M6V2AJLJU.html

梯度下降法和標準方程法的比較：

Gradient DescentNormal Equation

需要選擇合適的參數(shù) $α\alpha$	不需要選擇參數(shù)
需要多次迭代	不需要迭代
算法復雜度 $O(kn^2)$	$O(n^3)$ ，因要計算 $X^TX$ 的逆矩陣
當樣本數(shù)n很大時依然高效	樣本數(shù)n很大時計算慢

如果 $X^TX$ 不可逆，有以下兩方面原因：
1、存在多余的特征變量，如其中兩個特征變量存在線性關(guān)系，如 $x_2=2x_1$ ；
2、相比較樣本數(shù)據(jù)，特征變量太多，即 $m < n$ ，這里 $m$ 是樣本個數(shù)， $n$ 是特征變量個數(shù)

在Octave/Matlab中，用pinv()代替inv()實現(xiàn)矩陣取逆，即使矩陣不可逆時也可以得到正確的結(jié)果。
即標準方程的代碼實現(xiàn)為：

theta = pinv(X'*X)*X'*y;

總結(jié)

以上是生活随笔為你收集整理的线性回归的补充与变量归一化的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： pt100专用芯片_有没有PT100测温
下一篇：编程资源网址

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

线性回归的补充与变量归一化

總結(jié)