日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

5.3 核函数-机器学习笔记-斯坦福吴恩达教授

發(fā)布時(shí)間:2025/4/5 编程问答 15 豆豆
生活随笔 收集整理的這篇文章主要介紹了 5.3 核函数-机器学习笔记-斯坦福吴恩达教授 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

核函數(shù)


在邏輯回歸中,我們會(huì)通過多項(xiàng)式擴(kuò)展來處理非線性分類問題:
hθ(x)=θ0+θ1x1+θ2x2+θ3x1x2+θ4x12+θ5x22+?h_θ(x)=θ_0+θ_1x_1+θ_2x_2+θ_3x_1x_2+θ_4x^2_1+θ_5x^2_2+?hθ?(x)=θ0?+θ1?x1?+θ2?x2?+θ3?x1?x2?+θ4?x12?+θ5?x22?+?

假設(shè)我們令:
f1=x1,f2=x2,f3=x1x2,f4=x12,f5=x22f_1=x_1,f_2=x_2,f_3=x_1x_2,f_4=x^2_1,f_5=x^2_2f1?=x1?,f2?=x2?,f3?=x1?x2?,f4?=x12?,f5?=x22?

則預(yù)測(cè)函數(shù)為:
hθ(x)=θ0+θ1f1+θ2f2+θ3f3+?h_θ(x)=θ_0+θ_1f_1+θ_2f_2+θ_3f_3+?hθ?(x)=θ0?+θ1?f1?+θ2?f2?+θ3?f3?+?

但多項(xiàng)式回歸所帶來的高階項(xiàng)不一定作用明顯,針對(duì)這一問題,SVM 不會(huì)引入高階項(xiàng)來作為新的特征,而是會(huì)選擇一些標(biāo)記點(diǎn)(landmark),并將樣本 xxx 與標(biāo)記點(diǎn) l(i)l^{(i)}l(i) 的相似程度作為新的訓(xùn)練特征 fif_ifi?
fi=similarity(x,l(i))f_i=similarity(x,l^{(i)})fi?=similarity(x,l(i))


距離度量的方式就稱之為核函數(shù)(Kernel),最常見的核函數(shù)是高斯核函數(shù)(Gaussian Kernel)
fi=exp(?∣∣x?l(i)∣∣22δ2)f_i=exp(\frac {?||x?l^{(i)}||^2}{2δ^2})fi?=exp(2δ2?x?l(i)2?)

在高斯核中,注意到:

  • 如果樣本與標(biāo)記點(diǎn)足夠接近,即 x≈l(i) ,則:
    f≈exp(?022δ2)≈1f≈exp(?\frac {0^2}{2δ^2})≈1fexp(?2δ202?)1

  • 如果樣本遠(yuǎn)離標(biāo)記點(diǎn),則:
    f≈exp(?(largenumber)22δ2)≈0f≈exp(?\frac {(large\ number)^2}{2δ^2})≈0fexp(?2δ2(large?number)2?)0

這一關(guān)系可以被如下的熱力圖所反映:

在使用高斯核函數(shù)前,需要做特征縮放(feature scaling),以使 SVM 同等程度地關(guān)注到不同的特征。

標(biāo)記點(diǎn)選取

假定我們有如下的數(shù)據(jù)集:
(x(1),y(1)),(x(2),y(2)),(x(3),y(3)),?,(x(m),y(m))(x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),(x^{(3)},y^{(3)}),?,(x^{(m)},y^{(m)})(x(1),y(1))(x(2),y(2))(x(3),y(3))?(x(m),y(m))

我們就將每個(gè)樣本作為一個(gè)標(biāo)記點(diǎn):
l(1)=x(1),l(2)=x(2),l(3)=x(3),?,l(m)=x(m)l^{(1)}=x^{(1)},l^{(2)}=x^{(2)},l^{(3)}=x^{(3)},?,l^{(m)}=x^{(m)}l(1)=x(1)l(2)=x(2)l(3)=x(3)?l(m)=x(m)

則對(duì)于樣本 (x(i),y(i))(x^{(i)},y^{(i)})(x(i),y(i)) ,我們計(jì)算其與各個(gè)標(biāo)記點(diǎn)的距離:
f1(i)=sim(x(i),l(1))f^{(i)}_1=sim(x^{(i)},l^{(1)})f1(i)?=sim(x(i),l(1))f2(i)=sim(x(i),l(2))f^{(i)}_2=sim(x^{(i)},l^{(2)})f2(i)?=sim(x(i),l(2))???fm(i)=sim(x(i),l(3))f^{(i)}_m=sim(x^{(i)},l^{(3)})fm(i)?=sim(x(i),l(3))

得到新的特征向量: f∈Rm+1f∈\R^{m+1}fRm+1
f=(f0f1f2?fm)其中f0=1f=\left( \begin{matrix} f_0 \\ f_1 \\ f_2 \\ ? \\ f_m \end{matrix} \right)\quad 其中f_0=1 f=????????f0?f1?f2??fm??????????f0?=1

則具備核函數(shù)的 SVM 的訓(xùn)練過程如下:
min?θC[∑i=1my(i)cost1(θTf(i))+(1?y(i))cost0(θTf(i))]+12∑j=1nθj2\min_θC[∑_{i=1}^m y^{(i)}cost_1(θ^Tf^{(i)})+(1?y^{(i)})cost_0(θ^Tf^{(i)})]+\frac12∑_{j=1}^nθ^2_jθmin?C[i=1m?y(i)cost1?(θTf(i))+(1?y(i))cost0?(θTf(i))]+21?j=1n?θj2?

總結(jié)

以上是生活随笔為你收集整理的5.3 核函数-机器学习笔记-斯坦福吴恩达教授的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。