日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

5.2 大间距分类器-机器学习笔记-斯坦福吴恩达教授

發(fā)布時間:2025/4/5 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 5.2 大间距分类器-机器学习笔记-斯坦福吴恩达教授 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

大間距分類器

在上節(jié)中,我們了解到了 SVM 最小化代價函數(shù)過程為:
min?θC[∑i=1my(i)cost1(θTx(i))+(1?y(i))cost0(θTx(i))]+12∑j=1nθj2\min _θC[∑_{i=1}^m y^{(i)} cost_1(θ^Tx^{(i)})+(1?y^{(i)})cost_0(θ^Tx^{(i)})]+\frac12∑_{j=1}^nθ^2_jθmin?C[i=1m?y(i)cost1?(θTx(i))+(1?y(i))cost0?(θTx(i))]+21?j=1n?θj2?

并且,當(dāng) y(i)=1y^{(i)}=1y(i)=1 時,SVM 希望 θTx(i)≥1θ^Tx^{(i)}≥1θTx(i)1 ;而當(dāng) y(i)=0y^{(i)}=0y(i)=0 時,SVM 希望 θTx(i)≤?1θ^Tx^{(i)}≤?1θTx(i)?1 。則最小化代價函數(shù)的過程就可以描述為:
min?12∑j=1nθj2\min \frac12∑_{j=1}^nθ^2_jmin21?j=1n?θj2?s.t.θTx(i)≥1ify(i)=1s.t.\quad θ^Tx^{(i)}≥1\quad if\ y^{(i)}=1s.t.θTx(i)1if?y(i)=1θTx(i)≤?1ify(i)=1θ^Tx^{(i)}≤-1\quad if\ y^{(i)}=1θTx(i)?1if?y(i)=1

SVM 最終找出的決策邊界會是下圖中黑色直線所示的決策邊界,而不是綠色或者紫色的決策邊界。該決策邊界保持了與正、負(fù)樣本都足夠大的距離,因此,SVM 是典型的大間距分類器(Large margin classifier)。

推導(dǎo)

假定有兩個 2 維向量:
u=(u1u2),v=(v1v2)u=\left( \begin{matrix} u_1\\ u_2 \end{matrix} \right), v=\left( \begin{matrix} v_1\\ v_2 \end{matrix} \right)u=(u1?u2??),v=(v1?v2??)

pppvvv 投影到 uuu 的線段長(該值可正可負(fù)),如下圖所示:

u、vu 、 vuv 的內(nèi)積為:
uTv=p?∣∣u∣∣=u1v1+u2v2u^Tv = p \ \cdot ||u||=u_1v_1+u_2v_2uTv=p??u=u1?v1?+u2?v2?

其中,∣∣u∣∣||u||uuuu 的范數(shù),也是 uuu 的長度。
假定我們的 θ=(θ1θ2)θ=\left(\begin{matrix}θ_1\\θ_2 \end{matrix}\right)θ=(θ1?θ2??) ,且 θ0=0θ_0=0θ0?=0 ,以使得向量 θθθ 過原點,則:
min?θ12∑j=12θj2=min?θ12(θ1+θ2)2\min_θ\frac12∑_{j=1}^2θ_j^2 = \min_θ\frac12(θ_1+θ_2)^2θmin?21?j=12?θj2?=θmin?21?(θ1?+θ2?)2=min?θ12(θ12+θ22)2=\min_θ\frac12(\sqrt{θ_1^2+θ_2^2})^2=θmin?21?(θ12?+θ22??)2=min?θ12∣∣θ∣∣2=\min_θ\frac12||θ||^2=θmin?21?θ2

由向量內(nèi)積公式可得:
θTx(i)=p(i)?∣∣θ∣∣θ^Tx^{(i)}=p^{(i)} \cdot ||θ||θTx(i)=p(i)?θ

其中, p(i)p^{(i)}p(i) 為特征向量 x(i)x^{(i)}x(i)θθθ 上的投影:

當(dāng) y(i)=1y^{(i)}=1y(i)=1 時,我們希望 θTx(i)≥1θ^Tx^{(i)}≥1θTx(i)1 ,亦即希望 p(i)?∣∣θ∣∣≥qp^{(i)}?||θ||≥qp(i)?θq ,此時考慮兩種情況:

  • p(i)p^{(i)}p(i) 很小,則需要 ∣∣θ∣∣||θ||θ 很大,這與我們 min?θ12∣∣θ∣∣2\min\limits_θ\frac12||θ||^2θmin?21?θ2 矛盾。
  • p(i)p^{(i)}p(i) 很大,如下圖所示,即樣本與決策邊界的距離足夠大,此時我們才能在既要 ∣∣θ∣∣||θ||θ 足夠小的情況下,又能有 θtx(i)≥1θ^tx^{(i)}≥1θtx(i)1 ,保證預(yù)測精度夠高。這就解釋了為什么 SVM 的模型會具有大間距分類器的性質(zhì)了。
  • 總結(jié)

    以上是生活随笔為你收集整理的5.2 大间距分类器-机器学习笔记-斯坦福吴恩达教授的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。