當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

5.2 大间距分类器-机器学习笔记-斯坦福吴恩达教授

發(fā)布時間：2025/4/5 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了 5.2 大间距分类器-机器学习笔记-斯坦福吴恩达教授小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

大間距分類器

在上節(jié)中，我們了解到了 SVM 最小化代價函數(shù)過程為：
$min?θC[∑i=1my(i)cost1(θTx(i))+(1?y(i))cost0(θTx(i))]+12∑j=1nθj2\min _θC[∑_{i=1}^m y^{(i)} cost_1(θ^Tx^{(i)})+(1?y^{(i)})cost_0(θ^Tx^{(i)})]+\frac12∑_{j=1}^nθ^2_j$

并且，當(dāng) $y^{(i)}=1$ 時，SVM 希望 $θ^Tx^{(i)}≥1$ ；而當(dāng) $y^{(i)}=0$ 時，SVM 希望 $θ^Tx^{(i)}≤?1$ 。則最小化代價函數(shù)的過程就可以描述為：
$min?12∑j=1nθj2\min \frac12∑_{j=1}^nθ^2_j$ $s.t.θTx(i)≥1ify(i)=1s.t.\quad θ^Tx^{(i)}≥1\quad if\ y^{(i)}=1$ $θTx(i)≤?1ify(i)=1θ^Tx^{(i)}≤-1\quad if\ y^{(i)}=1$

SVM 最終找出的決策邊界會是下圖中黑色直線所示的決策邊界，而不是綠色或者紫色的決策邊界。該決策邊界保持了與正、負(fù)樣本都足夠大的距離，因此，SVM 是典型的大間距分類器（Large margin classifier）。

推導(dǎo)

假定有兩個 2 維向量：
$u=(u1u2),v=(v1v2)u=\left( \begin{matrix} u_1\\ u_2 \end{matrix} \right), v=\left( \begin{matrix} v_1\\ v_2 \end{matrix} \right)$

令 $p$ 為 $v$ 投影到 $u$ 的線段長（該值可正可負(fù)），如下圖所示：

則 $u 、 v$ 的內(nèi)積為：
$uTv=p?∣∣u∣∣=u1v1+u2v2u^Tv = p \ \cdot ||u||=u_1v_1+u_2v_2$

其中， $∣ ∣ u ∣ ∣$ 為 $u$ 的范數(shù)，也是 $u$ 的長度。
假定我們的 $θ=(θ1θ2)θ=\left(\begin{matrix}θ_1\\θ_2 \end{matrix}\right)$ ，且 $θ_0=0$ ，以使得向量 $θ$ 過原點，則：
$min?θ12∑j=12θj2=min?θ12(θ1+θ2)2\min_θ\frac12∑_{j=1}^2θ_j^2 = \min_θ\frac12(θ_1+θ_2)^2$ $=min?θ12(θ12+θ22)2=\min_θ\frac12(\sqrt{θ_1^2+θ_2^2})^2$ $=min?θ12∣∣θ∣∣2=\min_θ\frac12||θ||^2$

由向量內(nèi)積公式可得：
$θTx(i)=p(i)?∣∣θ∣∣θ^Tx^{(i)}=p^{(i)} \cdot ||θ||$

其中， $p^{(i)}$ 為特征向量 $x^{(i)}$ 在 $θ$ 上的投影：

當(dāng) $y^{(i)}=1$ 時，我們希望 $θ^Tx^{(i)}≥1$ ，亦即希望 $p^{(i)}?||θ||≥q$ ，此時考慮兩種情況：

p^{(i)}

很小，則需要

∣ ∣ θ ∣ ∣

很大，這與我們

min?θ12∣∣θ∣∣2\min\limits_θ\frac12||θ||^2

矛盾。

p^{(i)}

很大，如下圖所示，即樣本與決策邊界的距離足夠大，此時我們才能在既要

∣ ∣ θ ∣ ∣

足夠小的情況下，又能有

θ^tx^{(i)}≥1

，保證預(yù)測精度夠高。這就解釋了為什么 SVM 的模型會具有大間距分類器的性質(zhì)了。

總結(jié)

以上是生活随笔為你收集整理的5.2 大间距分类器-机器学习笔记-斯坦福吴恩达教授的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 5.1 代价函数-机器学习笔记-斯坦福吴
下一篇： 5.3 核函数-机器学习笔记-斯坦福吴恩