當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ML常用技巧

發(fā)布時間：2023/12/20 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 ML常用技巧小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

ML常用技巧

Regularization
Modification of the logistic regression to the SVM
圖片鏈接和圖片上傳
LaTex數(shù)學(xué)公式
UML序列圖和流程圖
離線寫博客
導(dǎo)入導(dǎo)出Markdown文件
豐富的快捷鍵

Regularization

Overfitting
通常來說，當feature的個數(shù)非常多時，非常容易發(fā)生overfitting現(xiàn)象。先說underfitting，當model不能很好的反應(yīng)數(shù)據(jù)中的規(guī)律時，我們可以說發(fā)生了underfitting，正如下圖中最左側(cè)的圖一樣。而當feature的個數(shù)非常多時，可以通過調(diào)整參數(shù)，使得訓(xùn)練后的模型剛好可以代表每一個點的特性。而如果此時的model又不具有描述新數(shù)據(jù)的關(guān)系，那么就發(fā)生了overfitting。正如下面最右側(cè)的圖。下面中間的圖可以認為是一種“剛剛好”的狀態(tài)。

underfitting justright and overfitting for linear regression

上圖給了一個關(guān)于線性回歸的例子，下面可以再看一個邏輯回歸中發(fā)生underfitting 和 overfitting的例子。

underfitting justright and overfitting for logistic regression

有些時候我們有很多很多量可以供我們分析，來訓(xùn)練我們的model，比方說預(yù)測房子的價格。

然而，當feature的個數(shù)特別多的時候，就容易發(fā)生overfitting。但也有一些相應(yīng)的解決辦法，比如

- 手動的選擇一些feature
- 使用model selection algorithm
- Regularization ：
- 保留所有的feature，但是要降低feature對應(yīng)的參數(shù)

θjθj的值
- 這種方法當feature的個數(shù)非常多的時候很有效，每一個feature都對預(yù)測貢獻一點點而已。

于是我們可以再cost function中加入一項λ∑nj=1θ2j，來約束這些參數(shù)的大小。對于線性回歸來說，新的cost function就變成了

J(θ)=12m∑i=1m(hθ(x(i))?y(i))2+λ∑j=1nθ2j,J(θ)=12m∑i=1m(hθ(x(i))?y(i))2+λ∑j=1nθj2,
而對于邏輯回歸來說，新的cost function就變成了。

J(θ)=?1m∑i=1m(y(i)log(1?hθ(x(i)))+(1?y(i))loghθ(x(i)))+λ2m∑j=1nθ2j.J(θ)=?1m∑i=1m(y(i)log?(1?hθ(x(i)))+(1?y(i))log?hθ(x(i)))+λ2m∑j=1nθj2.

需要注意的是，λ∑nj=1θ2j中不包含bias term θ0，即j<script type="math/tex" id="MathJax-Element-759">j</script>的值是從1開始取的。

總結(jié)

以上是生活随笔為你收集整理的ML常用技巧的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：表单提交成功后重置表单
下一篇： ar9331修改flash大小和df、c

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

ML常用技巧

ML常用技巧

Regularization

總結(jié)