當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

线性模型（3）：Logistic Regression

發(fā)布時(shí)間：2024/8/26 编程问答 56 豆豆

生活随笔收集整理的這篇文章主要介紹了线性模型（3）：Logistic Regression 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

此筆記源于臺(tái)灣大學(xué)林軒田老師《機(jī)器學(xué)習(xí)基石》《機(jī)器學(xué)習(xí)技法》

（一）Logistic Regression 原理

對(duì)于分類問題，假設(shè)我們想得到的結(jié)果不是（x屬于某一類）這種形式，而是（x屬于某一類的概率是多少）這種形式。

因?yàn)閟的范圍是(-∞，+∞), 而概率的范圍是[0,1],所以我們需要一個(gè)映射函數(shù)：

我們?nèi)绾螒?yīng)用概率知識(shí)來解決這一問題呢？一種想法是使用極大似然法。

現(xiàn)在出現(xiàn)了類似于linear Regression中的形式，我們可以求梯度。

根據(jù)上式，并不能得出向量w的close-form solution。

（二）Logistic Regression Algorithm

現(xiàn)在回想一下PLA算法，我們要從中提取出一種非常普遍的模式：iterative Optimization。

回想一下，我們?cè)赑LA算法中何如一步步改善向量w？首先選擇一個(gè)mistake 數(shù)據(jù)，然后用mistake數(shù)據(jù)矯正原來的w。

再抽象一下這個(gè)模型：

我們只需要關(guān)系兩個(gè)參數(shù)即可：η代表了w_t的變化大小，v代表了w_t的變化方向（|v|=1）。

現(xiàn)在我們采用iterative Optimization方法來求解logistic regression中的w。

（1）考慮v

假設(shè)，當(dāng)eta非常小的情況下，根據(jù)Taylor展開公式，可以得到：

現(xiàn)在如果想使得上述公式最小，只需要使v為與方向完全相反的單位向量即可。

（2）考慮η

η太大太小都不好，最好是與的長度成比例。

（3）小結(jié)

(三） Stochastic Gradient Descent（SGD）

上述方法有什么問題嗎？

每一個(gè)迭代，我們都必須使用training dataset中所有的N個(gè)數(shù)據(jù)。1）效率很低。2）只適合batch protocol類型的問題。

我們?cè)趺醋瞿?#xff1f;隨機(jī)選擇一個(gè)數(shù)據(jù)來計(jì)算，而不是使用所有的數(shù)據(jù)。

轉(zhuǎn)載于:https://www.cnblogs.com/wangyanphp/p/5443254.html

以上是生活随笔為你收集整理的线性模型（3）：Logistic Regression的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。