當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

3. 机器学习中为什么需要梯度下降_机器学习中一些模型为什么要对数据归一化？...

發布時間：2025/3/15 编程问答 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 3. 机器学习中为什么需要梯度下降_机器学习中一些模型为什么要对数据归一化？... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一般做機器學習應用的時候大部分時間是花費在特征處理上，其中很關鍵的一步就是對特征數據進行歸一化，為什么要歸一化呢？很多同學并未搞清楚，維基百科給出的解釋：

1）歸一化后加快了梯度下降求最優解的速度

藍色的圈圈圖代表的是兩個特征的等高線。其中左圖兩個特征X1和X2的區間相差非常大，X1區間是[0,2000]，X2區間是[1,5]，其所形成的等高線非常尖。當使用梯度下降法尋求最優解時，很有可能走“之字型”路線（垂直等高線走），從而導致需要迭代很多次才能收斂；

而右圖對兩個原始特征進行了歸一化，其對應的等高線顯得很圓，在梯度下降進行求解時能較快的收斂。

因此如果機器學習模型使用梯度下降法求最優解時，歸一化往往非常有必要，否則很難收斂甚至不能收斂。

2）歸一化有可能提高精度

一些分類器需要計算樣本之間的距離（如歐氏距離），例如KNN。如果一個特征值域范圍非常大，那么距離計算就主要取決于這個特征，從而與實際情況相悖（比如這時實際情況是值域范圍小的特征更重要）。

歡迎關注我的公眾號，第一時間追蹤相關面試題和總結：百面機器學習。回復干貨獲取相關資料和面試題總結(定期更新)。

處理數據時不進行歸一化會有什么影響？歸一化的作用是什么？什么時候需要歸一化？有哪些歸一化的方法？機器學習中為什么需要對數據進行歸一化？ - CSDN博客為什么要特征標準化 (機器學習) （簡單理解一下標準化的意思）

概率模型不需要歸一化，因為它們不關心變量的值，而是關心變量的分布和變量之間的條件概率，如決策樹、rf。而像adaboost、gbdt、xgboost、svm、lr、KNN、KMeans之類的最優化問題就需要歸一化。(小伙伴要記清楚哦，或者用sklearn里面的庫跑一下模型看看呢)

筆者只是一些問題的搬運工，具體需要對問題進行深入的小伙伴還望自己閱讀相關文獻，這里只是提出一些問題，以便于面試時問到，如果內容有一些錯誤，還望批評指正！

米娜 Thanks?(･ω･)ﾉ

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。