统计学习方法 第一章 学习心得
生活随笔
收集整理的這篇文章主要介紹了
统计学习方法 第一章 学习心得
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
統計學習方法?第一章 學習心得 以下可能有不當之處,請各位朋友停步指正,先謝過各位。 上一帖子說道,統計學習方法的三要素: 模型、策略、算法. 模型:模型的假設空間 策略:模型的選擇準則,即:定義最優模型的方法。 算法:模型學習的算法,也就是求解最優模型的算法。 ------------------------------------------------------------------- 通俗的講,應用統計學習方法有以下幾個步驟, 1.首先,要對已有數據進行分析,選擇合適的能夠對該數據集的規律進行描述的(帶未知參數的)方程 或者說 函數,此時是第一步,也是很重要的一步。--->也叫模型的假設空間 2.然后,由于在第一步中的函數(也叫模型的假設空間)還帶有未知參數,同時它的預測能力也未可知,因此我們需要一個自動評價其優劣性的方法,即:在什么情況下,我們認為其未知參數的選定是好的,什么情況下是壞的,這樣我們就有了一個評判標準,能夠想辦法使得結果越來越貼近真實。我們稱其為策略(模型選擇的準則)。 3.最后,有了模型(帶參數的函數、假設空間),有了評判標準,當然數據集一直在的,這樣我們就可以利用計算機驚人的、快速的、重復的、永不疲倦的計算能力找到模型的最優參數(是否最優,需要根據策略來評定)。 這樣,我們求解到了模型就可以對數據進行預測、分類了。 ,接著又衍生了另外一個問題,模型預測能力的評定,以及在數據集不夠的情況下如何最大效率的利用好有限的數據集? 1.在上一步的模型求解過程當中,我們有損失函數來描述模型的策略,評判模型的好壞,此時如何對已經習得的模型預測能力進行評測呢 由于如果一味追求對訓練數據的預測能力,所選擇的模型的參數過多,復雜度比真實模型高,造成了一種特殊的現象,即: 模型對訓練數據的預測能力很好,但對未知數據的預測能力很差。 所以我們需要有一種方法來評定模型對未知數據的預測能力,而不能僅僅盯著模型確定時的預測能力。 用泛化能力來描述模型對于未知數據的預測能力。 2.高效利用數據集的方法 交叉驗證
轉載于:https://www.cnblogs.com/ToDoToTry/archive/2013/02/26/2934019.html
總結
以上是生活随笔為你收集整理的统计学习方法 第一章 学习心得的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql优化 mysql.ini优化
- 下一篇: eclipse+pydev添加已存在dj