语言nomogram校准曲线图_预测模型的概率校准
1.背景
機器學習分為:監(jiān)督學習,無監(jiān)督學習,半監(jiān)督學習(也可以用hinton所說的強化學習)等。在這里,先簡要介紹一下監(jiān)督學習從給定的訓練數(shù)據(jù)集中學習出一個函數(shù)(模型參數(shù)),當新的數(shù)據(jù)到來時,可以根據(jù)這個函數(shù)預測結(jié)果。監(jiān)督學習的訓練集要求包括輸入輸出,也可以說是特征和目標。訓練集中的目標是由人標注的。監(jiān)督學習就是最常見的分類(注意和聚類區(qū)分)問題,通過已有的訓練樣本(即已知數(shù)據(jù)及其對應(yīng)的輸出)去訓練得到一個最優(yōu)模型(這個模型屬于某個函數(shù)的集合,最優(yōu)表示某個評價準則下是最佳的),再利用這個模型將所有的輸入映射為相應(yīng)的輸出,對輸出進行簡單的判斷從而實現(xiàn)分類的目的。也就具有了對未知數(shù)據(jù)分類的能力。監(jiān)督學習的目標往往是讓計算機去學習我們已經(jīng)創(chuàng)建好的分類系統(tǒng)(模型)。常見的有監(jiān)督學習算法:回歸分析和統(tǒng)計分類。
腫瘤預測模型是一個有監(jiān)督學習模型,通過事先標注好的訓練集,患者是否發(fā)生結(jié)局,患者信息等,訓練一個COX模型,或者其他回歸模型,在訓練的模型基礎(chǔ)上進行預測輸出。在預測模型搭建過程中,由于抽樣與正則化的原因,導致模型輸出的概率值明顯偏離真實的概率值。這時候我們稱這些模型直接輸出的概率值是定序值,而非定距數(shù)值,可比較大小,但其絕對值并無太多含義。那么如何將模型輸出的prob校準到真實的逾期概率呢。使得經(jīng)過校準后的概率變成逾期概率的意義。比如預測模型預測某個樣本屬于正類的概率是0.8,那么就應(yīng)當說明有80%的把握認為該樣本屬于正類,或者100個概率為0.8的里面有80個確實屬于正類。根據(jù)這個關(guān)系,可以用測試數(shù)據(jù)得到Probability
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的语言nomogram校准曲线图_预测模型的概率校准的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 生源地助学贷款8000利息每年多少
- 下一篇: w3c html5 客户端缓存数据格式,