日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

第五章 逻辑回归模型在评分卡开发中的应用

發布時間:2025/4/5 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 第五章 逻辑回归模型在评分卡开发中的应用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

邏輯回歸模型在評分卡開發中的應用

課程簡介:在分類場景中,邏輯回歸模型是常用的一類算法。它具有結構簡單、可解釋性強、輸出結果是"軟分類"的特點。評分模型多采用這類算法。同時邏輯回歸模型也面臨一些限制,因此在特征工程階段我們對輸入特征做了相應的調整和約束。

目錄:

  • 邏輯回歸模型的基本概念
  • 基于邏輯回歸模型的評分卡構建工作
  • 尺度化

1. 邏輯回歸模型的基本概念

  • 伯努利概型

在分類模型中,目標變量是離散、無序型的變量。例如,違約預測模型中的目標變量(也稱為標簽)是{違約,非違約}。線性回歸模型無法對這類標簽進行建模,因為線性回歸模型的結果的取值空間是整個實數空間.對于分類模型而言,我們建模的對象是每個類別在某條樣本上出現的概率。

伯努利概型

某個事件有"發生"與"不發生"兩種互斥的狀態。假設該事件發生的概率為,不發生的概率即為.我們用1和0表示事件的發生與不發生,則有:

可以統一成

邏輯回歸模型與logistic變換

在違約預測場景中,單個個體的違約事件可以看成伯努利概型:

參數即是我們需要預測的目標。

如果對概率做擬合?

概率的取值范圍是0~1.如前所述,線性回歸的目標變量的取值空間是整個實數空間,因此不適合用線性回歸模型做預測。引入下面的logistic變換(也稱為sigmoid函數),能夠是的擬合的目標函數的取值范圍限定在0~1:

邏輯回歸模型與logistic變換(續)

的特點

  • 單調性,即>
  • 有界性,即
  • 可導性,即

除此之外,還有一個計算上的優勢,即

  • 邏輯回歸模型與logistic變換(續)

由于logistic變換有上述種種優點,我們將該變換應用在概率的刻畫當中:

其中分別表示第i個觀測值上p個特征的取值和特征的權重。

于是整個邏輯回歸模型的形式為:

需要注意的是,這里的回歸模型是對違約概率做回歸,而非對違約結果{0,1}做回歸。

  • 參數估計

通常用極大似然估計法(MLE)求出邏輯回歸的參數

對于樣本,邏輯回歸模型的似然函和對數似然函數分別為

參數估計的結果是為了讓似然函數最大化。由于對數似然函數與似然函數單調上升且具有更緊湊的形式,同時也易于求導運算,因此將似然函數最大化轉化為對數似然函數最大化,即

對求偏導,結果是

顯然,的方程是沒有解析解的。

無法得到解析解的情況下,只能通過數值求解的方式來計算參數的估計。常用梯度上升法來迭代地計算?;镜乃惴ú襟E如下:

  • 初設化參數和步長
  • 計算當前梯度:
  • 更新參數:
  • 直至滿足終止條件
  • 注:

    根據計算梯度使用的樣本量的多少,梯度上升法分為批量梯度上升法、隨機梯度上升法與小批量梯度上升法。

    • 邏輯回歸模型的優點

    結構簡單:

    • 變量之間的關系是線性可加關系

    可解釋性高:

    • 結構簡單;輸入變量對目標變量的影響是容易獲得的

    支持增量訓練:

    • 無需讀入全部數據,可增量式地讀取數據、訓練模型

    給出概率而非判別類別:

    • 模型的結果是估計出屬于某一類的概率,可用于更加復雜的決策

    工程化相對容易:

    • 模型的測試、部署、監控、調優等工作相對簡單

    邏輯回歸模型的不足

    預測精度一般

    • 由于模型結構較為簡單,導致預測精度不如其他模型

    對變量要求高

    • 輸入變量需數值類型,需要對非數值變量進行編碼
    • 不能容忍缺失值,需要對缺失值做處理
    • 對異常值敏感,需要對異常值做處理
    • 變量尺度差異較大時,容易對模型有影響,需要做變量歸一化
    • 變量間的線性相關性對模型有影響,需要做變量挑選或加上正則項

    2.基于LR模型的評分卡構建工作

    邏輯回歸模型對變量的要求

    當用邏輯回歸模型來構建評分卡時,入模變量需要滿足以下條件

  • 變量間不存在較強的線性相關性和多重共線性
  • 變量具有顯著性
  • 變量具有合理的業務含義,即變量對于風控業務是正確的
  • 其中,第1點已經在單變量分析與多變量分析中得到一定的約束,但是未必充分。

    關于第2點,需要從系數的p值進行檢驗

    關于第3點,需要從系數的符號進行檢驗

    • 變量顯著性

    為了獲取與目標變量(即違約標簽)有較高相關性的變量,我們要求最終入模的變量的系數的p值很小,例如低于0.1。如果發現模型中某些變量不顯著,需要檢驗一下兩種可能性:

  • 該變量本身不顯著
  • 該變量顯著,但是由于有一定的線性相關性或者多重共線性,導致該變量在多元回歸下不顯著
  • 先檢驗1的可能性,如果排除,再檢驗2.

    檢驗1的方法:

    將該變量單獨與目標變量做邏輯回歸模型,如果在單變量回歸的情況下系數的p值仍然較高,即表明該變量本身的顯著性很低。

    注:

    對于IV較高的變量,1的可能性較低。

    • 變量正確性

    在WOE的計算公式中,

    當WOE為負時,表明當前箱的"危險性"高于平均樣本的"危險性",出現壞樣本的概率更高。因此在邏輯回歸模型中,所有變量對應的系數應該為負。

    反之,如果采取的WOE的計算公式為:

    同理,所有變量對應的系數應該為正。

    • 邏輯回歸模型對變量的要求(續)

    • 特征選擇

    從上述的單變量回歸中可以發現,在full regression中,不顯著、不正確的變量是由于線性相關性引起的。因此需要在做一次變量挑選。變量挑選的目的是為了滿足:

  • 入模變量正確并且顯著
  • 入模變量的"重要性"是最高的
  • 其中,我們可以用IV來衡量入模變量的重要性。

    綜上,變量挑選的步驟如下:

  • 將變量根據IV進行降序排列,不妨設為,其中""代表重要性的次序
  • 當前的入模變量集合為{}
  • 從剩余的變量中挑選第一個變量放入上一步的集合中,建立回歸模型。如果該模型的所有的變量都滿足p值小于閾值、系數為負,則在入模變量集合中保留該變量,否則剔除
  • 遍歷所有變量
    • 尺度化

    得到符合要求的邏輯回歸模型后,通常還需要將概率轉化成分數。分數的單調性與概率相反,即分數越高表明違約的概率越低,信用資質越好。在評分卡模型中,上述過程稱為"尺度化",轉換公式為:

    其中,, : point to double odds

    PDO的作用

    假設當前的好壞比為, 對應的分數為.

    當好壞比上升一倍時變為2, 即=y-ln2, 此時分數變為

    因此,PDO的含義即為,當好壞比上升1倍時,分數上升PDO個單位。

    Base Point的選擇

    要滿足所有的評分的取值為正。

    總結

    以上是生活随笔為你收集整理的第五章 逻辑回归模型在评分卡开发中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 久久久一级片 | 日韩精品免费一区二区三区 | 久久一本综合 | 国产精品美女一区二区 | 老司机深夜福利视频 | 国产激情无码一区二区三区 | 国内外成人免费视频 | 3d动漫精品啪啪一区二区免费 | 午夜精品久久久久久久99黑人 | 久久久久久久久久久久久久久 | 日本aⅴ在线观看 | 日韩中文字幕一区二区 | 懂色av一区二区三区 | 91免费在线观看网站 | 日日爱886 | 欧美日韩一二三区 | 日韩影院在线 | 欧美 日韩 人妻 高清 中文 | 激情综合五月网 | 久久久精品人妻一区二区三区四 | 久久国内精品视频 | 致单身男女免费观看完整版 | 日韩精品视频观看 | 国产成人精品一区二三区四区五区 | 日韩一区不卡 | 欧美极品喷水 | 日韩少妇内射免费播放18禁裸乳 | 欧美性受xxxx黑人xyx性爽 | 蜜桃视频在线观看一区二区 | 色四虎| 国产精品成人久久久 | 黄色男女网站 | 福利视频在线看 | 暴操白虎 | 捆绑japanhdxxxxvideos | 久艹伊人| 日韩在线观看视频一区二区三区 | 懂色av中文一区二区三区天美 | 免费涩涩视频 | 热久久最新 | 老司机深夜免费福利 | 免费精品一区 | 五月天黄色网 | 国产真实乱人偷精品 | 一本—道久久a久久精品蜜桃 | 亚洲一区精品视频在线观看 | 亚洲网在线 | 日本中文字幕成人 | 97在线观看免费视频 | 中文字幕第一区 | 91久久精品在线 | 乳揉みま痴汉4在线播放 | 久精品在线观看 | 欧美第一页浮力影院 | 性欧美bbw| 亚洲一区二区三区 | 日本一区视频在线观看 | 99在线免费视频 | 日韩电影一区二区在线观看 | 成年人网站黄 | 色欧美片视频在线观看 | 欧美性xxxx在线播放 | 亚洲av无码一区二区三区性色 | 福利在线免费 | 亚洲爽片 | jzzjzzjzz亚洲成熟少妇 | 国产农村乱对白刺激视频 | 亚洲第一偷拍 | 久久aaa| 在线观看成年人视频 | 性欧美www| 牛牛影视av| √8天堂资源地址中文在线 欧美精品在线一区二区 | 韩国三级中文字幕hd浴缸戏 | 超碰在线人人干 | av大片网站| 蜜乳av一区二区 | 日韩女同一区二区三区 | 激情片网站 | 免费在线一区二区 | 国产资源站 | 成人在线免费观看网站 | 欧美理论在线观看 | 牲欲强的熟妇农村老妇女视频 | 亚洲一区免费电影 | 少妇野外性xx老女人野外性xx | 女女百合高h喷汁呻吟玩具 www.亚洲一区 | 日韩视频国产 | 99re在线观看视频 | 久久精品一区二区三区四区 | 美女脱了内裤喂我喝尿视频 | 国产精品不卡在线 | 成人在线视频网址 | 日本国产欧美 | 久久久精品日本 | 男男gay同性三级 | 成人在线一区二区三区 | 曰批又黄又爽免费视频 | 国产女人18毛片水真多 |