日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

分计算iv值_筛选变量的指标—IV值

發布時間:2024/9/27 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分计算iv值_筛选变量的指标—IV值 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這一期咱們聊聊篩選變量的指標——IV值。

計算公式如下:

看公式有沒有很熟悉,大家沒有看錯,其中一部分就是WOE的計算公式。區別就在于WOE是對一個變量的每個分組的計算,IV值是對一個變量的統計指標。

如上圖所示,當前使用率的IV值為1.415。

IV值的作用就是衡量一個變量整體的預測能力,好處在于每個變量的IV值是可比的。所謂的IV值(informationvalue),指的是一個變量對于判定客戶屬于y1還是y0的信息貢獻,貢獻越大,IV值越大。

然而,我們僅從公式就可以看出,對于同一個變量來說,分組分的越多,它的IV值自然越大。但是分組過多會產生另外一個問題,每個分組的數據量會變少,導致每個分組不穩定。所以我們在進行變量分箱時不能只考慮提高變量的IV,也要兼顧穩定性與業務意義。

在進行變量初篩的時候,可以直接將IV值小于0.02的變量剔除,不參與后面的算法擬合過程。這些變量即使進入變量擬合庫,對判定客戶的貢獻也基本上等于沒有。

好了,這期就先聊到這里,下期再見!

總結

以上是生活随笔為你收集整理的分计算iv值_筛选变量的指标—IV值的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。