日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

拒绝推断问题(转)

發(fā)布時(shí)間:2025/3/15 编程问答 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 拒绝推断问题(转) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

拒絕推斷(Reject Inference)是金融領(lǐng)域信用評分中的一個(gè)術(shù)語。對于要向銀行借錢的人,我們需要考慮他們賴賬的可能性。這樣就需要根據(jù)他們的各種行為信息和人口統(tǒng)計(jì)學(xué)特征作為輸入,來建立一個(gè)信用評分模型,這個(gè)建模過程與機(jī)器學(xué)習(xí)中訓(xùn)練一個(gè)模型類似。機(jī)器學(xué)習(xí)算法能夠成功應(yīng)用的一個(gè)條件是訓(xùn)練樣本和測試樣本有相同的分布,但在信用評分中,這個(gè)條件很難保證。信用評分的訓(xùn)練樣本均來自于以前申請貸款被接受的那些人,而評分模型則是要應(yīng)用到所以來申請貸款的人,并幫助做出接受/拒絕的決定。因此,模型不光要針對被接受的那些人,也要在被拒絕的那部分上面表現(xiàn)得好。可以想見,這兩種人在輸入空間上的分布是完全不同的,這就導(dǎo)致使用了部分?jǐn)?shù)據(jù),但是為估計(jì)總體而建立的信用評分模型存在參數(shù)估計(jì)的偏差。拒絕推斷就是要把被拒掉那部分用戶能夠識別出來到底是好客戶還是壞客戶,然后加入到模型訓(xùn)練中,使得模型的樣本盡量接近總體的分布。這就是拒絕推斷要解決的。

?


在其他更加“機(jī)器學(xué)習(xí)化”的領(lǐng)域,例如計(jì)算廣告,也會有被稱為selection bias的類似問題存在。一般來說,網(wǎng)絡(luò)廣告點(diǎn)擊率模型是根據(jù)廣告本身、所出現(xiàn)的場景以及用戶信息三者建立的,期望是能挑出那些被點(diǎn)擊概率高的廣告展示出來以改善用戶體驗(yàn)并獲得更高的廣告提成。顯然,建這樣的模型需要廣告的"被點(diǎn)擊/不被點(diǎn)擊"的信息作為模型的目標(biāo)變量。只有那些歷史上出現(xiàn)過的"廣告-場景-用戶"三元組,才會有被或不被點(diǎn)擊的信息;從來沒有出現(xiàn)過的三元組不會出現(xiàn)在訓(xùn)練數(shù)據(jù)中——它們是被已存在的點(diǎn)擊率模型篩選過的。而優(yōu)化點(diǎn)擊率模型時(shí),總是要面對新廣告和新用戶,并且嘗試新的廣告/場景匹配會不會更好,因此測試數(shù)據(jù)的分布不會和訓(xùn)練數(shù)據(jù)一致。
對于計(jì)算廣告來說,這個(gè)問題好解決一些。我們可以把一小部分流量做成不經(jīng)過模型篩選的"自然流量“,采用簡單的諸如競價(jià)排名之類的策略。這樣用戶體驗(yàn)的影響不大,而利潤幾乎也沒什么損失。這部分流量累積下來的數(shù)據(jù)可以在模型訓(xùn)練中賦予更高的權(quán)重,因?yàn)槟撤N意義下它們和測試數(shù)據(jù)"更加接近"。但在金融行業(yè),要說服管理層開放這樣的"自然流量"絕非易事。并且相對互聯(lián)網(wǎng)廣告,信貸的樣本要少得多,即使有一些這樣的"自然流量"樣本,它們能起的作用也有限。所以有必要從另外的角度考慮問題的解決方法。
下面我首先會總結(jié)一些信用評分中常用的拒絕推斷的方法。這些方法往往是比較ad-hoc的思路,或者有少許的統(tǒng)計(jì)學(xué)理論作為支撐。即使是經(jīng)常在使用這些方法的信用評分建模專家,往往也對它們并不信服。然后我會看看機(jī)器學(xué)習(xí)的相關(guān)文獻(xiàn)中對付selection bias的方法——這些方法一般是基于半監(jiān)督學(xué)習(xí)(semi-supervised learning)這一理念的——并且檢查它們是否能用到信用評分的拒絕推斷中。

?常用方法:

來源:https://www.douban.com/note/410573602/?type=like

轉(zhuǎn)載于:https://www.cnblogs.com/gczr/p/10084252.html

總結(jié)

以上是生活随笔為你收集整理的拒绝推断问题(转)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。