【图解】ROC曲线
參考文章:
http://blog.csdn.net/l18930738887/article/details/46681597
http://blog.csdn.net/u010159842/article/details/49562885
待補(bǔ)充...
曲線及部分應(yīng)用,如有任何問題或錯(cuò)誤歡迎各位留言~~
一、隨機(jī)選取用戶營(yíng)銷的解釋(隨機(jī)線)
橫軸:營(yíng)銷用戶數(shù)(假設(shè)有1000萬用戶數(shù)手機(jī)號(hào))
縱軸:有響應(yīng)的用戶數(shù)(假設(shè)如果1000萬全部發(fā)短信營(yíng)銷,最高會(huì)有100萬人響應(yīng))
即總體響應(yīng)的用戶數(shù)占營(yíng)銷用戶數(shù)的10%。
如果我們隨機(jī)抽取營(yíng)銷用戶數(shù)做短信營(yíng)銷時(shí),得到結(jié)果應(yīng)該接近于總體概率。即:
| 營(yíng)銷人數(shù)(萬) | 隨機(jī)響應(yīng)人數(shù)(萬) |
| 0 | 0 |
| 200 | 20 |
| 400 | 40 |
| 600 | 60 |
| 800 | 80 |
| 1000 | 100 |
?
計(jì)算機(jī)根據(jù)相應(yīng)的點(diǎn)形成隨即抽取曲線,即為未做模型的情況下隨機(jī)生成的用戶營(yíng)銷數(shù)據(jù)輸入輸出的對(duì)應(yīng)折線。
二、模型線解釋
通常計(jì)算機(jī)通過用戶的信息(如地理位置,收入情況,訪問網(wǎng)站產(chǎn)品的行為),進(jìn)而判斷哪些人更可能對(duì)短信進(jìn)行響應(yīng),依次排序,把可能性高的用戶排在最前面先進(jìn)行營(yíng)銷。然后得到以下數(shù)據(jù):
| 營(yíng)銷人數(shù)(萬) | 隨機(jī)響應(yīng)人數(shù)(萬) | 模型響應(yīng)人數(shù)(萬) |
| 0 | 0 | 0 |
| 200 | 20 | 30 |
| 400 | 40 | 55 |
| 600 | 60 | 70 |
| 800 | 80 | 90 |
| 1000 | 100 | 100 |
計(jì)算機(jī)根據(jù)相應(yīng)的點(diǎn)形成模型響應(yīng)曲線
如果我們要向1000萬人全部發(fā)送短信營(yíng)銷時(shí),模型與隨機(jī)線沒有區(qū)別.
如果我們只有營(yíng)銷500萬人次的短信成本時(shí),采用模型線即可讓我們的效率比隨機(jī)抽樣大幅度提高。隨機(jī)響應(yīng)50萬人,模型響應(yīng)80萬人。
這也就是為什么我們要用模型去做營(yíng)銷。
?
總結(jié)ROC曲線的用處:
用來判斷模型的好壞,ROC是一個(gè)非常重要的指標(biāo)。曲線越是靠向左上角,那么模型對(duì)于業(yè)務(wù)也就更有用處。
?
接下來的問題是:
我們?cè)趺慈グ堰@個(gè)模型曲線做得好呢?答案就是用準(zhǔn)確的字段及算法.
對(duì)于計(jì)算機(jī)我們給予它相關(guān)的字段信息及算法時(shí),它就能做出相應(yīng)的預(yù)測(cè)。關(guān)于字段選取及算法選取請(qǐng)看其他相關(guān)文章~~
總結(jié)
- 上一篇: 【图解】梯度下降
- 下一篇: 【总结】分类、聚类的评估指标