日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Capital one TPS整理

發(fā)布時(shí)間:2025/5/22 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Capital one TPS整理 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Credit Card Fraud Detection 7 times from 2015 to 2017

What machine learning model would you use to classify fraudulent transactions on credit cards?

feature selection

how to use classification method, which one is good to use?Later there will also be a problem which method is the least useful.?

bias variance trade off -?What does regularization do?

target missing

false positive/false negative -?Are false positives or false negatives more important??What is the effect of FP and FN?

What is VIF (in regression output)?

potential issues

exploratory analysis and data cleaning

How would you handle missing or garbage data?

How would you use existing features to add new features?

Logistic regression, random forests

Difference between random forest and gradient boosted tree.

Anomaly detection/novelty detection techniques might be also helpful because of the huge data imbalance that normally exists in such scenarios.

Asked a lot of possible problems with the model and how should you deal with that when time?is limited.

Couple things to keep in mind regarding fraud:
1) you're dealing with an imbalanced data set (your fraud cases may be 3-5% of all your data). So, consider either oversampling, or giving higher weight to your fraud cases.
2) you data may not have all the true fraud cases - in other words, there maybe actual fraud cases not captured in your data. So, some form of anomaly detection may be needed.

?

預(yù)測(cè)用戶是否會(huì)注銷信用卡 -3 times in 2018

如果給你一堆dataset,比如信用卡一年的交易記錄、客戶個(gè)人信息,銀行想預(yù)測(cè)客戶會(huì)不會(huì)在一個(gè)月之內(nèi)關(guān)戶,如果會(huì)的話,銀行打算發(fā)一點(diǎn)cashback rewards給這些人挽留一下。讓你建模預(yù)關(guān)戶。??以下是面試官的問(wèn)題:

1.? ? ? ? 你會(huì)選哪些feature?(感覺(jué)是隨便說(shuō),只要有關(guān)系。追問(wèn)如果是一堆transaction的日期之類的,應(yīng)該怎樣rebuild feature)
2.? ? ? ? 怎么做data cleaning:?
? ? a.? ? ? ?? ???怎樣detect outlier?. From 1point 3acres bbs
? ? b.? ? ? ?? ???怎樣fill in missing data?(我說(shuō)可以填constant比如mean,然后他追問(wèn)填mean在什么情況下不合適、怎樣更好)
? ? c.? ? ? ?? ???如果target value也missing了怎么辦
3.? ? ? ? 你選什么model?(我說(shuō)decision tree,然后他讓我說(shuō)有沒(méi)有其他model,優(yōu)缺點(diǎn)分別是什么,target是什么。target應(yīng)該是一個(gè)binary的值whether the customer will close the account in one month,如果regression得到了0~1之間的值就代表how likely)
4.? ? ? ? 怎么看model 的performance,用什么package. From 1point 3acres bbs
5.? ? ? ? 如果data size很大有1TB,怎樣sample,用什么package. From 1point 3acres bbs
6.? ? ? ? 如果model不準(zhǔn)確,會(huì)給銀行造成什么損失?
7.? ? ? ? 如果用model predict得到了一堆target的值,應(yīng)該怎樣根據(jù)target發(fā)rewards (我說(shuō)畫個(gè)distribution,給最可能關(guān)戶的百分之幾客戶發(fā)rewards。追問(wèn)除了這種方式還有什么方式,我也不確定是考modeling還是business sense)
8.? ? ? ? 最后一個(gè)是地里看到的一模一樣的open question,兩人都有5000limit,但是一個(gè)用100%一個(gè)只用2%,這兩人有沒(méi)有可能都在一月之內(nèi)關(guān)戶。面試官應(yīng)該看你第一反應(yīng)是考慮model的問(wèn)題還是考慮其他方面。

從feature engineering 到 最后 model tuning and validation 的所有步驟。

如何建model,用了哪些parameter,結(jié)果如何 還有為什么要選這個(gè)model

credit card churn model
? ?? ?1. Feature engineering,比如從start date算出tenure 等等
? ?? ?2. Missing value
? ?? ?3. 用什么模型,為什么
? ?? ?4. 現(xiàn)在數(shù)據(jù)量加大,怎么辦?spark。如果你要選,用RSpark還是PySpark?為什么
? ?? ?5. 現(xiàn)在模型output出來(lái),一個(gè)credit limit 使用率0%的用戶和使用率95%的用戶都很危險(xiǎn),都很可能馬上就關(guān)掉信用卡,你會(huì)怎么處理?我回答churn model是起點(diǎn),一般marketing department會(huì)根據(jù)churn model的結(jié)果設(shè)計(jì)retention program。對(duì)于這兩類危險(xiǎn)用戶,需要設(shè)計(jì)不同的incentive plan。
? ?? ?? ?? ? 1)使用率0%的用戶,基本上很難挽回。
? ?? ?? ?? ? 2)使用率95%的用戶大概率可以挽回,降低利率,增加cashback等等。。。
? ?? ?? ?? ? 3)可以根據(jù)測(cè)試結(jié)果再搞個(gè)uplift model,看哪些high churn users可以挽回的,著重施加treatment。

  • tell me some useful packages you use in R/python? ?1 Answer
  • how do you detect multicollinearity? ?1 Answer
  • how do you join two data sets???

?

Other questions:

  • our sever run cost is xxx, 其他固定成本是xxx,能容納xxx TB流量。 我們大概有xxx個(gè)客戶,每個(gè)客戶交付給我們server使用費(fèi)為xxx/month。我們給每個(gè)用戶分配xxxGB,但是平均每個(gè)用戶只會(huì)用掉期中的xx%,所以我們可以把剩下的空間再去接納更多的客戶。問(wèn):每年盈利是多少?現(xiàn)有另外一種server b, cost is xxx,capacity is xxx。。。請(qǐng)權(quán)衡比較我們要不要把已有server換成server b-baidu?
  • 題目是有一個(gè)運(yùn)動(dòng)產(chǎn)品的零售商,來(lái)找你優(yōu)化他們的在線廣告競(jìng)拍系統(tǒng),提高response rate。假設(shè)你有的數(shù)據(jù)是3, 000, 000用戶的訪問(wèn)數(shù)據(jù),每行數(shù)據(jù)有150多個(gè)column,已知overall的response rate是1/1000。被問(wèn)的問(wèn)題有:
    1. 選什么作為target?
    Response or not
    2. 選什么metrics?
    AUC-ROC
    3. 怎么處理NA??
    It depends. If NA is meaningful, leave it there. If NA is missing due to data extracation, do some simple if-else condition/mean(median)/regression to fill
    4. 怎么做feature engineering??
    Encode categorical varaible, use 'groupby' and 'mean/medium/std' to generate some features
    4. 數(shù)據(jù)量特別大怎么辦?
    mapreduce,但是我沒(méi)用過(guò),就拿本地并行優(yōu)化舉了個(gè)例子,怎么分配數(shù)據(jù)給各個(gè)線程,然后怎么把數(shù)據(jù)收回來(lái)合并。
    5. 模型用什么?
    GBDT,lightGBM/XGB
    6. 怎么評(píng)估模型表現(xiàn)?
    k-fold CV
    7. Overfitting/underfitting怎么辦?
    分別討論了一下。想辦法獲取更多的數(shù)據(jù),調(diào)整hyper-parameter。
    8. 如果模型預(yù)測(cè)出了問(wèn)題,會(huì)有什么影響?
    分情況討論了一下整體上會(huì)有什么變化,對(duì)單個(gè)用戶有什么影響。

?

  • Given a dataset, how would you model it to extract a particular information. How would you architect the pipeline.

?

?

?false positive/false negative, regularization, and potential issues

轉(zhuǎn)載于:https://www.cnblogs.com/ffeng0312/p/10275071.html

總結(jié)

以上是生活随笔為你收集整理的Capital one TPS整理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产在线视频一区二区三区 | 日韩aaaaaa| 亚洲图片 欧美 | 国产精品黑人一区二区三区 | 亚洲精品99久久久久中文字幕 | 国产免费av网址 | 久久免费精品国产 | 国产女同91疯狂高潮互磨 | 香蕉视频链接 | 少妇精品久久久久久久久久 | 男女在线观看视频 | 最新av导航 | 国产一区二区视频免费在线观看 | www.69av.com| 黄色一级视频 | 欧美一级生活片 | 在线视频精品一区 | 国产色爱 | 黄色免费大片 | 香蕉视频国产在线观看 | 丰满人妻一区二区三区四区 | 97看片网 | 久久噜噜色综合一区二区 | 国产成人精品视频一区二区 | 亚洲毛片在线播放 | 日韩视频免费观看 | 亚洲人成高清 | 亚洲第6页| 美女黄色小视频 | 91精品久久香蕉国产线看观看 | 中文字幕日韩专区 | 国产乱子伦视频一区二区三区 | 日韩一区二区免费播放 | 亚洲一区精品在线观看 | 天天综合在线视频 | 91无套直看片红桃 | 国产精品国产精品国产专区不卡 | 性高潮久久久久久 | 精品偷拍一区 | 亚洲欧美一二三 | 免费三级网 | jizz欧洲 | 欧美性在线观看 | 国产精品9999| 麻豆美女视频 | 美腿丝袜一区二区三区 | 日韩欧美视频一区二区三区 | 精品三级电影 | 激情五月激情综合网 | 国产传媒av在线 | 懂色av一区二区三区蜜臀 | 美女屁股眼视频免费 | 免费黄色网址在线 | 91精品国产乱码久久久 | 国产精品麻豆欧美日韩ww | 日韩精品色哟哟 | av新天堂 | 国产精品啪 | 偷拍女澡堂一区二区三区 | 欧美手机在线 | 中文字幕一级二级三级 | 国产伦精品一区二区三区 | 久久6精品 | 黄a在线观看 | 免费中文字幕在线观看 | 欧美精品久久久久久久久老牛影院 | 免费做a爰片77777 | 成年网站在线观看 | 久久久噜噜噜久久久 | 麻豆入口 | 国产伦精品一区二区三区千人斩 | 毛片av网站 | 在线成年人视频 | 丰满人妻中伦妇伦精品app | 日韩wwww | 免费毛片视频 | 成熟妇人a片免费看网站 | 国产乱子伦一区二区 | 欧美一区二区三区系列电影 | 69精品久久久久久久 | 污视频在线免费观看 | 绯色av蜜臀vs少妇 | 狠狠操狠狠操狠狠操 | 夜夜精品视频 | 精品一区二区三区中文字幕 | 国产日日日 | 伊人9| 国产精品www. | 超级黄色录像 | 欧美一级二级片 | 欧美日韩www| 国产亚洲成av人片在线观看桃 | 国产在线精品视频 | 亚洲av无码乱码国产精品久久 | 成 人 黄 色 片 在线播放 | 国产精品高潮呻吟久久aⅴ码 | 波多野吉衣av无码 | 国产一区二区三区精品愉拍 | a中文字幕 |