日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

逻辑回归 | 使用 sklearn.linear_model.LogisticRegression 预测不同职业的人优惠券使用情况

發(fā)布時間:2024/6/21 综合教程 34 生活家
生活随笔 收集整理的這篇文章主要介紹了 逻辑回归 | 使用 sklearn.linear_model.LogisticRegression 预测不同职业的人优惠券使用情况 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

邏輯回歸:

  是一種廣義的線性回歸分析模型

  邏輯回歸針對的目標變量是類別型的,參數估值上,采用最大似然法。

  分類問題可以轉換成概率的都是邏輯回歸的常見場景,如:

    會不會逾期(風控)

    會不會是流失客戶(會員運營)

    會不會點擊(CTR預估、推薦系統(tǒng)、搜索)

  優(yōu)點:模型簡單、可解釋性強

  缺點:不能做特征交叉

代碼演示

需求:探究不同職業(yè)的人使用優(yōu)惠券的可能

1 數據預處理

注意:剔除異常值、處理缺失值,排除共線性問題

1.1 本文數據預覽

1.2 過采樣處理樣本不均衡問題處理

1.2.1 選定自變量 因變量

x = df[['job_admin.', 'job_blue-collar', 'job_entrepreneur',
        'job_housemaid', 'job_management', 'job_retired', 'job_self-employed',
        'job_services', 'job_student', 'job_technician', 'job_unemployed',
        'job_unknown']]
y = df['coupon_ind']

1.2.2 查看是否均衡,發(fā)現樣本不均衡

也可以使用 df.coupon_ind.value_counts() 來查看

1.2.3 進行過采樣處理

from imblearn.over_sampling import SMOTE
smo = SMOTE(random_state=11)
x, y= smo.fit_sample(x, y)

2 劃分訓練集、測試集

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(
    x, y, test_size=0.3, random_state=11)

3 邏輯回歸模型

from sklearn.linear_model import LogisticRegression
lr = LogisticRegression()
lr.fit(x_train, y_train)

# 回歸系數
lr.coef_
# 截距
lr.intercept_

4模型評估

4.1 使用模型進行預測

y_pred_train = lr.predict(x_train)
y_pred_test = lr.predict(x_test)

4.2 查看得分

from sklearn.metrics import accuracy_score
accuracy_score(y_train, y_pred_train)

4.3 查看召回率

from sklearn.metrics import auc, roc_curve
fpr, tpr, _ = roc_curve(y_train, y_pred_train)
roc_auc = auc(fpr,tpr)
roc_auc

總結

以上是生活随笔為你收集整理的逻辑回归 | 使用 sklearn.linear_model.LogisticRegression 预测不同职业的人优惠券使用情况的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。