日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

逻辑回归 - sklearn (LR、LRCV、MLP、RLR)- Python代码实现

發布時間:2024/7/5 python 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 逻辑回归 - sklearn (LR、LRCV、MLP、RLR)- Python代码实现 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

LR(LogisticRegression) - 線性回歸

LRCV(LogisticRegressionCV )- 邏輯回歸

MLP(MLPRegressor) - 人工神經網絡

RLR(RandomizedLogisticRegression)-隨機邏輯回歸


logistic回歸--因變量一般有1和0兩種取值,將因變量的取值范圍控制再0-1范圍內,表示取值為1的概率。

數據源一般是這種類型(其中前8列是自變量,最后一列是因變量,因變量一般是0/1):

年齡婚姻狀況子嗣工齡住宅類型房產類型月收入合同金額是否逾期
4721254312800506270
402171150000285731
452185440000570881
55211054150000588351
373172140000571461
622121215600428591
38325432800547170

在sklearn?,與邏輯回歸有關的主要有三類:LogisticRegression(LR)、LogisticRegressionCV (LRCV)、logistic_regression_path。

LR和LRCV的主要區別是LRCV使用了交叉驗證來選擇正則化系數C,而LR需要自己每次指定一個正則化系數。例如這樣:

model = LogisticRegression(C=0.000001);除此之外,兩者用法基本相同。

logistic_regression_path比較特殊,它只能提供邏輯回歸后最佳擬合函數的系數,不能直接給出預測結果,這有點不潮流。因此這里不做講述,對比一些其他網站會發現,logistic_regression_path只是作為一個名字存在了。

除了上述三個類之外,這里還講到了MLPRegressor(MLP)和RandomizedLogisticRegression(RLR)。

MLP即多層感知器,是一種前向結構的人工神經網絡,映射一組輸入向量到一組輸出向量(如下圖所示)。但是由于MLP的學習過程過于簡單,大家一般不會單獨拿來用,但是對于deep learning新手來說,還是可以入個門的。

?RLR看起來特別像LR的兄弟,但是RLR屬于維度規約的算法類,不屬于我們常說的分類算法的范疇。在本例中,由于我們選擇了8個自變量,但是其中或許有不必要的自變量,我們需要通過維度規約(降維)來丟棄無用的自變量,這樣可以降低算法存儲量和時間的復雜度,優化模型。

LR(LogisticRegression) - 線性回歸

LogisticRegression 的官方文檔地址

代碼實現:

# -*- coding:utf-8 -*- from __future__ import division import pandas as pddatafile = u'E:\\pythondata\\data\\ycshk2.csv'#文件所在位置,u為防止路徑中有中文名稱,此處沒有,可以省略 data = pd.read_csv(datafile)#datafile是excel文件,所以用read_excel,如果是csv文件則用read_csvx = data.iloc[:,:8].as_matrix()#第1列到第7列的所有行 selection = [v for v in range(len(x)) if v % 10 != 0]#訓練集所在的行數,只是一個索引,沒有取到對應行的數據 selection2 = [v for v in range(len(x)) if v % 10 == 0]#每隔10行取一行作為檢驗集,v表示所在的行數,只是一個索引,沒有取到對應行的數據 x2 = x[selection, :]#訓練集數據-因素 x3 = x[selection2, :]#檢驗集數據-因素y = data.iloc[:,-1:].as_matrix()#最后一列 y2 = y[selection, :]#訓練集數據-結果 y3 = y[selection2, :]#檢驗集數據-結果 print(x2) print(y2)from sklearn.linear_model import LogisticRegression as LR#創建邏輯回歸對象(3種情況:1.自設參數;2.balanced; 3.默認參數 ########################################################### 1 .自己設置模型參數 #penalty = {0: 0.2, 1: 0.8} #lr = LR(class_weight = penalty)#設置模型分類的權重為penalty# 2. 選擇樣本平衡-balanced #lr = LR(class_weight='balanced')#樣本平衡# 3. 默認參數,class_weight=none lr = LR() ############################################################### 調用LogisticRegression中的fit函數/模塊用來訓練模型參數 lr.fit(x2, y2) print(u'邏輯回歸模型篩選特征結束。')#通過檢驗集和預測模型來判斷準確率 y22 = lr.predict(x2)#用訓練集x2的數據通過模型進行預測,結果儲存在變量y22中。 print(u'模型的平均準確率(訓練集)為:%s'% lr.score(x2, y2))#使用邏輯回歸模型自帶的評分函數score獲得模型在測試集上的準確性結果。 print(u'模型的平均準確率(訓練集,y=0)為:%s'% (sum(y22[i] == 0 for i,v in enumerate(y2) if v == 0) / sum(1 for i,v in enumerate(y2) if v == 0))) print(u'模型的平均準確率(訓練集,y=1)為:%s'% (sum(y22[i] == 1 for i,v in enumerate(y2) if v == 1) / sum(1 for i,v in enumerate(y2) if v == 1))) #上述準確率計算的解釋:enumerate()表示遍歷y2中的數據下標i和數據v,若y2[i]=v==0,且y22[i]==0,則求和, #類似統計在預測變量y22中,預測結果與原結果y2是一致為0的個數,除以y2中所有為0的個數,得到預測變量y22的準確率y32 = lr.predict(x3)#用檢驗集x3的數據通過模型進行預測,結果儲存在變量y32中。 print(u'模型的平均準確率(檢驗集)為:%s'% lr.score(x3, y3))#使用邏輯回歸模型自帶的評分函數score獲得模型在測試集上的準確性結果。 print(u'模型的平均準確率(檢驗集,y=0)為:%s'% (sum(y32[i] == 0 for i,v in enumerate(y3) if v == 0) / sum(1 for i,v in enumerate(y3) if v == 0))) print(u'模型的平均準確率(檢驗集,y=1)為:%s'% (sum(y32[i] == 1 for i,v in enumerate(y3) if v == 1) / sum(1 for i,v in enumerate(y3) if v == 1)))print(lr)#查看模型 print(lr.coef_)#查看模型的最佳擬合曲線各變量的參數 print(lr.intercept_)#查看模型的最佳擬合曲線的截距(常數項)#y2 = lr.predict_proba(x)

準確率對比:

1.自設參數:模型的平均準確率為:0.9563838146700168

2.banlance:模型的平均準確率為:0.5679417157381089

3.默認參數:模型的平均準確率為:0.9563838146700168

權重怎么設置和業務緊密相關,但是在這里我的自設參數和默認參數得到的結果是一樣的,不知何故???


LRCV(LogisticRegressionCV )- 邏輯回歸

LRCV的官方文檔地址

兩種算法基本相同,因此將上述代碼中的

“from sklearn.linear_model import LogisticRegression as LR”

改為“from sklearn.linear_model import LogisticRegressionCV as LRCV”

“lr = LR()”改為“lr = LRCV()”,即可!


MLP(MLPRegressor) - 人工神經網絡

MLP的官方文檔地址

上述兩段代碼改為:

from sklearn.neural_network import MLPRegressor as MLPlr = MLP(activation='tanh', learning_rate='adaptive')#創建mlp神經網絡對象

RLR(RandomizedLogisticRegression)-隨機邏輯回歸

RLR的官方文檔地址

代碼實現:

#-*- coding: utf-8-*-import pandas as pddatafile = u'E:\\pythondata\\kehu.xlsx'#文件所在位置,u為防止路徑中有中文名稱,此處沒有,可以省略 data = pd.read_excel(datafile)#datafile是excel文件,所以用read_excel,如果是csv文件則用read_csv x = data.iloc[:,:8].as_matrix()#第1列到第8列 y = data.iloc[:,8].as_matrix()#第9列from sklearn.linear_model import RandomizedLogisticRegression as RLRrlr = RLR() rlr.fit(x, y)#訓練模型 rlr.get_support(indices=True) print(u'通過隨機邏輯回歸模型篩選特征結束。') print(u'有效特征為:%s'%','.join(data.columns[rlr.get_support(indices=True)])) x = data[data.columns[rlr.get_support(indices=True)]].as_matrix()

這個代碼需要注意的是,.join(data.columns[rlr.get_support(indices=True)]這部分的包更新刪減了,因此會報錯。

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的逻辑回归 - sklearn (LR、LRCV、MLP、RLR)- Python代码实现的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。