日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【机器学习】逻辑回归—良/恶性乳腺癌肿瘤预测

發布時間:2024/7/5 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【机器学习】逻辑回归—良/恶性乳腺癌肿瘤预测 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

邏輯回歸—良/惡性乳腺癌腫瘤預測

  • 邏輯回歸的損失函數、優化
    與線性回歸原理相同,但由于是分類問題,損失函數不一樣,只能通過梯度下降求解
    sklearn邏輯回歸API
sklearn.linear_model.LogisticRegression
  • LogisticRegression
sklearn.linear_model.LogisticRegression(penalty=‘l2’, C = 1.0) Logistic回歸分類器 coef_:回歸系數
  • 只能解決二分類問題:

    廣告點擊率

    判斷用戶的性別

    預測用戶是否會購買給定的商品類

    判斷一條評論是正面的還是負面的


LogisticRegression回歸案例-良/惡性乳腺癌腫瘤預測

良/惡性乳腺癌腫數據
原始數據的下載地址:
https://archive.ics.uci.edu/ml/machine-learning-databases/

7.#屬性域
------------------------------------------
1.樣品編號ID編號
2.團塊厚度1-10
3.像元大小的均勻性1-10
4.細胞形狀的均勻性1-10
5.邊緣附著力1-10
6.單上皮細胞大小1-10
7.裸核1-10
8.淡色染色質1-10
9.正常核仁1-10
10.線粒體1-10
11.等級:(2代表良性,4代表惡性)

8.缺少屬性值:16

第1到第6組中的16個實例包含一個缺失項 (即不可用)屬性值,現在用“?”表示。

9.班級分布:

良性:458(65.5%) 惡性:241(34.5%)

此處惡性為正例,良性為反例。
哪一個類別少,判定概率值是這個類別!


  • 數據描述
    (1)699條樣本,共11列數據,第一列用語檢索的id,后9列分別是與腫瘤
    相關的醫學特征,最后一列表示腫瘤類型的數值。
    (2)包含16個缺失值,用”?”標出。

  • pandas使用

pd.read_csv(’’,names=column_names) column_names:指定類別名字,['Sample code number','Clump Thickness', 'Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size','Bare Nuclei','Bland Chromatin','Normal Nucleoli','Mitoses','Class'] return:數據replace(to_replace=’’,value=):返回數據 dropna():返回數據
  • 良/惡性乳腺癌腫分類流程
    1、網上獲取數據(工具pandas)
    2、數據缺失值處理、標準化
    3、LogisticRegression估計器流程
from sklearn.linear_model import LinearRegression, SGDRegressor, Ridge, LogisticRegression from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import mean_squared_error, classification_report import pandas as pd import numpy as np def logistic():"""邏輯回歸做二分類進行癌癥預測(根據細胞的屬性特征):return: NOne"""# 構造列標簽名字column = ['Sample code number','Clump Thickness', 'Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size','Bare Nuclei','Bland Chromatin','Normal Nucleoli','Mitoses','Class']# 讀取數據data = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data", names=column)print(data)# 缺失值進行處理data = data.replace(to_replace='?', value=np.nan)#刪除data = data.dropna()# 進行數據的分割x_train, x_test, y_train, y_test = train_test_split(data[column[1:10]], data[column[10]], test_size=0.25)#1-10列是特征值,最后一列10代表11列目標值# 進行標準化處理std = StandardScaler()x_train = std.fit_transform(x_train)x_test = std.transform(x_test)# 邏輯回歸預測lg = LogisticRegression(C=1.0)lg.fit(x_train, y_train)print(lg.coef_)y_predict = lg.predict(x_test)print("準確率:", lg.score(x_test, y_test))print("召回率:", classification_report(y_test, y_predict, labels=[2, 4], target_names=["良性", "惡性"]))return Noneif __name__ == "__main__":logistic() [699 rows x 11 columns] [[1.35467578 0.18001121 0.74721681 0.89447017 0.38691172 1.264152650.95382046 0.53218847 0.51240579]] 準確率: 0.9707602339181286 召回率: precision recall f1-score support良性 0.97 0.98 0.98 112惡性 0.97 0.95 0.96 59accuracy 0.97 171macro avg 0.97 0.97 0.97 171 weighted avg 0.97 0.97 0.97 171

總結

以上是生活随笔為你收集整理的【机器学习】逻辑回归—良/恶性乳腺癌肿瘤预测的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。