當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

EduCoder 机器学习逻辑回归

發布時間：2024/5/17 编程问答 54 豆豆

生活随笔收集整理的這篇文章主要介紹了 EduCoder 机器学习逻辑回归小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

邏輯回歸是屬于機器學習里面的監督學習，它是以回歸的思想來解決分類問題的一種非常經典的二分類分類器。由于其訓練后的參數有較強的可解釋性，在諸多領域中，邏輯回歸通常用作 baseline 模型，以方便后期更好的挖掘業務相關信息或提升模型性能。

本實訓項目的主要內容是基于 Python 語言搭建出一個能夠識別惡性腫瘤的邏輯回歸模型，并使用 sklearn 中的 LogisticRegression 實現手寫數字識別。

第1關：邏輯回歸核心思想

任務描述
相關知識
- 什么是邏輯回歸
- sigmoid 函數
編程要求
測試說明

任務描述

本關任務：根據本節課所學知識完成本關所設置的編程題。

編程要求

根據提示，在右側編輯器補充 Python 代碼，實現sigmoid函數。底層代碼會調用您實現的sigmoid函數來進行測試。(提示: numpy.exp()函數可以實現 e 的冪運算)

測試說明

測試用例：

輸入：1

預期輸出：0.73105857863

輸入：-2

預期輸出：0.119202922022

開始你的任務吧，祝你成功！

#encoding=utf8 import numpy as npdef sigmoid(t):'''完成sigmoid函數計算:param t: 負無窮到正無窮的實數:return: 轉換后的概率值:可以考慮使用np.exp()函數'''#********** Begin **********#return 1/(1+np.exp(-1*t))#********** End **********#

第2關：邏輯回歸的損失函數

任務描述
相關知識
- 為什么需要損失函數
- 邏輯回歸的損失函數
編程要求
測試說明

任務描述

本關任務：根據本節課所學知識完成本關所設置的選擇題。

編程要求

根據相關知識，按照要求完成右側選擇題任務，包含單選題和多選題。

測試說明

平臺會對你選擇的答案進行判斷，全對則通過測試。

開始你的任務吧，祝你成功！

1、邏輯回歸的損失函數可以寫成如下形式（A）

$c o s t = {? l o g (p^) ? l o g (1 ? p^) y = 1 y = 0$
A、
對
B、
錯
2、下列說法正確的是（ACD）
A、
損失值能夠衡量模型在訓練數據集上的擬合程度
B、
sigmoid函數不可導
C、
sigmoid函數的輸入越大，輸出就越大
D、
訓練的過程，就是尋找合適的參數使得損失函數值最小的過程
3、sigmoid函數(對數幾率函數)相對于單位階躍函數有哪些好處？（AB）
A、
sigmoid函數可微分
B、
sigmoid函數處處連續
C、
sigmoid函數不是單調的
D、
sigmoid函數最多計算二階導
4、邏輯回歸的優點有哪些？（D）
A、
需要事先對數據的分布做假設
B、
可以得到“類別”的真正的概率預測
C、
可以用閉式解求解
D、
可以用現有的數值優化算法求解

第3關：梯度下降

任務描述
相關知識
- 什么是梯度
- 梯度下降算法原理
編程要求
測試說明

任務描述

本關任務：用 Python 構建梯度下降算法，并求取目標函數最小值。

編程要求

根據提示，使用 Python 實現梯度下降算法，并損失函數最小值時對應的參數theta，theta會返回給外部代碼，由外部代碼來判斷theta是否正確。

測試說明

損失函數為： $l o s s = 2 ? (θ ? 3)$ 最優參數為：3.0 你的答案跟最優參數的誤差低于0.0001才能通關。

開始你的任務吧，祝你成功！

# -*- coding: utf-8 -*-import numpy as np import warnings warnings.filterwarnings("ignore")def gradient_descent(initial_theta,eta=0.05,n_iters=1000,epslion=1e-8):'''梯度下降:param initial_theta: 參數初始值，類型為float:param eta: 學習率，類型為float:param n_iters: 訓練輪數，類型為int:param epslion: 容忍誤差范圍，類型為float:return: 訓練后得到的參數'''# 請在此添加實現代碼 ##********** Begin *********#theta = initial_thetai_iter = 0while i_iter < n_iters:gradient = 2*(theta-3)last_theta = thetatheta = theta - eta*gradientif(abs(theta-last_theta)<epslion):breaki_iter +=1return theta#********** End **********#

第4關：動手實現邏輯回歸 - 癌細胞精準識別

任務描述
相關知識
- 數據集介紹
- 構建邏輯回歸模型
- 訓練邏輯回歸模型
編程要求
測試說明

任務描述

本關任務：使用邏輯回歸算法建立一個模型，并通過梯度下降算法進行訓練，得到一個能夠準確對癌細胞進行識別的模型。

編程要求

根據提示，在右側編輯器Begin-End處補充 Python 代碼，構建一個邏輯回歸模型，并對其進行訓練，最后將得到的邏輯回歸模型對癌細胞進行識別。

測試說明

只需返回預測結果即可，程序內部會檢測您的代碼，預測正確率高于 95% 視為過關。

提示：構建模型時 $x_{0}$ 是添加在數據的左邊，請根據提示構建模型,且返回theta形狀為(n,)，n為特征個數。

開始你的任務吧，祝你成功！

# -*- coding: utf-8 -*-import numpy as np import warnings warnings.filterwarnings("ignore")def sigmoid(x):'''sigmoid函數:param x: 轉換前的輸入:return: 轉換后的概率'''return 1/(1+np.exp(-x))def fit(x,y,eta=1e-3,n_iters=10000):'''訓練邏輯回歸模型:param x: 訓練集特征數據，類型為ndarray:param y: 訓練集標簽，類型為ndarray:param eta: 學習率，類型為float:param n_iters: 訓練輪數，類型為int:return: 模型參數，類型為ndarray'''# 請在此添加實現代碼 ##********** Begin *********#theta = np.zeros(x.shape[1])i_iter = 0while i_iter < n_iters:gradient = (sigmoid(x.dot(theta))-y).dot(x)theta = theta -eta*gradienti_iter += 1return theta#********** End **********#

第5關：手寫數字識別

任務描述
相關知識
- 數據簡介
- LogisticRegression
編程要求
測試說明

任務描述

本關任務：使用sklearn中的LogisticRegression類完成手寫數字識別任務。

編程要求

填寫digit_predict(train_sample, train_label, test_sample)函數完成手寫數字識別任務，其中：

train_image：訓練集圖像，類型為ndarray，shape=[-1, 8, 8]；
train_label：訓練集標簽，類型為ndarray；
test_image：測試集圖像，類型為ndarray。

測試說明

只需返回預測結果即可，程序內部會檢測您的代碼，預測正確率高于 0.97 視為過關。

開始你的任務吧，祝你成功！

from sklearn.linear_model import LogisticRegressiondef digit_predict(train_image, train_label, test_image):'''實現功能：訓練模型并輸出預測結果:param train_sample: 包含多條訓練樣本的樣本集，類型為ndarray,shape為[-1, 8, 8]:param train_label: 包含多條訓練樣本標簽的標簽集，類型為ndarray:param test_sample: 包含多條測試樣本的測試集，類型為ndarry:return: test_sample對應的預測標簽'''#************* Begin ************#flat_train_image = train_image.reshape((-1, 64))# 訓練集標準化train_min = flat_train_image.min()train_max = flat_train_image.max()flat_train_image = (flat_train_image-train_min)/(train_max-train_min)# 測試集變形flat_test_image = test_image.reshape((-1, 64))# 測試集標準化test_min = flat_test_image.min()test_max = flat_test_image.max()flat_test_image = (flat_test_image - test_min) / (test_max - test_min)# 訓練--預測rf = LogisticRegression(C=4.0)rf.fit(flat_train_image, train_label)return rf.predict(flat_test_image)#************* End **************#

總結

以上是生活随笔為你收集整理的EduCoder 机器学习逻辑回归的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： LeetCode 879. 盈利计划
下一篇： EduCoder 机器学习决策树

编程问答

EduCoder 机器学习 逻辑回归

第1關：邏輯回歸核心思想

任務描述

相關知識

什么是邏輯回歸

sigmoid 函數

編程要求

測試說明

第2關：邏輯回歸的損失函數

任務描述

相關知識

為什么需要損失函數

邏輯回歸的損失函數

編程要求

測試說明

第3關：梯度下降

任務描述

相關知識

什么是梯度

梯度下降算法原理

編程要求

測試說明

第4關：動手實現邏輯回歸 - 癌細胞精準識別

任務描述

相關知識

數據集介紹

構建邏輯回歸模型

訓練邏輯回歸模型

編程要求

測試說明

第5關：手寫數字識別

任務描述

相關知識

數據簡介

LogisticRegression

編程要求

測試說明

總結

EduCoder 机器学习逻辑回归