日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

鸢尾花分类_机器学习:鸢尾花数据集--贝叶斯分类

發布時間:2025/4/16 编程问答 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 鸢尾花分类_机器学习:鸢尾花数据集--贝叶斯分类 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

鶯尾花數據集--貝葉斯分類

Step1: 庫函數導入
import warnings
warnings.filterwarnings('ignore')
import numpy as np# 加載鶯尾花數據集
from sklearn import datasets# 導入高斯樸素貝葉斯分類器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_splitStep2: 數據導入&分析
X, y = datasets.load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
我們需要計算兩個概率分別是:條件概率: ( ( )= ( )| = )P(X(i)=x(i)|Y=ck)和類目 ck的先驗概率: ( = )P(Y=ck)。
通過分析發現訓練數據是數值類型的數據,這里假設每個特征服從高斯分布,因此我們選擇高斯樸素貝葉斯來進行分類計算。

Step3: 模型訓練# 使用高斯樸素貝葉斯進行計算
clf = GaussianNB(var_smoothing=1e-8)
clf.fit(X_train, y_train)
GaussianNB(var_smoothing=1e-08)Step4: 模型預測# 評估
y_pred = clf.predict(X_test)
acc = np.sum(y_test == y_pred) / X_test.shape[0]
print("Test Acc : %.3f" % acc)
?# 預測
y_proba = clf.predict_proba(X_test[:1])
print(clf.predict(X_test[:1]))
print("預計的概率值:", y_proba)
Test Acc : 0.967 [2] 預計的概率值: [[1.63542393e-232 2.18880483e-006 9.99997811e-001]]

Step5: 原理簡析

高斯樸素貝葉斯假設每個特征都服從高斯分布,我們把一個隨機變量X服從數學期望為μ,方差為σ^2的數據分布稱為高斯分布。對于每個特征我們一般使用平均值來估計μ和使用所有特征的方差估計σ^2。
( ( )= ( )| = )=12 2 ????????√exp(?( ( )? )22 2 )P(X(i)=x(i)|Y=ck)=12πσy2exp?(?(x(i)?μck)22σck2)
從上述例子中的預測結果中,我們可以看到類別2對應的后驗概率值最大,所以我們認為類目2是最優的結果。

總結

以上是生活随笔為你收集整理的鸢尾花分类_机器学习:鸢尾花数据集--贝叶斯分类的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。