當(dāng)前位置：首頁(yè) >

python调用imblearn中SMOTE踩坑

發(fā)布時(shí)間：2025/3/15 57 豆豆

生活随笔收集整理的這篇文章主要介紹了 python调用imblearn中SMOTE踩坑小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

??SMOTE是用來(lái)解決樣本種類(lèi)不均衡，專(zhuān)門(mén)用來(lái)過(guò)采樣化的一種方法。第一次接觸，踩了一些坑，寫(xiě)這篇記錄一下：

問(wèn)題一：SMOTE包下載及調(diào)用

# 包下載 pip install imblearn# 調(diào)用 from imblearn.over_sampling import SMOTE # 使用SMOTE進(jìn)行過(guò)采樣時(shí)正樣本和負(fù)樣本要放在一起，生成比例1：1 smo = SMOTE(n_jobs=-1) # 這里必須是fit_resample()，有些版本是fit_sample()無(wú)法運(yùn)行 x_sampling, y_sampling = smo.fit_resample(train_x_data, train_y_data)

對(duì)于SMOTE函數(shù)API參數(shù)如下：

API介紹imblearn.over_sampling.SMOTE( sampling_strategy = ‘a(chǎn)uto’, random_state = None, ## 隨機(jī)器設(shè)定 k_neighbors = 5, ## 用相近的 5 個(gè)樣本（中的一個(gè)）生成正樣本 m_neighbors = 10, ## 當(dāng)使用 kind={'borderline1', 'borderline2', 'svm'} out_step = ‘0.5’, ## 當(dāng)使用kind = 'svm' kind = 'regular', ## 隨機(jī)選取少數(shù)類(lèi)的樣本 – borderline1：最近鄰中的隨機(jī)樣本b與該少數(shù)類(lèi)樣本a來(lái)自于不同的類(lèi) – borderline2：隨機(jī)樣本b可以是屬于任何一個(gè)類(lèi)的樣本; – svm：使用支持向量機(jī)分類(lèi)器產(chǎn)生支持向量然后再生成新的少數(shù)類(lèi)樣本 svm_estimator = SVC(), ## svm 分類(lèi)器的選取 n_jobs = 1, ## 使用的例程數(shù)，為-1時(shí)使用全部CPU ratio=None )

參考博客：https://blog.csdn.net/yeziyezi1986/article/details/103202012

問(wèn)題二：ValueError: Unknown label type: ‘continuous’

解決方法：標(biāo)簽類(lèi)型必須是int型

參考博客：https://blog.csdn.net/qq_41870817/article/details/89419726

問(wèn)題三：ValueError: Expected n_neighbors ＜= n_samples, but n_samples = 1, n_neighbors = 6

解決方法：
??1.調(diào)整k_neighbors參數(shù)值
??2.復(fù)制數(shù)據(jù)集，讓數(shù)據(jù)條數(shù)多一點(diǎn)兒

參考博客：https://blog.csdn.net/weixin_45494978/article/details/107669996
https://blog.csdn.net/LinJing_2020/article/details/104606596

最后留一個(gè)比較清晰的使用文章：
https://blog.csdn.net/opp003/article/details/89920665

總結(jié)

以上是生活随笔為你收集整理的python调用imblearn中SMOTE踩坑的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。