日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

python调用imblearn中SMOTE踩坑

發(fā)布時(shí)間:2025/3/15 57 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python调用imblearn中SMOTE踩坑 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

??SMOTE是用來(lái)解決樣本種類(lèi)不均衡,專(zhuān)門(mén)用來(lái)過(guò)采樣化的一種方法。第一次接觸,踩了一些坑,寫(xiě)這篇記錄一下:

問(wèn)題一:SMOTE包下載及調(diào)用

# 包下載 pip install imblearn# 調(diào)用 from imblearn.over_sampling import SMOTE # 使用SMOTE進(jìn)行過(guò)采樣時(shí)正樣本和負(fù)樣本要放在一起,生成比例11 smo = SMOTE(n_jobs=-1) # 這里必須是fit_resample(),有些版本是fit_sample()無(wú)法運(yùn)行 x_sampling, y_sampling = smo.fit_resample(train_x_data, train_y_data)

對(duì)于SMOTE函數(shù)API參數(shù)如下:

API介紹imblearn.over_sampling.SMOTE( sampling_strategy = ‘a(chǎn)uto’, random_state = None, ## 隨機(jī)器設(shè)定 k_neighbors = 5, ## 用相近的 5 個(gè)樣本(中的一個(gè))生成正樣本 m_neighbors = 10, ## 當(dāng)使用 kind={'borderline1', 'borderline2', 'svm'} out_step =0.5, ## 當(dāng)使用kind = 'svm' kind = 'regular', ## 隨機(jī)選取少數(shù)類(lèi)的樣本 – borderline1: 最近鄰中的隨機(jī)樣本b與該少數(shù)類(lèi)樣本a來(lái)自于不同的類(lèi) – borderline2: 隨機(jī)樣本b可以是屬于任何一個(gè)類(lèi)的樣本; – svm:使用支持向量機(jī)分類(lèi)器產(chǎn)生支持向量然后再生成新的少數(shù)類(lèi)樣本 svm_estimator = SVC(), ## svm 分類(lèi)器的選取 n_jobs = 1, ## 使用的例程數(shù),為-1時(shí)使用全部CPU ratio=None )

參考博客:https://blog.csdn.net/yeziyezi1986/article/details/103202012

問(wèn)題二:ValueError: Unknown label type: ‘continuous’

解決方法:標(biāo)簽類(lèi)型必須是int型

參考博客:https://blog.csdn.net/qq_41870817/article/details/89419726

問(wèn)題三:ValueError: Expected n_neighbors <= n_samples, but n_samples = 1, n_neighbors = 6

解決方法:
??1.調(diào)整k_neighbors參數(shù)值
??2.復(fù)制數(shù)據(jù)集,讓數(shù)據(jù)條數(shù)多一點(diǎn)兒

參考博客:https://blog.csdn.net/weixin_45494978/article/details/107669996
https://blog.csdn.net/LinJing_2020/article/details/104606596

最后留一個(gè)比較清晰的使用文章:
https://blog.csdn.net/opp003/article/details/89920665

總結(jié)

以上是生活随笔為你收集整理的python调用imblearn中SMOTE踩坑的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。