日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > python >内容正文

python

python调用sklearn中朴素贝叶斯踩坑

發(fā)布時(shí)間:2025/3/15 python 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python调用sklearn中朴素贝叶斯踩坑 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

??調(diào)用結(jié)構(gòu):

from sklearn.naive_bayes import MultinomialNB # 從sklean.naive_bayes里導(dǎo)入樸素貝葉斯模型 from sklearn.feature_extraction.text import CountVectorizer # 從sklearn.feature_extraction.text里導(dǎo)入文本特征向量化模塊# change_X_train是訓(xùn)練集樣本,change_Y_train是訓(xùn)練集標(biāo)簽 # 這里面的change_X_train和,change_Y_train必須是str類型的列表 vec = CountVectorizer(analyzer = 'char', lowercase=False) X_train = vec.fit_transform(change_X_train) X_test = vec.transform(change_X_test)#3.使用樸素貝葉斯進(jìn)行訓(xùn)練 mnb = MultinomialNB() # 使用默認(rèn)配置初始化樸素貝葉斯 mnb.fit(X_train, y_train) # 利用訓(xùn)練數(shù)據(jù)對(duì)模型參數(shù)進(jìn)行估計(jì) y_predict = mnb.predict(X_test) # 對(duì)參數(shù)進(jìn)行預(yù)測(cè)#4.獲取結(jié)果報(bào)告 print ('The Accuracy of Naive Bayes Classifier is:', mnb.score(X_test, y_test))

相關(guān)報(bào)錯(cuò)一:AttributeError:‘numpy.ndarray’ object has no attribute ‘lower’
??這個(gè)報(bào)錯(cuò)是因?yàn)閿?shù)據(jù)類型是,numpy下的array類型,需要使用tolist()函數(shù)將變量變成list型。一般是標(biāo)準(zhǔn)化后變成了ndarray,也可取消標(biāo)準(zhǔn)化

相關(guān)報(bào)錯(cuò)二:‘list’ object has no attribute ‘lower’
??這個(gè)報(bào)錯(cuò)是因?yàn)閟klearn中的樸素貝葉斯訓(xùn)練數(shù)據(jù)集必須是[‘1 1 1’, ‘2 2 2’, …, ’ n n n’]這種每項(xiàng)數(shù)據(jù)類型是str的列表。將所有的數(shù)據(jù)換成str就好了

相關(guān)報(bào)錯(cuò)三:ValueError: empty vocabulary; perhaps the documents only contain stop words
??這個(gè)報(bào)錯(cuò)是CountVectorizer參數(shù)設(shè)置的問(wèn)題,不能使用默認(rèn)配置

不能是:vec = CountVectorizer() 需要是:vec = CountVectorizer(analyzer = 'char', lowercase=False)

總結(jié)

以上是生活随笔為你收集整理的python调用sklearn中朴素贝叶斯踩坑的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。