python调用sklearn中朴素贝叶斯踩坑
生活随笔
收集整理的這篇文章主要介紹了
python调用sklearn中朴素贝叶斯踩坑
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
??調用結構:
from sklearn.naive_bayes import MultinomialNB # 從sklean.naive_bayes里導入樸素貝葉斯模型 from sklearn.feature_extraction.text import CountVectorizer # 從sklearn.feature_extraction.text里導入文本特征向量化模塊# change_X_train是訓練集樣本,change_Y_train是訓練集標簽 # 這里面的change_X_train和,change_Y_train必須是str類型的列表 vec = CountVectorizer(analyzer = 'char', lowercase=False) X_train = vec.fit_transform(change_X_train) X_test = vec.transform(change_X_test)#3.使用樸素貝葉斯進行訓練 mnb = MultinomialNB() # 使用默認配置初始化樸素貝葉斯 mnb.fit(X_train, y_train) # 利用訓練數據對模型參數進行估計 y_predict = mnb.predict(X_test) # 對參數進行預測#4.獲取結果報告 print ('The Accuracy of Naive Bayes Classifier is:', mnb.score(X_test, y_test))相關報錯一:AttributeError:‘numpy.ndarray’ object has no attribute ‘lower’
??這個報錯是因為數據類型是,numpy下的array類型,需要使用tolist()函數將變量變成list型。一般是標準化后變成了ndarray,也可取消標準化
相關報錯二:‘list’ object has no attribute ‘lower’
??這個報錯是因為sklearn中的樸素貝葉斯訓練數據集必須是[‘1 1 1’, ‘2 2 2’, …, ’ n n n’]這種每項數據類型是str的列表。將所有的數據換成str就好了
相關報錯三:ValueError: empty vocabulary; perhaps the documents only contain stop words
??這個報錯是CountVectorizer參數設置的問題,不能使用默認配置
總結
以上是生活随笔為你收集整理的python调用sklearn中朴素贝叶斯踩坑的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: caffe学习路的起点
- 下一篇: python json串中文乱码问题