日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python的功能名称_ML获取功能选择后的功能名称SelectPercentile,python

發布時間:2024/9/27 python 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python的功能名称_ML获取功能选择后的功能名称SelectPercentile,python 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我已經為這件事掙扎了一段時間了。

我的目標是獲取一個文本特征,并從中找出5-10個最好的單詞來幫助我分類。因此,我正在運行一個TfIdfVectorizer,現在選擇~90最佳。然而,當我縮小了特性數量之后,我無法看到實際選擇了哪些特性。在

以下是我所擁有的:import pandas

from sklearn.feature_extraction.text import TfidfVectorizer

from sklearn.feature_selection import SelectPercentile, f_classif

train=pandas.read_csv("train.tsv", sep='\t')

labels_train = train["label"]

documents = []

for i, row in train.iterrows():

documents.append((row['boilerplate'][1:-1].lower()))

vectorizer = TfidfVectorizer(sublinear_tf=True, stop_words="english")

features_train_transformed = vectorizer.fit_transform(documents)

selector = SelectPercentile(f_classif, percentile=0.1)

selector.fit(features_train_transformed, labels_train)

features_train_transformed = selector.transform(features_train_transformed).toarray()

結果是,features_train_transformed包含一個矩陣,其中包含所選單詞的每個文檔中每個單詞的所有tfidf分數,但是我不知道選擇了哪些單詞,并且像“get_feature_names()”這樣的方法對于SelectPercentile類不可用。在

這是必要的,因為我需要將這些特征添加到一堆數字特征中,然后才能進行訓練和預測。在

總結

以上是生活随笔為你收集整理的python的功能名称_ML获取功能选择后的功能名称SelectPercentile,python的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。