日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?...

發(fā)布時(shí)間:2025/3/15 python 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

我正在訓(xùn)練一個(gè)具有10個(gè)左右分類輸入的神經(jīng)網(wǎng)絡(luò)。 在對這些分類輸入進(jìn)行一次熱編碼之后,我最終將大約500個(gè)輸入饋入網(wǎng)絡(luò)。

我希望能夠確定我每個(gè)分類輸入的重要性。 Scikit-learn具有許多功能重要性算法,但是這些算法中的任何一種都可以應(yīng)用于分類數(shù)據(jù)輸入嗎? 所有示例均使用數(shù)字輸入。

我可以將這些方法應(yīng)用于"一鍵編碼"輸入,但是在應(yīng)用于二進(jìn)制輸入后如何提取含義? 如何判斷分類輸入中的特征重要性?

Ive已成功使用支持discrete_features=True的mutual_info_score。

看看scikit-learn.org/stable/modules/

謹(jǐn)慎使用單點(diǎn)編碼,因?yàn)槟鷮⑻卣骺臻g的維數(shù)增加了50倍。您還可以考慮使用隨機(jī)森林而不是神經(jīng)網(wǎng)絡(luò),因?yàn)殡S機(jī)森林方法具有內(nèi)置的特征重要性表征。

感謝您的意見。 @IgorRaush,我可以像這樣使用common_info_classif函數(shù):l_importance = mutual_info_classif(X, y, discrete_features=True)但是可以確認(rèn)我在X數(shù)組中編碼離散特征的方式。顯然,它必須是一個(gè)numpy數(shù)組,因此大多數(shù)輸入都必須進(jìn)行編碼。我可以使用離散索引嗎?如果我對輸入進(jìn)行了二值化,那么將很難從功能輸出中提取含義,因?yàn)楣δ苁侨绱朔蛛x。如果這些是我的輸入:X = [[A, X, alpha], [B, X, beta], [B, Y, gamma]]我將如何編碼?謝謝 -

@VivekKumar感謝您的回復(fù)。我知道如何編碼分類輸入。您是否暗示最佳實(shí)踐是在單熱編碼輸入上運(yùn)行標(biāo)準(zhǔn)特征選擇算法?如果是這種情況,您將如何包裝輸出以確定每個(gè)功能的重要性,而不是確定每個(gè)熱編碼列的重要性?謝謝

@ A555h5似乎實(shí)際上并不需要是一個(gè)Numpy數(shù)組,您提供的列表也可以作為輸入正常工作(盡管您可以將Numpy數(shù)組與dtype=np.str一起使用,該數(shù)組包含字符串并且也可以使用)。

通常,對于這種情況,您將使用索引編碼,其中分類功能的每個(gè)級別都映射到整數(shù)0、1等。請查看Scikit-learn中的LabelEncoder或Pandas中的分類系列。

在回答您對Vivek的問題時(shí),這取決于您要完成的工作。您可以使用重要性度量來修剪整個(gè)功能("功能選擇"),也可以一鍵編碼它們并僅修剪某些級別("值選擇")。我見過兩種使用方法。

感謝您的回答@IgorRaush-一個(gè)快速的問題。如果我在同一數(shù)據(jù)集中混合了分類特征和數(shù)字特征,那么該如何編碼?我想一起考慮它們,因?yàn)槲倚枰私馑鼈冎g的相互影響。我應(yīng)該將數(shù)字視為分類數(shù)字(因?yàn)槭シ?#xff0c;這似乎是錯(cuò)誤的),還是對分類數(shù)字使用索引編碼方法并與數(shù)字結(jié)合?再次感謝

在某些情況下,在進(jìn)入scikit-learn之前可能值得探索您的數(shù)據(jù)集。我通常使用Wekas GUI玩一些。在Weka中,您可以使用多種算法來可視化和評估特征。如果數(shù)據(jù)集太大,則將其稍微修剪一下。在此處獲取Weka:cs.waikato.ac.nz/ml/weka有關(guān)此處的屬性選擇的更多信息:wiki.pentaho.com/display/DATAMINING/Attribute+Selection

由于編碼特征之間的關(guān)系,在一種熱編碼上使用特征選擇算法可能會(huì)導(dǎo)致錯(cuò)過。例如,如果您將n個(gè)值的特征編碼為n個(gè)特征,并且已選擇m個(gè)中的n-1個(gè),則不需要最后一個(gè)特征。

由于您的功能數(shù)量很少(?10),因此功能選擇對您的幫助不大,因?yàn)槟赡苤荒軠p少其中的幾個(gè)而不會(huì)丟失太多信息。

您寫道,一種熱編碼將10個(gè)要素轉(zhuǎn)換為500個(gè),這意味著每個(gè)要素都有大約50個(gè)值。在這種情況下,您可能會(huì)對離散化算法更感興趣,可以對值本身進(jìn)行操作。如果值隱含順序,則可以對連續(xù)特征使用算法。另一種選擇是簡單地忽略稀有值或與概念沒有強(qiáng)相關(guān)性的值。

如果您使用特征選擇,則大多數(shù)算法將對分類數(shù)據(jù)起作用,但您應(yīng)提防極端情況。例如,@ Igor Raush建議的相互信息是一種很好的措施。但是,具有許多值的特征往往比具有較少值的特征具有更高的熵。反過來,這可能會(huì)導(dǎo)致更高的相互信息,并會(huì)偏向許多價(jià)值特征。一種解決此問題的方法是通過將互信息除以特征熵來進(jìn)行歸一化。

可能會(huì)幫助您的另一套功能選擇算法是包裝器。他們實(shí)際上將學(xué)習(xí)委托給分類算法,因此,只要分類算法可以應(yīng)對,它們就不會(huì)影響表示。

總結(jié)

以上是生活随笔為你收集整理的python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久高清 | 色成人综合 | 国产又黄又猛又爽 | 中文字幕第一区 | 青青一区二区 | 久久影音 | 国产只有精品 | 男女视频在线 | 自拍偷拍第八页 | 一本一道久久a久久综合蜜桃 | 熟妇人妻中文字幕 | 国产午夜福利一区二区 | 神马久久久久 | 日本在线天堂 | 亚洲综合无码一区二区 | 人民的名义第二部 | 女人的天堂网站 | 国产一级av毛片 | 黄网站免费视频 | 青青草视频在线观看免费 | 一二三区在线观看 | 香蕉久久夜色精品国产使用方法 | 无码日韩精品一区二区 | 中文字幕在线免费看线人 | 白白色视频在线 | 黄色网久久| 国产精品情侣 | 日韩色道| 人妻一区二区在线 | 亚洲欧洲中文 | 欧美性白人极品1819hd | www.涩涩爱| √天堂 | 色播久久| 亚洲自拍偷拍在线 | 午夜视频黄色 | 激情久久五月天 | 免费麻豆国产一区二区三区四区 | 打屁屁日本xxxxx变态 | 网友自拍第一页 | 一区二区视频观看 | 99精品国自产在线 | 国产亚洲精品久久久 | 好吊视频一区二区 | 人妻 校园 激情 另类 | 播放毛片 | 青草国产视频 | 久久久精品日本 | 亲女禁h啪啪宫交 | 超清纯大学生白嫩啪啪 | www.自拍| 亚洲天堂美女 | 三上悠亚在线观看一区二区 | 成人国产精品久久久网站 | 美女爱爱爱| 青青草一区二区 | 午夜不卡久久精品无码免费 | 国产精品系列在线观看 | 空姐吹箫视频大全 | 黄色av片三级三级三级免费看 | 天天操天天操天天操天天操天天操 | 亚洲网站免费看 | www.色啪啪.com| 337p粉嫩大胆色噜噜噜 | 深夜福利一区 | 性av网| 亚洲av成人精品日韩在线播放 | 就是喜欢被他干 | 台湾综合色 | 欧美日韩高清免费 | 女人高潮娇喘声mp3 乱色视频 | 双腿张开被9个男人调教 | 九色视频91| wwwwxxxx欧美 | 性www| 乱日视频 | 精品国产免费看 | 美女的奶胸大爽爽大片 | 欧美性猛交99久久久久99按摩 | 91av一区 | 操久久久 | 欧美亚洲国产另类 | 中国av毛片 | 色婷婷国产精品综合在线观看 | 日韩一区二区三区在线观看 | 色爱色 | 肉色超薄丝袜脚交一区二区图片 | 午夜黄网 | 欧美一区二区区 | 黄色性视频网站 | 捆绑最紧bdsm视频 | 久久久久在线视频 | 国产精品亚洲一区二区 | 国产亚洲在线观看 | 妖精视频一区二区 | 日韩欧美网站 | 国产一级黄色 | 亚洲欧美自拍视频 | 久草视频精品 |