日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Github|类别不平衡学习资源(下)

發(fā)布時(shí)間:2023/12/10 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Github|类别不平衡学习资源(下) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

點(diǎn)擊上方“算法猿的成長“,關(guān)注公眾號,選擇加“星標(biāo)“或“置頂”

總第 139 篇文章,本文大約 3600?字,閱讀大約需要 10?分鐘

繼續(xù)介紹類別不平衡學(xué)習(xí)資源,github 地址:

https://github.com/ZhiningLiu1998/awesome-imbalanced-learning

上篇文章地址:

Github|類別不平衡學(xué)習(xí)資源(上)

另外,完整版閱讀可以到我的知乎專欄:https://zhuanlan.zhihu.com/p/142692473

這次介紹的是下面目錄加粗的內(nèi)容:

  • 代碼庫/框架

    • Python

    • R

    • Java

    • Scalar

    • Julia

  • 論文

    • 綜述

    • 深度學(xué)習(xí)

    • 數(shù)據(jù)重采樣(Data resampling)

    • 成本敏感學(xué)習(xí)(Cost-sensitive Learning)

    • 集成學(xué)習(xí)(Ensemble Learning)

    • 異常檢測

  • 其他

    • 不平衡數(shù)據(jù)庫

    • 其他的資源

另外,帶有???? 標(biāo)記的是作者特別推薦的重要或者高質(zhì)量的論文和框架。


數(shù)據(jù)重采樣

  • 過采樣

    • ROS [Code] - 隨機(jī)過采樣

    • SMOTE [Code] (2002, 9800+ 引用) ,合成少數(shù)類的過采樣技術(shù)(Synthetic Minority Over-sampling TEchnique)

      ???? 經(jīng)典的工作

    • Borderline-SMOTE [Code] (2005, 1400+ 引用) ,邊界合成少數(shù)類的過采樣技術(shù);

    • ADASYN [Code] (2008, 1100+ 引用) ,自適應(yīng)合成采樣(ADAptive SYNthetic Sampling);

    • SPIDER [Code (Java)] (2008, 150+ 引用) ,不平衡數(shù)據(jù)的選擇性預(yù)處理;

    • Safe-Level-SMOTE [Code (Java)] (2009, 370+ 引用) ,安全級綜合少數(shù)類的過采樣技術(shù);

    • SVM-SMOTE [Code] (2009, 120+ 引用) ,基于 SVM 的 SMOTE

    • SMOTE-IPF (2015, 180+ 引用) ,迭代分區(qū)過濾的 SMOTE

  • 欠采樣

  • RUS [Code],隨機(jī)欠采樣;

  • CNN [Code] (1968, 2100+ 引用) ,濃縮的最近鄰(Condensed Nearest Neighbor);

  • ENN [Code] (1972, 1500+ citations) ,可編輯的濃縮的最近鄰(Edited Condensed Nearest Neighbor);

  • TomekLink [Code] (1976, 870+ citations) ,Tomek 對濃縮的最近鄰的修正方法;

  • NCR [Code] (2001, 500+ 引用) , 近鄰的清洗規(guī)則;

  • NearMiss-1 & 2 & 3 [Code] (2003, 420+ 引用) ,幾種解決不平衡數(shù)據(jù)分布的 KNN 方法

  • CNN with TomekLink [Code (Java)] (2004, 2000+ 引用) ,結(jié)合了濃縮的最近鄰和 TomekLink 方法;

  • OSS [Code] (2007, 2100+ 引用):單邊選擇(One Side Selection);

  • EUS (2009, 290+ 引用) :進(jìn)化的欠采樣(Evolutionary Under-sampling);

  • IHT [Code] (2014, 130+ 引用) :實(shí)例難度閾值(Instance Hardness Threshold);

  • 混合采樣

  • SMOTE-Tomek & SMOTE-ENN (2004, 2000+ 引用) [Code (SMOTE-Tomek)] [Code (SMOTE-ENN)] ?,綜合少數(shù)過采樣技術(shù)和 Tomek 對壓縮近鄰/編輯近鄰的修改;

    ????廣泛的實(shí)驗(yàn)評估涉及10種不同的過/欠采樣方法。

  • SMOTE-RSB (2012, 210+ 引用) ,混合了使用 SMOTE 預(yù)處理和粗糙集合理論;

成本敏感學(xué)習(xí)

  • CSC4.5 [Code (Java)] (2002, 420+ 引用) ,一個(gè)實(shí)際加權(quán)方法來引起成本敏感樹;

  • CSSVM [Code (Java)] (2008, 710+ 引用) ,用于高度不平衡分類的成本敏感 SVMs;

  • CSNN[Code (Java)] (2005, 950+ 引用) ,基于解決類別不平衡問題的方法來訓(xùn)練一個(gè)成本敏感的神經(jīng)網(wǎng)絡(luò);

集成學(xué)習(xí)

  • Boosting-based

    • AdaBoost[Code] (1995, 18700+ 引用)

    • DataBoost (2004, 570+ 引用)

    • SMOTEBoost [Code] (2003, 1100+ 引用)

      ???? 經(jīng)典的工作

    • MSMOTEBoost(2011, 1300+ 引用)

    • RAMOBoost [Code] (2010, 140+ 引用)

    • RUSBoost[Code] ?(2009, 850+ 引用)

???? 經(jīng)典的工作

  • AdaBoostNC (2012, 350+ 引用)

  • EUSBoost (2013, 210+ 引用)

  • bagging-based

    • Bagging [Code] (1996, 23100+ 引用) ,Bagging 預(yù)測器;

    • OverBagging & UnderOverBagging & SMOTEBagging & MSMOTEBagging [Code (SMOTEBagging)] (2009, 290+ 引用) ,基于 Bagging 的隨機(jī)過采樣/隨機(jī)混合重采樣/ SMOTE / 修改版 SMOTE;

    • UnderBagging [Code] (2003, 170+ 引用) ,基于 Bagging 的隨機(jī)欠采樣;

  • 其他繼承方法

  • EasyEnsemble & BalanceCascade[Code (EasyEnsemble)] [Code (BalanceCascade)] ?(2008, 1300+ 引用) , 使用 RUS 進(jìn)行并行集成訓(xùn)練(EasyEnsemble) / 使用 RUS 進(jìn)行級聯(lián)集成訓(xùn)練,同時(shí)迭代地刪除分類很好的樣本(BalanceCascade);

    ???? 簡單但有效的方法

  • Self-paced Ensemble [Code] (ICDE 2020) ,用自適應(yīng)協(xié)調(diào)分類困難訓(xùn)練不平衡數(shù)據(jù)的有效集成;

    ???? 高性能和計(jì)算效率高,廣泛適用于不同的分類器。

異常檢測

  • Anomaly Detection Learning Resources,異常檢測相關(guān)的書籍、論文、視頻和工具箱。

  • 綜述

    • Anomaly detection: A survey (2009, 7300+ 引用)

  • A survey of network anomaly detection techniques (2017, 210+ 引用)

  • 基于分類

    • One-class SVMs for document classification (2001, 1300+ 引用)

    • One-class Collaborative Filtering (2008, 830+ 引用)

    • Isolation Forest (2008, 1000+ 引用)

    • Anomaly Detection using One-Class Neural Networks (2018, 70+ 引用)

    • Anomaly Detection with Robust Deep Autoencoders (KDD 2017, 170+ 引用)


其他

不平衡數(shù)據(jù)集

上述數(shù)據(jù)集的集合來自 imblearn.datasets.fetch_datasets

其他資源

  • Paper-list-on-Imbalanced-Time-series-Classification-with-Deep-Learning

  • acm_imbalanced_learning ,2016年4月27日在德克薩斯州奧斯汀市舉行的ACM不平衡學(xué)習(xí)講座的幻燈片和代碼;

  • imbalanced-algorithms ,基于python實(shí)現(xiàn)的算法學(xué)習(xí)不平衡的數(shù)據(jù);

  • imbalanced-dataset-sampler ,一種(PyTorch)非平衡數(shù)據(jù)集采樣器,用于過采樣低頻率類和欠采樣高頻率類;

  • class_imbalance ,通過 Jupyter Notebook 展示的二進(jìn)制分類的類別不平衡;


最后,github 地址是:

https://github.com/ZhiningLiu1998/awesome-imbalanced-learning

另外,本人水平有限,所以對部分專業(yè)術(shù)語的翻譯可能并不正確,沒法做到非常完美,請多多包涵,謝謝!

最后,如果想查看完整版,以及可以點(diǎn)擊論文或者代碼鏈接的,可以查看我發(fā)表在知乎上的文章:

https://zhuanlan.zhihu.com/p/142692473


精選AI文章

1.??2020年計(jì)算機(jī)視覺學(xué)習(xí)指南

2.?是選擇Keras還是PyTorch開始你的深度學(xué)習(xí)之旅呢?

3.?編寫高效的PyTorch代碼技巧(上)

4.?編寫高效的PyTorch代碼技巧(下)

5.?深度學(xué)習(xí)算法簡要綜述(上)

6.?深度學(xué)習(xí)算法簡要綜述(下)

7.?10個(gè)實(shí)用的機(jī)器學(xué)習(xí)建議

8.?實(shí)戰(zhàn)|手把手教你訓(xùn)練一個(gè)基于Keras的多標(biāo)簽圖像分類器

精選python文章

1.??python數(shù)據(jù)模型

2.?python版代碼整潔之道

3.?快速入門 Jupyter notebook

4.?Jupyter 進(jìn)階教程

5.?10個(gè)高效的pandas技巧

精選教程資源文章

1.?[資源分享] TensorFlow 官方中文版教程來了

2.?[資源]推薦一些Python書籍和教程,入門和進(jìn)階的都有!

3.?[Github項(xiàng)目推薦] 推薦三個(gè)助你更好利用Github的工具

4.?Github上的各大高校資料以及國外公開課視頻

5.?GitHub上有哪些比較好的計(jì)算機(jī)視覺/機(jī)器視覺的項(xiàng)目?

歡迎關(guān)注我的微信公眾號--算法猿的成長,或者掃描下方的二維碼,大家一起交流,學(xué)習(xí)和進(jìn)步!

?

如果覺得不錯(cuò),在看、轉(zhuǎn)發(fā)就是對小編的一個(gè)支持!

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎

總結(jié)

以上是生活随笔為你收集整理的Github|类别不平衡学习资源(下)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。