【机器学习】推荐一个好用的开源automl工具
AutoX
AutoX是第四范式開源的針對表數(shù)據(jù)的自動機(jī)器學(xué)習(xí)工具。
主要功能包括兩點:?
一、提供全流程的自動機(jī)器學(xué)習(xí)pipeline;
二、用戶可以把它的某一個某功能單獨拿出來,作為生產(chǎn)力工具,完成機(jī)器學(xué)習(xí)中的某一個環(huán)節(jié),例如,自動特征篩選、自動調(diào)參等。
項目地址
Github地址:
https://github.com/4paradigm/autox
效果對比
選取的數(shù)據(jù)包含分類/回歸/時間序列預(yù)測、單表/多表,AutoX在大多數(shù)的數(shù)據(jù)上,效果都由于其他產(chǎn)品。
不同任務(wù)下的效果對比:
AutoX技術(shù)方案
AutoX的整體技術(shù)方案包含了機(jī)器學(xué)習(xí)的全流程,我們在每一個流程都做了打磨和優(yōu)化。廢話不多說,直接上圖。
數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理模塊包含了異常值處理,缺失值填充,自動類型推斷,內(nèi)存優(yōu)化。
自動拼表
表關(guān)系的識別和自動拼表,這一步讓autox具有了處理多表數(shù)據(jù)的能力。
特征工程
特征工程這一塊也是我們效果優(yōu)于其他產(chǎn)品的關(guān)鍵點。
特征構(gòu)造方面,主要是通過對比賽、行業(yè)數(shù)據(jù)的top方案的總結(jié)和抽象,設(shè)計出一系列關(guān)鍵特征。
特征選擇方面,包括兩塊,一個是常規(guī)的特征選擇模型,另一方面是通過mate特征的方式來實現(xiàn)特征的抽象聚合。
模型選擇
模型選擇采用了主流的樹模型和nn模型。
模型調(diào)參
基于貝葉斯的調(diào)參,也使用了目前較優(yōu)秀的第三方庫optuna。
模型融合
包含bagging和stacking策略。
模型可解釋方法
autox也實現(xiàn)了一些優(yōu)秀的模型可解釋方法。包括全局代理模型、局部代理模型、影響力樣本、代表性樣本和非代表性樣本。
往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機(jī)器學(xué)習(xí)及深度學(xué)習(xí)筆記等資料打印機(jī)器學(xué)習(xí)在線手冊深度學(xué)習(xí)筆記專輯《統(tǒng)計學(xué)習(xí)方法》的代碼復(fù)現(xiàn)專輯 AI基礎(chǔ)下載黃海廣老師《機(jī)器學(xué)習(xí)課程》視頻課黃海廣老師《機(jī)器學(xué)習(xí)課程》711頁完整版課件本站qq群955171419,加入微信群請掃碼:
總結(jié)
以上是生活随笔為你收集整理的【机器学习】推荐一个好用的开源automl工具的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ie浏览器安全使用网银支付功能方法
- 下一篇: 腾讯视频免费下载安装_怎样下载腾讯视频里