客户说有了PAI-AutoML,一下子可以节约半年开发周期
背景介紹
如果你用過機器學習算法,那一定體驗被算法調(diào)參支配的恐怖。面對錯綜復雜的算法參數(shù),算法使用者們往往要花費無盡的黑夜去不斷嘗試,猶如大海撈針。有的時候加班到深夜,終于找到了一個靠譜的參數(shù)組合,然而找到的參數(shù)組合真的是最優(yōu)的么?天知道。
然而在搭建機器學習鏈路的過程中,往往不止調(diào)參這一步耗時耗力。好不容易生成了算法模型,怎么把模型部署成服務供手機、PC這些終端調(diào)用也是困擾開發(fā)同學的一大難題。有的時候,為了打通這樣的鏈路,要耗費整晚的時間調(diào)試不同格式的模型和服務端的關聯(lián)。
人工智能服務在便捷了人類生活的同時,能不能也為廣大算法工程師提供人性化的開發(fā)環(huán)境呢?減少黑眼圈是算法工程師共同的心愿。對于這個問題,PAI給出了答案,今日PAI重磅發(fā)布全套自動化機器學習引擎,用機器學習的方式解決機器學習流程的問題。
AutoML整體介紹
下面看看什么是PAI-AutoML, AutoML顧名思義,就是將機器學習整個流程做到自動化。機器學習數(shù)據(jù)上傳之后的流程大致可以分為3個步驟:模型訓練、模型評估、模型部署。
PAI自動調(diào)參
PAI自動調(diào)參功能對于資深算法使用者以及算法小白都有很大價值:
? 針對小白用戶:小白用戶不清楚每種算法參數(shù)在算法計算過程中的數(shù)學原理,往往對調(diào)參一頭霧水,所以自動調(diào)參可以快速幫助這部分用戶解決問題
? 針對資深用戶:資深用戶對于調(diào)參往往有一定經(jīng)驗,但是這種經(jīng)驗往往只能在大方向上指導調(diào)參工作,對于一些細節(jié)參數(shù)仍需要不斷重復去嘗試。比如一個參數(shù)范圍0~100,資深用戶可以通過經(jīng)驗確定參數(shù)設置為90或者80的結果,但是在更小粒度上,比如81和82哪個對結果更好,資深用戶也需要手動去實驗。而自定調(diào)參功能可以代替這部分的重復性勞動。
目前行業(yè)中主流的調(diào)參思想主要是基于Parallel Search,以grid search和random search為代表,系統(tǒng)通過隨機原理,不斷采樣可能的參數(shù)組合,通過不停迭代去嘗試找到最優(yōu)的參數(shù)組,每次探索的過程彼此獨立。優(yōu)勢是不容易陷入局部最優(yōu)解,可以在更廣闊的參數(shù)空間探索。劣勢是每次探索都是隨機性的,缺乏信息的積累過程,耗費計算資源。
PAI提供了原創(chuàng)的Evolutionary Optimizer進化式的調(diào)參方法,讓模型的每一次迭代都自動在上一輪較優(yōu)的參數(shù)集區(qū)間中進行開發(fā),內(nèi)置的高效算法可以快速的幫你找到最合適的參數(shù)組合,大大減少計算資源消耗以及參數(shù)探索的次數(shù)。你要做的只是泡上一壺茶,靜靜等待奇跡的降臨。
PAI進化式調(diào)參迭代效果圖,可以清楚地看到每一輪迭代對于效果的提升:
PAI模型自動評估
PAI AutoML提供多維度的算法評估方法,只要在F1Score、Precision、Recall、AUC中選擇自己所需要的評估指標,系統(tǒng)會自動完成模型評估工作并將服務下發(fā)到下游的訓練環(huán)境,所有評估流程完全不需人工參與。
模型排序表:
模型下發(fā)配置:
PAI模型一鍵發(fā)布
生成了模型,可以在PAI平臺一鍵將模型發(fā)布成API服務。只要點擊部署按鈕,就會列出當前實驗可部署的模型,選擇需要的模型就可以一鍵完成部署,是不是很簡單。
部署完成后會自動跳轉(zhuǎn)到在線服務管控平臺,在這里可以進行全部的模型管理相關工作。
客戶案例
PAI-AutoML看上去很厲害,是不是真正能幫助到用戶的業(yè)務呢,下面看下PAI在阿里云平臺上用戶使用之后的反饋。先介紹下客戶:椰子傳媒是一家專注在移動原生交互視頻廣告的公司,在獎勵視頻行業(yè)深耕了2年多,隨著業(yè)務規(guī)模的增長,多平臺、多渠道,多模式下的智能投放效率問題越來越突出。
椰子科技技術負責人說:阿里PAI平臺提供了一個低門檻、快速上手的服務能力,使得業(yè)務可以快速的對接到基于大數(shù)據(jù)的機器學習平臺上,有力的推動公司業(yè)務的快速發(fā)展。基于PAI AutoML引擎,可以讓我們更快速的在不同平臺和模式下定位目標用戶。
椰子傳媒通過使用PAI AutoML引擎,調(diào)參服務幫助模型提升精度40%,自動化部署預計全部業(yè)務上線后可達千萬次,節(jié)省人力20%-30%,最重要的是將業(yè)務構建在機器學習服務平臺的時間縮短了至少半年時間。
架構圖:
總結
PAI AutoML引擎擬在最大限度上減少機器學習業(yè)務搭建成本,目前上線的模型訓練參數(shù)調(diào)優(yōu)和模型一鍵自動部署服務已經(jīng)在節(jié)約人力開銷方面提供幫助。未來PAI平臺還會在這個方向繼續(xù)投入,真正做到讓機器學習不再是個高門檻技術,讓人工智能觸手可及。
歡迎前來體驗:https://data.aliyun.com/product/learn
了解更多大數(shù)據(jù)家族產(chǎn)品詳情,歡迎點擊:
https://et.aliyun.com/bigdatarelease
點擊觀看大數(shù)據(jù)家族產(chǎn)品發(fā)布會:
https://yq.aliyun.com/webinar/play/508
【阿里云新品發(fā)布】開啟新一代數(shù)據(jù)智能開發(fā)之路:
https://yq.aliyun.com/roundtable/325525
總結
以上是生活随笔為你收集整理的客户说有了PAI-AutoML,一下子可以节约半年开发周期的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 算法参数介绍
- 下一篇: MikroTik RouterOS获取在