日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

飞桨端到端开发套件揭秘:四大秘密武器,让你的开发效率直线提升

發(fā)布時間:2024/10/8 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 飞桨端到端开发套件揭秘:四大秘密武器,让你的开发效率直线提升 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
11 月 5 日,在 Wave Summit+2019 深度學(xué)習(xí)開發(fā)者峰會上,飛槳全新發(fā)布和重要升級了最新的 21 項進展,在深度學(xué)習(xí)開發(fā)者社區(qū)引起了巨大的反響。
很多未到場的開發(fā)者覺得遺憾,希望可以了解飛槳發(fā)布會背后的更多技術(shù)細節(jié),因此我們特別策劃了一個系列稿件,分別從核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件、工具組件和服務(wù)平臺五個層面分別詳細解讀飛槳的核心技術(shù)與最新進展,敬請關(guān)注。
今天給大家?guī)淼氖窍盗形恼轮w槳的端到端開發(fā)套件解讀。
飛槳全新發(fā)布包含語義理解(ERNIE),目標檢測(PaddleDetection),圖像分割(PaddleSeg)和點擊率預(yù)估(ElasticCTR)四大端到端開發(fā)套件,旨在通過模塊化的設(shè)計和端到端的體驗,滿足企業(yè)低成本開發(fā)和快速集成需求。核心內(nèi)容3503字,預(yù)計閱讀時間4分鐘。

端到端開發(fā)套件的初心


飛槳發(fā)布端到端開發(fā)套件的初心,是為了更好滿足開發(fā)者的低開發(fā)成本、快速集成需求而來的。開發(fā)者的時間、人力非常寶貴,效率提升非常重要。為了要解放開發(fā)者勞動力,降低開發(fā)的成本,同時能夠快速的集成和部署,飛槳推出了端到端開發(fā)套件。
端到端開發(fā)套件具有以下三個通用特點:一是滿足真正的工業(yè)場景中性能要求,保持性能領(lǐng)先;二是開發(fā)簡單易用,高效解決問題;三是打通端到端流程,落地高效易部署。

對于端到端體驗的流程中,數(shù)據(jù)處理也是非常重要的環(huán)節(jié),飛槳通過扎實打通端到端流程,模塊和的設(shè)計,提供一系列的工具箱輔助開發(fā)者去解決。目前發(fā)布的四大端到端開發(fā)套件,非常具有典型性,可以覆蓋主流一大部分任務(wù)。

四大開發(fā)套件詳細解讀


ERNIE語義理解



ERNIE 全景圖,預(yù)置了包含 ERNIE 通用模型、ERNIE 任務(wù)模型、ERNIE 領(lǐng)域模型以及本次發(fā)布的 ERNIE Tiny 輕量級模型等系列預(yù)訓(xùn)練模型。在此基礎(chǔ)上,構(gòu)建了包含工具和平臺的飛槳語義理解開發(fā)套件。全面覆蓋了訓(xùn)練、調(diào)優(yōu)、部署等開發(fā)流程,具備輕量方案、能力全面、極速預(yù)測、部署靈活、平臺賦能等五大特色。
今年 7 月份,百度發(fā)布持續(xù)學(xué)習(xí)語義理解框架 ERNIE 2.0,在共計 16 個中英文任務(wù)上超越 BERT、XLNET,取得了 SOTA 的效果。同時 ERNIE 2.0 發(fā)布以來,ERNIE 產(chǎn)業(yè)化應(yīng)用進程不斷加速,易用性不斷提升,配套產(chǎn)品也不斷豐富和完善。目前 ERNIE 2.0 在百度內(nèi)部及行業(yè)內(nèi)已取得了廣泛應(yīng)用,在多種場景下都取得了明顯效果提升。這些場景的成功運用為 ERNIE 產(chǎn)業(yè)化應(yīng)用積累了豐富的經(jīng)驗。?
特色1:輕量級解決方案,預(yù)測速度提升1000倍

ERNIE 2.0 擁有強大的語義理解能力,而這些能力需要強大的算力才能充分發(fā)揮,這為實際應(yīng)用帶來了非常大的挑戰(zhàn)。為此,百度發(fā)布輕量級預(yù)訓(xùn)練模型 ERNIE Tiny 以及一鍵式數(shù)據(jù)蒸餾工具 ERNIE Slim,預(yù)測速度提升達到 1000 倍。?
特色2:一鍵式高性能全類微調(diào)工具

ERNIE Fine-tune 微調(diào)工具旨在為給開發(fā)者提供一套簡單好用的 Fine-tune 框架,目前覆蓋 NLP 四大常用任務(wù):單句分類、句對匹配、命名實體識別、閱讀理解。工具集支持多機多卡 Fine-tune,同時使用 FP16 Tensor Core 技術(shù)在 Tesla V 系列 GPU 上獲得 60% 的訓(xùn)練速度提升。
特色3:極速預(yù)測API

ERNIE Fast-inference API 旨在解決產(chǎn)品應(yīng)用的延遲敏感場景,為企業(yè)開發(fā)者提供極速預(yù)測的 C++ API,便于開發(fā)者集成。該工具也充分借助了最新版飛槳的高速預(yù)測優(yōu)勢,飛槳 1.6 通過 OP 聚合算法,有效加速了 ERNIE 的預(yù)測。
在延遲敏感場景下,對比競品在 GPU(P4) 設(shè)備 21% 的延遲降低,ERNIE Fast-inference API 在 CPU(Intel Xeon Gold 6148 CPU)設(shè)備上延遲降低 60%。
特色4:向量服務(wù)器,支持跨平臺靈活部署
為進一步降低開發(fā)者使用成本,套件提供預(yù)測服務(wù)方案——ERNIE Service,來方便獲取 ERNIE 模型的向量分布以及預(yù)測打分。
ERNIE Service 是基于 Python 構(gòu)建的多 GPU 預(yù)測服務(wù),Client 端發(fā)送的請求會自動分發(fā)至 GPU 上執(zhí)行 ERNIE Fast-inference API 來獲取 ERNIE 向量及打分。目前 ERNIE Service 支持不同平臺、不同設(shè)備、不同語言的靈活調(diào)用,具備預(yù)測性能高等特點,相比競品 BERT-as-service 在 QPS 上提升 13%。
特色5:平臺賦能
此外,套件還包含了 ERNIE 的平臺化使用方案,開發(fā)者可通過 EasyDL 專業(yè)版一站式完成 NLP 任務(wù)的數(shù)據(jù)標注、處理、ERNIE 微調(diào)、優(yōu)化、部署等全流程的功能,為開發(fā)者提供豐富的算法、算力服務(wù),進一步降低 ERNIE 的產(chǎn)業(yè)化應(yīng)用門檻。平臺預(yù)置了常用的 NLP 文本分類、文本匹配等經(jīng)典網(wǎng)絡(luò),能夠快速滿足多層次開發(fā)者的需求。


綜合來看,ERNIE 的語義理解開發(fā)套件依托百度在預(yù)訓(xùn)練模型等自然語言處理技術(shù)和飛槳平臺領(lǐng)先優(yōu)勢,為人工智能產(chǎn)業(yè)化大生產(chǎn)貢獻力量,賦能各行各業(yè)。

PaddleDetection圖像分割


在計算機視覺領(lǐng)域,圖像分割有非常廣泛應(yīng)用的場景。基于這樣背景,飛槳開發(fā)了圖像分割開發(fā)套件 PaddleSeg,目標是降低開發(fā)門檻,更容易實現(xiàn)產(chǎn)業(yè)落地。
圖像分割開發(fā)套件基于飛槳的核心框架,主要做了以下方向的建設(shè):一是數(shù)據(jù)增強,將工業(yè)級常用分割算法開放出來;二是在模型層使用模塊化的設(shè)計,將整個分割的模型拆分成三塊,包括骨干網(wǎng)絡(luò)、分割網(wǎng)絡(luò)和模型損失函數(shù)。拆解之后,可以讓這些模塊自由組合,能夠解決特定場景的問題。三是在訓(xùn)練場景上,PaddleSeg 里面做了大量性能方面的優(yōu)化,在顯存優(yōu)化和預(yù)測速度上都做了大量的工作。四是易用性方面,通過實際的項目打磨驗證,找到使用過程當中的痛點并且解決掉。訓(xùn)練模型工業(yè)級部署,開發(fā)套件也做了集成,可以幫助廣泛開發(fā)者使用。
特色1:豐富的數(shù)據(jù)增強
PaddleSeg 提供 10 余種數(shù)據(jù)增強的策略,有效的訓(xùn)練數(shù)據(jù),大幅度提升模型的魯棒性,開發(fā)者可以根據(jù)實際的場景進行靈活組合,根據(jù)實際場景進行選用,讓整個分割模型應(yīng)用泛化能力更強。
特色2:模塊化的設(shè)計
整個 PaddleSeg 開發(fā)套件都是模塊化設(shè)計的,無論是數(shù)據(jù)增強模塊里面的多種增強算法,主干網(wǎng)絡(luò)的多種 Backbone 模塊選擇,都可以讓開發(fā)者更好的根據(jù)實際業(yè)務(wù)場景需求使用。分割網(wǎng)絡(luò)包含了目前的 4 種主流網(wǎng)絡(luò):醫(yī)療領(lǐng)域常見的 U-Net,經(jīng)典的 DeepLabV3,面向?qū)崟r場景的分割模型 ICNet 等。同時對于損失函數(shù)的模塊化設(shè)計,也可以更好的提升各個分類場景下的分割精度,例如小目標分割的效果。
特色3:高性能
PaddleSeg 在性能優(yōu)化方面開展了很多工作。包括訓(xùn)練速度提升、GPU 利用率提升以及顯存性能優(yōu)化。同時支持較新的 FP16 混合精度的訓(xùn)練。特別的,對于動態(tài)的 Loss Scaling,在不損失精度的情況下,性能可以有 30% 的提升。PaddleSeg 在英偉達特斯拉 V100 卡上,單卡訓(xùn)練速度是對標產(chǎn)品的 2.3 倍,多卡上是對標產(chǎn)品的 3.1 倍。特色4:工業(yè)級部署
根據(jù)產(chǎn)業(yè)的需求,PaddleSeg 開發(fā)了高性能的 C++ 預(yù)測庫。在多線程計算優(yōu)化、算子硬件加速方面,而且依托于真實的項目實踐驗證做了大量優(yōu)化工作,真正滿足工業(yè)級部署需求。
PaddleSeg 目前已經(jīng)在廣泛場景中應(yīng)用,無論是工業(yè)質(zhì)檢中的精密零件的智能分揀,以及經(jīng)典的人像分割場景的應(yīng)用,還有遙感領(lǐng)域的地塊分割,都可以很好的輔助完成行業(yè)的 AI 賦能。

PaddleDetection目標檢測

?


PaddleDetection 是基于飛槳核心框架,結(jié)合百度科研和業(yè)務(wù)的需求,構(gòu)建的目標檢測開發(fā)套件。從全景圖可以看到,套件中主要不僅包含各個檢測算法實現(xiàn),而且提供一系列的優(yōu)化組件,以及更好的輔助調(diào)試的可視化的模塊。同時,還提供了加速訓(xùn)練相關(guān)的混合精度的訓(xùn)練模塊以及豐富的算法組件。

特點1:模型豐富
在算法層面,PaddleDetection 支持了目前常用的主流檢測算法,單階段檢測算法包括:SSD,RetinaNet,YOLOv3,兩階段檢測算法包括:Faster-RCNN,Mask-RCNN,Cascade-RCNN,支持兩階段的 FPN。在主干網(wǎng)、數(shù)據(jù)增強、在預(yù)訓(xùn)練模型方面,都提供了很好的支持。
本次發(fā)布還進一步增強了 YOLOv3,基于 COCO 的 mAP 再進一步提升至 41.4%,GPU 上的推理速度進一步提升。本次還發(fā)布了 BlazeFace 等系列人臉檢測模型,同時還發(fā)布了自研的搜索版本 BlazeFace,模型大小壓縮三倍的情況下,大幅提升預(yù)測速度。特別強調(diào)一下,預(yù)訓(xùn)練模型中的行人檢測和車輛檢測的模型,是基于百度內(nèi)部的業(yè)務(wù)數(shù)據(jù)得到效果不錯的模型,值得推薦。
特點2:高性能
PaddleDetection 在訓(xùn)練速度、訓(xùn)練顯存和推理速度上,大部分模型都優(yōu)于對標產(chǎn)品的性能。

特點3:工業(yè)級部署
PaddleDetection 基于飛槳高性能的引擎,提供了一套完備的部署方案。對于 Linux 和 Windows 都提供了良好的支持,GPU 預(yù)測底層支持 TensorRT 加速以及 FP16 預(yù)測。CPU 底層支持使用 MKLDNN 加速。再加上 PaddleSlim 提供的模型壓縮策略,可以提供更小的模型和更快的速度,滿足工業(yè)級部署的需求。
PaddleDetection 目前已經(jīng)廣泛的在智慧交通、安防監(jiān)控和商品檢索上實現(xiàn)落地引用,并且取得了良好的應(yīng)用效果。

ElasticCTR點擊率預(yù)估


ElasticCTR 個性化預(yù)估,是工業(yè)推薦場景下的常見需求,與工業(yè)實踐的關(guān)聯(lián)度非常高。以飛槳核心框架為核心,ElasticCTR 實現(xiàn)了大量的技術(shù)突破:通過與資源調(diào)度平臺深度集成提高資源調(diào)度的效率;在分布式訓(xùn)練的環(huán)節(jié),提供全異步的參數(shù)服務(wù)器方案、流式訓(xùn)練和高性能的 IO 接口;最終,通過高性能的 KV 預(yù)估和一鍵部署工具實現(xiàn)工業(yè)級部署。

ElasticCTR 源自真實產(chǎn)業(yè)實踐,與原生 K8S 無縫結(jié)合,通過針對深度學(xué)習(xí)任務(wù)進行彈性調(diào)度的處理,可以大幅節(jié)約資源消耗。性能方面,全異步分布式 CPU 訓(xùn)練速度是對標產(chǎn)品的6倍,工業(yè)級部署性能是對標產(chǎn)品的 13 倍,非常適合大規(guī)模 CTR 的應(yīng)用場景。想與更多的深度學(xué)習(xí)開發(fā)者交流,請加入飛槳官方 QQ 群:796771754。
如果您想詳細了解更多飛槳 PaddlePaddle 的相關(guān)內(nèi)容,請參閱以下文檔。
官網(wǎng)地址:https://www.paddlepaddle.org.cn/
項目地址:
ERNIE語義理解:https://github.com/PaddlePaddle/ERNIE
PaddleSeg圖像分割:https://github.com/PaddlePaddle/PaddleSeg
PaddleDetection目標檢測:https://github.com/PaddlePaddle/PaddleDetection
ElasticCTR個性化預(yù)估:https://paddlepaddle.github.io/Serving/doc/ELASTIC_CTR.html

飛槳系列文章之核心框架揭秘

飛槳系列文章之基礎(chǔ)模型庫解讀

????現(xiàn)在,在「知乎」也能找到我們了進入知乎首頁搜索「PaperWeekly」點擊「關(guān)注」訂閱我們的專欄吧關(guān)于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學(xué)術(shù)平臺。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

總結(jié)

以上是生活随笔為你收集整理的飞桨端到端开发套件揭秘:四大秘密武器,让你的开发效率直线提升的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。