阿里云机器学习PAI构建AI集团军作战,联手Intel在AI软硬件领域发力
第一屆“英特爾創(chuàng)新大師杯”深度學(xué)習(xí)挑戰(zhàn)賽已在阿里云天池平臺(tái)如火如荼的進(jìn)行中。本次大賽由英特爾主辦,阿里云計(jì)算平臺(tái)機(jī)器學(xué)習(xí) PAI 聯(lián)合達(dá)摩院以及中文信息協(xié)會(huì)等組織機(jī)構(gòu)聯(lián)合承辦,共有近 7500 支隊(duì)伍報(bào)名參賽,并取得了優(yōu)異的成績。
阿里云天池平臺(tái)是業(yè)界領(lǐng)先的科技眾智平臺(tái),旨在打造“數(shù)據(jù)眾智、眾創(chuàng)”的第一平臺(tái),此次舉辦的“英特爾創(chuàng)新大師杯”深度學(xué)習(xí)挑戰(zhàn)賽則是聚焦在當(dāng)下火熱的計(jì)算機(jī)視覺 OCR 領(lǐng)域以及自然語言處理 NLP 領(lǐng)域的經(jīng)典技術(shù)方向,希望通過比賽引導(dǎo)開發(fā)者們找到更創(chuàng)新優(yōu)化的技術(shù)解決方案,促進(jìn) AI 行業(yè)開發(fā)者們的技術(shù)交流。本次比賽的參賽選手中不僅有來自國內(nèi)外各個(gè)企業(yè)的代表,也有很多來自國內(nèi)知名高校的年輕選手,包括:北京大學(xué),復(fù)旦大學(xué),浙江大學(xué),華北電力大學(xué),重慶理工大學(xué),中國海洋大學(xué),北京科技大學(xué),北京交通大學(xué),華中科技大學(xué),西安電子科技大學(xué),四川大學(xué)等等。?
在現(xiàn)實(shí)場景中文字是人們生活中必不可少的部分,我們每天都在生活和工作中處理不可計(jì)數(shù)的文字信息,例如:書本中的文字,海報(bào)中的文字,票據(jù)中的文字等等。本次比賽 OCR 賽道的任務(wù)旨在解決這類光學(xué)文字的提取問題:如何將現(xiàn)實(shí)場景中出現(xiàn)的文字信息,更準(zhǔn)確的轉(zhuǎn)化為電子設(shè)備可以處理的文本信息,以滿足人們?cè)诓煌袠I(yè)應(yīng)用中的需求。?
此外,地址也是日常生活中一種重要且常用的文本信息,像是汽車導(dǎo)航、電商購物、快遞配送、人口普查、水電氣開戶等都需要我們用到地址信息。常見的地址可能會(huì)包含行政區(qū)劃信息,如省、市、縣、鄉(xiāng)鎮(zhèn)的信息;也有可能會(huì)包含路網(wǎng)信息,如路名,路號(hào),道路設(shè)施等; 智能地址要素解析可以將地址文本拆分成獨(dú)立語義的要素,并對(duì)這些要素進(jìn)行類型識(shí)別的過程。而智能地址文本相關(guān)性服務(wù)更可以幫助人類根據(jù)不同形式的地址表述來快速搜索定位到準(zhǔn)確的地址。?
本次“英特爾創(chuàng)新大師杯”深度學(xué)習(xí)挑戰(zhàn)賽正是由“通用場景 OCR 文本識(shí)別任務(wù)”、“NLP 地址要素解析任務(wù)”和“NLP 地址相關(guān)性任務(wù)”三個(gè)賽道組成,參賽選手可以自由報(bào)名參加任何賽道,發(fā)揮自己的算法技術(shù)和創(chuàng)造力,探索中文語義 AI 技術(shù)在各類日常生活實(shí)用場景中的應(yīng)用。?
值得一提的是,本次參賽的開發(fā)者可以在阿里云天池實(shí)驗(yàn)室提供的交互式建模平臺(tái) PAI-DSW 上進(jìn)行模型訓(xùn)練。PAI DSW(Data Science Workshop)由阿里云機(jī)器學(xué)習(xí)平臺(tái) PAI 于 2018 年針對(duì)算法開發(fā)人員推出的云端機(jī)器學(xué)習(xí)編程環(huán)境,在已有 PAI Studio 提供的組件化拖拉拽式模型訓(xùn)練服務(wù)的基礎(chǔ)上,提供了更具靈活性和自主性的模型開發(fā)和訓(xùn)練。PAI DSW 在集成 JupyterLab 的基礎(chǔ)上,內(nèi)置了豐富的數(shù)據(jù)開發(fā)和機(jī)器學(xué)習(xí)算法庫,并為天池參賽選手提供了多種免費(fèi)的計(jì)算資源,包括當(dāng)下主流的 CPU 和 GPU。?
事實(shí)上,“英特爾創(chuàng)新大師杯”深度學(xué)習(xí)挑戰(zhàn)賽只是 PAI 和 Intel 合作的一個(gè)縮影。PAI 和英特爾合作貫穿了從硬件至驅(qū)動(dòng)再到軟件,第七代高主頻實(shí)例包括了英特爾至強(qiáng)處理器,為機(jī)器學(xué)習(xí)平臺(tái)提供了非常大的優(yōu)化空間,例如在互聯(lián)網(wǎng)行業(yè),不管是在內(nèi)容推薦、廣告推薦、商品推薦這些領(lǐng)域,把內(nèi)容信息轉(zhuǎn)換成特征信息,需要使用非常多的自然語言處理技術(shù),英特爾產(chǎn)品 DL boost 能夠大幅提升 NLP 的效率,推升我們?cè)诠苍瓶蛻粢约皩S性瓶蛻羰褂闷脚_(tái)的性價(jià)比。CPU 硬件上集成了 BF16 加速指令能夠大幅度提升 PAI 訓(xùn)練平臺(tái)加速的效率,同時(shí) AVX-512 指令集提供通用的底層算子。軟件搭配英特爾? oneAPI 深度神經(jīng)網(wǎng)絡(luò)庫(oneDNN)非常容易集成,降低優(yōu)化和使用門檻。?
PAI 和英特爾在 AI 領(lǐng)域的合作,可以說是一次成功的強(qiáng)強(qiáng)合作。英特爾對(duì)于自己硬件性能的理解以及我們對(duì)于在模型上面對(duì)訓(xùn)練對(duì)場景的理解,形成一個(gè)更好的聯(lián)動(dòng),把 AI 自動(dòng)化能夠做起來,我們的用戶更加隨心所欲地進(jìn)行模型的變化。雙方合作具備領(lǐng)先性,能夠推動(dòng)業(yè)界標(biāo)準(zhǔn)的提高,在 benchmark(全球 AI 性能榜單)上進(jìn)一步去發(fā)布結(jié)果,推動(dòng)整個(gè) CPU 平臺(tái)工作的演進(jìn)。?
從英特爾和阿里云 PAI 的合作也可以窺探出整個(gè) AI 技術(shù)的發(fā)展趨勢(shì)在向智能化、自動(dòng)化以及工程化發(fā)展。Gartner 將「AI 工程化」列為 2021 年度九大重要戰(zhàn)略科技趨勢(shì)之一。AI 要成為企業(yè)生產(chǎn)力,就必須以工程化的技術(shù)來解決模型開發(fā)、部署、管理、預(yù)測(cè)等全鏈路生命周期管理的問題。?
針對(duì) AI 工程化落地的實(shí)踐經(jīng)驗(yàn),阿里云認(rèn)為模型超大規(guī)模化是非常重要的一個(gè)基礎(chǔ)能力。2021 年初,阿里云機(jī)器學(xué)習(xí) PAI、達(dá)摩院智能計(jì)算實(shí)驗(yàn)室聯(lián)合清華大學(xué)共同開發(fā)了業(yè)界最大規(guī)模的中文多模態(tài)預(yù)訓(xùn)練模型 M6。PAI 團(tuán)隊(duì)自研 Whale 分布式訓(xùn)練框架,在計(jì)算效率、通信效率、顯存消耗等多個(gè)方面進(jìn)行了深度優(yōu)化,從而幫助 M6 模型快速迭代訓(xùn)練。?
基于機(jī)器學(xué)習(xí)平臺(tái) PAI,阿里云希望構(gòu)建大規(guī)模 AI 端到端的能力,從底層芯片到分布式系統(tǒng),再到上層算法和數(shù)據(jù)的規(guī)模化,打造 AI 工程化集團(tuán)作戰(zhàn)的能力,服務(wù)于各行各業(yè)。?
點(diǎn)擊閱讀原文查看大賽主頁
總結(jié)
以上是生活随笔為你收集整理的阿里云机器学习PAI构建AI集团军作战,联手Intel在AI软硬件领域发力的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 系统安装怎么启动u盘安装win7系统 使
- 下一篇: 深圳招聘 | 元象唯思:决策AI研发工程