阿里云机器学习PAI构建AI集团军作战,联手Intel在AI软硬件领域发力
第一屆“英特爾創(chuàng)新大師杯”深度學習挑戰(zhàn)賽已在阿里云天池平臺如火如荼的進行中。本次大賽由英特爾主辦,阿里云計算平臺機器學習 PAI 聯(lián)合達摩院以及中文信息協(xié)會等組織機構(gòu)聯(lián)合承辦,共有近 7500 支隊伍報名參賽,并取得了優(yōu)異的成績。
阿里云天池平臺是業(yè)界領先的科技眾智平臺,旨在打造“數(shù)據(jù)眾智、眾創(chuàng)”的第一平臺,此次舉辦的“英特爾創(chuàng)新大師杯”深度學習挑戰(zhàn)賽則是聚焦在當下火熱的計算機視覺 OCR 領域以及自然語言處理 NLP 領域的經(jīng)典技術方向,希望通過比賽引導開發(fā)者們找到更創(chuàng)新優(yōu)化的技術解決方案,促進 AI 行業(yè)開發(fā)者們的技術交流。本次比賽的參賽選手中不僅有來自國內(nèi)外各個企業(yè)的代表,也有很多來自國內(nèi)知名高校的年輕選手,包括:北京大學,復旦大學,浙江大學,華北電力大學,重慶理工大學,中國海洋大學,北京科技大學,北京交通大學,華中科技大學,西安電子科技大學,四川大學等等。?
在現(xiàn)實場景中文字是人們生活中必不可少的部分,我們每天都在生活和工作中處理不可計數(shù)的文字信息,例如:書本中的文字,海報中的文字,票據(jù)中的文字等等。本次比賽 OCR 賽道的任務旨在解決這類光學文字的提取問題:如何將現(xiàn)實場景中出現(xiàn)的文字信息,更準確的轉(zhuǎn)化為電子設備可以處理的文本信息,以滿足人們在不同行業(yè)應用中的需求。?
此外,地址也是日常生活中一種重要且常用的文本信息,像是汽車導航、電商購物、快遞配送、人口普查、水電氣開戶等都需要我們用到地址信息。常見的地址可能會包含行政區(qū)劃信息,如省、市、縣、鄉(xiāng)鎮(zhèn)的信息;也有可能會包含路網(wǎng)信息,如路名,路號,道路設施等; 智能地址要素解析可以將地址文本拆分成獨立語義的要素,并對這些要素進行類型識別的過程。而智能地址文本相關性服務更可以幫助人類根據(jù)不同形式的地址表述來快速搜索定位到準確的地址。?
本次“英特爾創(chuàng)新大師杯”深度學習挑戰(zhàn)賽正是由“通用場景 OCR 文本識別任務”、“NLP 地址要素解析任務”和“NLP 地址相關性任務”三個賽道組成,參賽選手可以自由報名參加任何賽道,發(fā)揮自己的算法技術和創(chuàng)造力,探索中文語義 AI 技術在各類日常生活實用場景中的應用。?
值得一提的是,本次參賽的開發(fā)者可以在阿里云天池實驗室提供的交互式建模平臺 PAI-DSW 上進行模型訓練。PAI DSW(Data Science Workshop)由阿里云機器學習平臺 PAI 于 2018 年針對算法開發(fā)人員推出的云端機器學習編程環(huán)境,在已有 PAI Studio 提供的組件化拖拉拽式模型訓練服務的基礎上,提供了更具靈活性和自主性的模型開發(fā)和訓練。PAI DSW 在集成 JupyterLab 的基礎上,內(nèi)置了豐富的數(shù)據(jù)開發(fā)和機器學習算法庫,并為天池參賽選手提供了多種免費的計算資源,包括當下主流的 CPU 和 GPU。?
事實上,“英特爾創(chuàng)新大師杯”深度學習挑戰(zhàn)賽只是 PAI 和 Intel 合作的一個縮影。PAI 和英特爾合作貫穿了從硬件至驅(qū)動再到軟件,第七代高主頻實例包括了英特爾至強處理器,為機器學習平臺提供了非常大的優(yōu)化空間,例如在互聯(lián)網(wǎng)行業(yè),不管是在內(nèi)容推薦、廣告推薦、商品推薦這些領域,把內(nèi)容信息轉(zhuǎn)換成特征信息,需要使用非常多的自然語言處理技術,英特爾產(chǎn)品 DL boost 能夠大幅提升 NLP 的效率,推升我們在公共云客戶以及專有云客戶使用平臺的性價比。CPU 硬件上集成了 BF16 加速指令能夠大幅度提升 PAI 訓練平臺加速的效率,同時 AVX-512 指令集提供通用的底層算子。軟件搭配英特爾? oneAPI 深度神經(jīng)網(wǎng)絡庫(oneDNN)非常容易集成,降低優(yōu)化和使用門檻。?
PAI 和英特爾在 AI 領域的合作,可以說是一次成功的強強合作。英特爾對于自己硬件性能的理解以及我們對于在模型上面對訓練對場景的理解,形成一個更好的聯(lián)動,把 AI 自動化能夠做起來,我們的用戶更加隨心所欲地進行模型的變化。雙方合作具備領先性,能夠推動業(yè)界標準的提高,在 benchmark(全球 AI 性能榜單)上進一步去發(fā)布結(jié)果,推動整個 CPU 平臺工作的演進。?
從英特爾和阿里云 PAI 的合作也可以窺探出整個 AI 技術的發(fā)展趨勢在向智能化、自動化以及工程化發(fā)展。Gartner 將「AI 工程化」列為 2021 年度九大重要戰(zhàn)略科技趨勢之一。AI 要成為企業(yè)生產(chǎn)力,就必須以工程化的技術來解決模型開發(fā)、部署、管理、預測等全鏈路生命周期管理的問題。?
針對 AI 工程化落地的實踐經(jīng)驗,阿里云認為模型超大規(guī)模化是非常重要的一個基礎能力。2021 年初,阿里云機器學習 PAI、達摩院智能計算實驗室聯(lián)合清華大學共同開發(fā)了業(yè)界最大規(guī)模的中文多模態(tài)預訓練模型 M6。PAI 團隊自研 Whale 分布式訓練框架,在計算效率、通信效率、顯存消耗等多個方面進行了深度優(yōu)化,從而幫助 M6 模型快速迭代訓練。?
基于機器學習平臺 PAI,阿里云希望構(gòu)建大規(guī)模 AI 端到端的能力,從底層芯片到分布式系統(tǒng),再到上層算法和數(shù)據(jù)的規(guī)模化,打造 AI 工程化集團作戰(zhàn)的能力,服務于各行各業(yè)。?
點擊閱讀原文查看大賽主頁
總結(jié)
以上是生活随笔為你收集整理的阿里云机器学习PAI构建AI集团军作战,联手Intel在AI软硬件领域发力的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 系统安装怎么启动u盘安装win7系统 使
- 下一篇: 深圳招聘 | 元象唯思:决策AI研发工程