旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问
萬萬沒想到,我和小伙伴們被曠廠拿去「煉丹」了。
沒錯,就是這個煉丹爐!
站在爐子中央,各種算法代碼眼前飛閃,讓我體驗了一把時空穿梭的快樂。
OMG!真·顱內(nèi)高潮...
業(yè)界認為「煉丹」過程正如算法研究過程。
眾所周知,AI的三大支柱分別是數(shù)據(jù)、算法、算力。
那么在煉丹過程中,數(shù)據(jù)便是金木水火土等自然元素,算法框架是用來煉丹的爐子,算力就是煉丹爐下的三昧真火。
元素全不全,爐子好不好,火旺不旺決定了AI開發(fā)者能不能練出一顆AI的「靈丹妙藥」。
從2014年至今,中國新一代煉丹宗師曠視經(jīng)過多年的磨練打磨,打造了「煉丹房」—— Brain++。
MegEngine(深度學習框架天元)是丹爐,MegData(數(shù)據(jù)管理平臺)是元素,MegCompute(深度學習云計算平臺)便是那三昧真火。
這次,「煉丹房」 Brain++ 迎來了全新升級!
升級后的煉丹房,「自動」成為最大特色,煉丹師們不再需要經(jīng)過九九八十一天這么漫長的時間來煉制丹藥。
這個平臺提供了怎樣的最新功能,讓AI開發(fā)者們更輕便地生產(chǎn)算法?
Brain++「神助攻」:一個「旗幟檢測」算法誕生
熟悉曠視的人都應該知道,Brain++ 是曠視在AI領域創(chuàng)業(yè)多年的致勝法寶。
它將算法、算力和數(shù)據(jù)能力集為一體,核心能力包括:
數(shù)據(jù)的處理、清洗和管理能力,算力的共享、調(diào)度和分布式能力,算法的訓練、推理及部署能力。
全面覆蓋了從 AI 生產(chǎn)(輸出算法模型)到應用(實現(xiàn)算法工程化封裝)各環(huán)節(jié)。
因此,Brain++被內(nèi)部定義為「AI生產(chǎn)力平臺」。
但時局變了,數(shù)據(jù)滿溢,算力飛升,算法無處不在。許多開發(fā)者們真正面臨的挑戰(zhàn)是:如何讓算法生產(chǎn)更加高效?
要知道,算法生產(chǎn)能力決定算法價值上限。
當前的算法生產(chǎn)不僅僅是模型的訓練,還包括需求分析、數(shù)據(jù)處理、上線部署、落地應用4個環(huán)節(jié)。
過程標準化是影響算法生產(chǎn)的關鍵要素,只有過程標準化才能實現(xiàn)算法生產(chǎn)的自動化。
讓算法生產(chǎn)邁向自動化時代,便是Brain++迎接這一挑戰(zhàn)的底氣!
自動化的數(shù)據(jù)管理和質(zhì)檢——自動推薦合適的訓練算法和模型——自動檢查算法準確率并給出優(yōu)化建議便是升級后Brain++的最新功能。
舉個真實場景中的例子,
在鋼鐵冶煉廠中,存在一些比較危險的設備。根據(jù)生產(chǎn)安全的要求,這些設備周圍需要插小紅旗來做警示和標志。
如何能夠檢測出小紅旗是否還插著?
這就需要做一個紅旗檢測的模型,通過安裝的攝像頭來進行自動化檢查。
需求明確后就需要進行算法生產(chǎn)了。
首先,Brain++提供自動化的數(shù)據(jù)管理和質(zhì)檢,包含十余種質(zhì)檢策略,這個過程中可以排除無意義的數(shù)據(jù)。
下面這2個紅旗就是通過自動化平臺所發(fā)現(xiàn),圖片的畫風其實和我們真實場景中的差別非常大,就屬于一些無效數(shù)據(jù),或者說噪音數(shù)據(jù)。
平臺自動檢測出后,就會在訓練模型前幫你剔除。
然后便開始模型自動化訓練,平臺會根據(jù)部署資源的要求,為開發(fā)者自動推薦最合適的訓練算法和策略。
這一環(huán)節(jié)中,就不需要開發(fā)者自己去學習到底應該怎樣去選擇算法或者調(diào)優(yōu)模型。
接下來便是算法調(diào)優(yōu)分析,Brain++集成十余大類不同的結果分析和對應的調(diào)優(yōu)策略,比如漏檢/誤檢結果呈現(xiàn)。
當紅旗檢測模型訓練完成后,將其放到實際應用場景中測試,黃色框就是一次訓練后的算法檢測出來紅旗的位置。
說明這一算法存在明顯誤檢問題,特別可能在這樣的一個場景誤檢率比較高,AI生產(chǎn)力平臺便可幫助開發(fā)者自動發(fā)現(xiàn)問題,并給出針對性優(yōu)化建議。
總的來看,當我們分析完想要做一個旗幟的檢測需求之后,首先需要2個小時來做一個圖像的質(zhì)檢和旗幟的標注,之后選擇一個GPU的訓練環(huán)境,模型訓練的時間大概花費一個小時左右的時間。
在上線部署后,根據(jù)剛剛提到的分析和調(diào)優(yōu)策略,研究人員進行了2輪左右的迭代,一個「旗幟檢測」算法就誕生了!
你所感受到的便捷,是曠視通過總結過去10年算法生產(chǎn)落地的海量經(jīng)驗,探索出一套「快速、低成本生產(chǎn)算法」的模式,并將其沉淀在Brain++。
這十年,曠視AI創(chuàng)新走過怎樣一個歷程?
7月16日,由曠視首席科學家、研究院院長孫劍領銜的技術團隊在2021曠視技術開放日(MegTech 2021)上分享了曠視十年來在AI技術上的實踐和思考。
十年實踐,首席科學家孫劍發(fā)AI「靈魂」三問
今年,是曠視成立的第十年。
我們來聊一聊曠視這十年的進階之路。
首席科學家孫劍以曠視為例,總結了過去十年中國AI技術價值的發(fā)展歷程。
2011年前后,AI發(fā)展的重點是基礎科研?;A科研的關鍵點是突破單點算法,讓AI率先在互聯(lián)網(wǎng)等數(shù)字化程度高等領域應用落地,變得真正可用。
2015年起,AI需求越來越多,AI商業(yè)化落地也越來越多。這個過程中,算法在不斷拓展應用的邊界,從算法到軟硬結合,AI創(chuàng)造的價值越來越大。
從2020年開始,AI成為新基建的重要部分,持續(xù)降低算法門檻,讓AI生產(chǎn)變得更加容易,基礎設施需要AI普惠化。
AI有沒有用?AI在哪里用?AI易不易用?
這是AI行業(yè)的「靈魂」三問,是所有AI企業(yè)需要回答的問題。
孫劍認為,AI有沒有用歸根到底是看AI基礎科研有沒有突破。
基礎科研是AI創(chuàng)新突破的基石,需要長期主義的堅持。
對曠視來說,要構建科學價值和產(chǎn)業(yè)價值統(tǒng)一的基礎科研體系。
十年來,曠視不斷突破創(chuàng)新:
在學術上發(fā)表85篇頂級會議論文,在競賽上斬獲40項冠軍,在實用上研發(fā)了包括ShuffleNets系列在內(nèi)的眾多基礎模型,已經(jīng)廣泛應用在手機等智能設備上,推動軟硬協(xié)同發(fā)展。
基礎科研有了,落地才是科研的價值,這就需要解決「AI在哪里用」的問題。
對于曠視,一直瞄準的是消費物聯(lián)網(wǎng)、城市物聯(lián)網(wǎng)和供應鏈物聯(lián)網(wǎng)三大場景。
AI是核心能力,IoT是落地場景,在數(shù)字世界與物理世界融合的智能化時代,AI算法正在為產(chǎn)品帶來更多的價值提升。
曠視認為,「算法不只讓很多產(chǎn)品從好變更好,更能讓產(chǎn)品從不可能變可能?!?/p>
在曠視十年的AI實踐落地中發(fā)現(xiàn),算法已不再僅僅是「軟件物料」,而是成為「核心組件」。
從科研到落地,算法正在創(chuàng)造越來越大的價值,也在開始重新定義軟硬件。
曠視研究員范浩強在MegTech 2021上的分享
AI落地是我們所有人都在講的問題,但是當前,大量算法生產(chǎn)過程還是非標準化。因為非標準化所以算法生產(chǎn)過程充滿不確定性。
曠視認為,落地實用是檢驗算法的最高標準之一,而生產(chǎn)落地實用算法的過程「只有先標準化才能自動化」,才能更進一步實現(xiàn)規(guī)?;钠栈菀子?。
從2014年至今,持續(xù)打磨升級的AI生產(chǎn)力平臺Brain++,就是曠視推動算法生產(chǎn)邁向自動化時代的AI基礎設施。
為什么是曠視?
不是煉丹「上癮」,是AI進化
曠視是一家靠算法起家的公司。
準確來說,可以細分為兩類:
一類是以深度學習(DL)和計算機視覺(CV)為基礎的核心算法。
另一類則是行業(yè)算法 (或者稱AIoT算法)。
曠視的算法之路,經(jīng)歷了從核心算法突破,到行業(yè)算法落地和創(chuàng)新,再到算法生產(chǎn)平臺的拓展過程。
MegTech 2021上,曠視展示了其算法量產(chǎn)星空圖。
算法量產(chǎn)不是一個單一產(chǎn)品,更不是「上癮」,而是一種生產(chǎn)模式的理念革新和生產(chǎn)力進化。
曠視現(xiàn)場通過一系列技術Demo演示,系統(tǒng)展示了其最新的技術成果。
曠視研究院推出了面向服務器和下一代AI芯片的通用模型RepVGG,其在開源后Github star已超過1800。
還推出全景視頻實時拼接算法。
全景視頻拼接的實現(xiàn),需要多個攝像頭在同一場景下采集不同方向視頻,然后逐幀地將各個方向的視頻幀拼接起來,最終得到360度全景視頻,甚至360度*180度的球面全景視頻。
其核心是運用基于光流的多攝AI拼接算法,同時依靠實時動態(tài)無縫拼接網(wǎng)絡模型,解決了多攝拼接計算量大、拼縫明顯,以及拼接無法動態(tài)更新的技術難題。
還有單目3D車路感知:僅用單目可見光相機,就可以實現(xiàn)車路信息的3D感知。
曠視MegTech 2021上還展示了,目前性能最強的端到端實時全卷積全景分割算法,以及挑戰(zhàn)經(jīng)典,目標檢測架構創(chuàng)新的YOLOF。
從基礎科研,到行業(yè)落地,再到基礎設施,這是人工智能技術價值躍遷的三個關鍵。
曠視正是沿著這樣的路線在不斷創(chuàng)新,務實落地。預研一代、孵化一代、交付一代,這是曠視技術創(chuàng)新研發(fā)模式。
在技術開放日現(xiàn)場,曠視將這一套創(chuàng)新研發(fā)模式首次對外完整的呈現(xiàn)出來。
孫劍總結道,「聚焦最優(yōu)秀的人才,一起做最好的科研,通過產(chǎn)品讓科研成果創(chuàng)造價值,不斷探索新領域,這是曠視的秘訣,也是AI技術價值躍遷的秘訣?!?/p>
對了,忘了告訴你,這是一個北京新晉AI網(wǎng)紅打卡圣地。
《新程序員》:云原生和全面數(shù)字化實踐50位技術專家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vue使用query传参页面刷新数据丢失
- 下一篇: 为了让AI不断打怪升级,DeepMind