论坛介绍|COSCon'22 人工智能(A)
COSCon'22
開源社/KAIYUANSHE
業(yè)界最具影響力的開源年度盛會(huì) 2022 第七屆中國(guó)開源年會(huì)?(COSCon'22)?來啦!!!
本次年會(huì)將于 10月29日-30日由開源社舉辦。線上共設(shè)有1個(gè)主論壇和16個(gè)分論壇,線下分會(huì)場(chǎng)遍布成都、深圳、上海、北京等11個(gè)城市。掃描下方二維碼即可報(bào)名,快來參與吧~
01
論壇介紹
人工智能相關(guān)的開源項(xiàng)目介紹,包括工具、模型、算法、數(shù)據(jù)集等。
02
論壇出品人及出品人標(biāo)準(zhǔn)
1.論壇出品人
譚中意
開源專家, LF AI & Data TAC成員
范晶晶
科鯨 CEO,開源組織Datawhale發(fā)起人
李揚(yáng)
Wuhan2020 執(zhí)行長(zhǎng),應(yīng)急救援組件系統(tǒng)發(fā)起人,算法工程師。熱心開源和公益。
2.論壇出品標(biāo)準(zhǔn)
必須是應(yīng)用在人工智能領(lǐng)域內(nèi)的開源項(xiàng)目,有一定的價(jià)值。
03
論壇講師陣容
演講者簡(jiǎn)介
高豐,開放數(shù)據(jù)中國(guó)聯(lián)合創(chuàng)始人及執(zhí)行主任、AI SPACE 合伙人。在高豐的領(lǐng)導(dǎo)下,開放數(shù)據(jù)中國(guó)持續(xù)面向政府及數(shù)據(jù)源提供如何建設(shè)開放透明數(shù)據(jù)項(xiàng)目的指導(dǎo)和咨詢,并建立社群放大數(shù)據(jù)利用者的聲音。
他是 SODA 賽事模式的設(shè)計(jì)者、上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽的聯(lián)合發(fā)起人。他是上海白玉蘭開源開放研究院開放數(shù)據(jù)顧問、復(fù)旦大學(xué)數(shù)字與移動(dòng)治理實(shí)驗(yàn)室研究員、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)青年專家。他在 2019年被選為耶魯大學(xué)世界學(xué)者(World Fellow),并被授予“30位新生代數(shù)字人才”“數(shù)據(jù)科學(xué) 50 人”“英國(guó)杰出學(xué)友職業(yè)成就獎(jiǎng)(中國(guó))”。
演講題目
《中國(guó) AI 數(shù)據(jù)的開放開源與未來》
演講簡(jiǎn)介
數(shù)據(jù)是人工智能的基石,但真正由中國(guó)自行創(chuàng)建并發(fā)布的數(shù)據(jù)集究竟是一個(gè)什么樣的狀況?這當(dāng)中又有多少數(shù)據(jù)集符合開放開源的精神能夠被自由地使用、分享和演繹呢?該演講將基于白玉蘭開源與開放數(shù)據(jù)中國(guó)在今年上半年所開展的一系列調(diào)查問卷、訪談和桌面調(diào)研為你描繪當(dāng)前中國(guó) AI 數(shù)據(jù)的開放開源的現(xiàn)狀、問題和挑戰(zhàn),并基于此討論尋求突破的路徑和愿景。
目標(biāo)聽眾群
關(guān)注 AI 領(lǐng)域數(shù)據(jù)開源開放的開發(fā)者、研究者、數(shù)據(jù)發(fā)布者和數(shù)據(jù)使用者
給開源生態(tài)體系帶來的利益
進(jìn)一步推動(dòng)AI開源社區(qū)對(duì)數(shù)據(jù)開放問題的關(guān)注、參與和投入
演講者簡(jiǎn)介
古思為,軟件工程師、遠(yuǎn)程工作者、開源信徒。NebulaGraph DGL 項(xiàng)目作者。現(xiàn)任 vesoft 開發(fā)者布道師。
古思為(Wey)在白天很享受在公共空間、開源社區(qū)用魔法構(gòu)建東西,并把習(xí)得魔法 scale 給社區(qū)中的更多巫師,在晚上偶爾喜歡唱歌。
你可以在?https://twitter.com/wey_gu,https://siwei.io/about/?看到他,在播客開源面對(duì)面聽到他共同主持的開源閑聊節(jié)目,在?https://siwei.io/talk/看到他的過往演講,包括 CosCON 21' 的關(guān)于他的開源成長(zhǎng)之路。
演講題目
《如何用 GNN + 圖數(shù)據(jù)庫(kù)構(gòu)建實(shí)時(shí)欺詐檢測(cè)系統(tǒng)》
演講簡(jiǎn)介
Fraud Detection 是所有互聯(lián)網(wǎng)業(yè)務(wù)中不可繞過的話題,它在道高一尺魔高一丈的攻防中,維系著每一個(gè)服務(wù)的可用性、提供商的利益和所有用戶的公平環(huán)境。
Fraud Detection 的方法從專家欺詐模式匹配、查詢,傳統(tǒng)機(jī)器學(xué)習(xí)到深度學(xué)習(xí)層出不窮,在不同的場(chǎng)景和需求模式下各有優(yōu)勢(shì),在圖數(shù)據(jù)庫(kù)、圖計(jì)算的基礎(chǔ)軟件、平臺(tái)逐漸成熟的現(xiàn)在,基于圖數(shù)據(jù)庫(kù)的圖查詢方法、面向標(biāo)注擴(kuò)充的圖算法、基于圖特征的機(jī)器學(xué)習(xí)等方法因?yàn)殚_始利用數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,也可以獲得更好的效果。在此之上,基于 GNN (圖神經(jīng)網(wǎng)絡(luò))的方法因?yàn)閷⒕唧w的關(guān)聯(lián)關(guān)系在模型訓(xùn)練中嵌入表示,在理論和實(shí)踐上都有了很多新的突破。
本次演講中,古思為會(huì)為大家解謎基于圖技術(shù)的欺詐檢測(cè)方法,并給出他基于創(chuàng)建維護(hù)的 NebulaGraph DGL(Deep Graph Library) 開源項(xiàng)目的端到端示例開源項(xiàng)目的設(shè)計(jì)代碼實(shí)現(xiàn):一個(gè)實(shí)時(shí)欺詐檢測(cè)系統(tǒng),幫助大家快速了解整套方法的設(shè)計(jì)與落地的實(shí)操。
目標(biāo)聽眾群
對(duì)圖技術(shù)感興趣的數(shù)據(jù)科學(xué)家、應(yīng)用開發(fā)者
給開源生態(tài)體系帶來的利益
圖技術(shù)領(lǐng)域分為不同的方向:圖數(shù)據(jù)庫(kù)、圖計(jì)算平臺(tái)、圖深度學(xué)習(xí)、圖可視化。圖數(shù)據(jù)庫(kù)和圖深度學(xué)習(xí)在開源社區(qū)中的聯(lián)動(dòng)是非常缺少的,NebulaGraph-DGL 這個(gè)項(xiàng)目將開源的圖數(shù)據(jù)庫(kù)和開源的圖深度學(xué)習(xí)項(xiàng)目聯(lián)系起來,讓兩個(gè)社區(qū)的貢獻(xiàn)者可以建立更好的聯(lián)結(jié),享受到 1+1 > 2 的開源魔法。
演講者簡(jiǎn)介
蔡恒興,現(xiàn)任第四范式高級(jí)科學(xué)家。
中山大學(xué)碩士
全球頂級(jí)機(jī)器學(xué)習(xí)競(jìng)賽平臺(tái)Kaggle?Grandmaster(全球最高排名第11)
阿里天池?cái)?shù)據(jù)科學(xué)家
國(guó)際頂級(jí)數(shù)據(jù)挖掘競(jìng)賽KDD?CUP(2017季軍、2018亞軍、2020季軍)
多媒體領(lǐng)域頂會(huì)ACM?MM?2022挑戰(zhàn)賽冠軍
自然語言處理頂會(huì)EMNLP?2022挑戰(zhàn)賽冠軍
國(guó)內(nèi)外數(shù)據(jù)挖掘競(jìng)賽共10個(gè)冠軍、3個(gè)亞軍
發(fā)表多篇英文期刊和會(huì)議論文,獲得授權(quán)或受理專利十余項(xiàng)
曾任香港理工大學(xué)助理研究員、滴滴出行算法工程師
演講題目
《AutoX開源自動(dòng)機(jī)器學(xué)習(xí)解決方案》
演講簡(jiǎn)介
機(jī)器學(xué)習(xí)算法應(yīng)用中包含大量的表數(shù)據(jù)場(chǎng)景,利用自動(dòng)機(jī)器學(xué)習(xí)技術(shù)能降低機(jī)器學(xué)習(xí)的門檻,使AI平民化。
本次報(bào)告介紹表數(shù)據(jù)場(chǎng)景下自動(dòng)機(jī)器學(xué)習(xí)的相關(guān)核心技術(shù),以及相應(yīng)的開源產(chǎn)品AutoX。
目標(biāo)聽眾群
希望以低門檻使用人工智能技術(shù)的人
給開源生態(tài)體系帶來的利益
降低機(jī)器學(xué)習(xí)的使用門檻
演講者簡(jiǎn)介
吳京京,自然語言處理算法工程師,python-wechaty作者,聊天機(jī)器人技術(shù)愛好者。
演講題目
《基于python-wechaty和paddlenlp構(gòu)建智能對(duì)話機(jī)器人》
演講簡(jiǎn)介
python-wechaty是一個(gè)讓開發(fā)者快速開發(fā)出智能聊天機(jī)器人的框架,使用一套代碼即可運(yùn)行在多種不同IM平臺(tái),例如微信、企業(yè)微信、微信公眾號(hào)、釘釘、飛書以及WhatsApp等。PaddleNLP是一款簡(jiǎn)單易用且功能強(qiáng)大的自然語言處理開發(fā)庫(kù)。聚合業(yè)界優(yōu)質(zhì)預(yù)訓(xùn)練模型并提供開箱即用的開發(fā)體驗(yàn),覆蓋NLP多場(chǎng)景的模型庫(kù)搭配產(chǎn)業(yè)實(shí)踐范例可滿足開發(fā)者靈活定制的需求。
在此演講中,將介紹基于python-wechaty對(duì)接IM平臺(tái),使用PaddleNLP開發(fā)更適合中文場(chǎng)景下的自然語言理解模型,然后基于BotMaker,實(shí)現(xiàn)模型服務(wù)的部署,和對(duì)話狀態(tài)管理,最終實(shí)現(xiàn)對(duì)話機(jī)器人的整個(gè)開發(fā)閉環(huán),更符合企業(yè)落地。
目標(biāo)聽眾群
自然語言處理算法工程師,對(duì)話機(jī)器人愛好者
給開源生態(tài)體系帶來的利益
讓更多的人了解到wechaty;讓更多的人了解任務(wù)型對(duì)話機(jī)器人的開發(fā)流程。
演講者簡(jiǎn)介
公司介紹:Zilliz 是向量數(shù)據(jù)庫(kù)系統(tǒng)領(lǐng)域的開拓者和全球領(lǐng)先者,研發(fā)面向 AI 生產(chǎn)系統(tǒng)的向量數(shù)據(jù)庫(kù)系統(tǒng)。Zilliz以發(fā)掘非結(jié)構(gòu)化數(shù)據(jù)價(jià)值為使命,致力于打造面向 AI 應(yīng)用的新一代數(shù)據(jù)庫(kù)技術(shù),幫助企業(yè)便捷的開發(fā) AI 應(yīng)用。Zilliz 的產(chǎn)品能顯著降低管理 AI 數(shù)據(jù)基礎(chǔ)設(shè)施的成本,幫助 AI 技術(shù)賦能更多的企業(yè)、組織和個(gè)人。
Zilliz 由前甲骨文工程師星爵于 2017 年創(chuàng)立,得到了高瓴資本、五源資本、沙特阿美旗下 Prosperity 7資本、淡馬錫旗下蘭亭投資、云啟資本和摯信資本等一線投資人的支持。Zilliz的技術(shù)和產(chǎn)品在全球范圍內(nèi)被超過 1000 家企業(yè)所采用,廣泛應(yīng)用于計(jì)算機(jī)視覺、圖片檢索、視頻分析、自然語言處理、推薦系統(tǒng)、定向廣告、個(gè)性化搜索、智能客服、欺詐檢測(cè)、網(wǎng)絡(luò)安全和新藥發(fā)現(xiàn)等領(lǐng)域。
進(jìn)行中的開源項(xiàng)目:Milvus
高雨辰是 Zilliz 首席工程師,目前在 Zilliz 負(fù)責(zé) Milvus 開源產(chǎn)品的技術(shù)管理和社區(qū)維護(hù)。他曾在 RSVP.ai 擔(dān)任技術(shù) VP,負(fù)責(zé)打造多款在全球百?gòu)?qiáng)企業(yè)落地的 AI SaaS 產(chǎn)品。此前他先后在微軟中國(guó)、谷歌美國(guó)和谷歌加拿大就職。高雨辰擁有滑鐵盧大學(xué)計(jì)算機(jī)系碩士學(xué)位。
過去演講經(jīng)歷:
華為云 AI 《DevRun 開發(fā)者沙龍》 主講嘉賓
中國(guó)電信《5G引領(lǐng),工業(yè)知識(shí)圖譜及工業(yè)網(wǎng)絡(luò)》高峰論壇 主講嘉賓
《AWS User Group Data Everywhere》上海站 演講嘉賓
演講題目
《數(shù)據(jù)增長(zhǎng)對(duì)于深度學(xué)習(xí)基礎(chǔ)設(shè)施的新挑戰(zhàn)》
演講簡(jiǎn)介
隨著5G、大數(shù)據(jù)、人工智能等技術(shù)的大力發(fā)展,人類社會(huì)所產(chǎn)生的數(shù)據(jù)從現(xiàn)實(shí)意義上達(dá)到了天文數(shù)字的級(jí)別。有機(jī)構(gòu)預(yù)測(cè)到2025年的時(shí)候,人類產(chǎn)生的數(shù)據(jù)量將達(dá)到180ZB,而其中80%以上的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)的處理無疑給深度學(xué)習(xí)算法的大規(guī)模應(yīng)用產(chǎn)生的巨大的壓力,而深度學(xué)習(xí)中對(duì)于Embedding的處理是整個(gè)深度學(xué)習(xí)的核心點(diǎn)所在。向量檢索引擎和向量數(shù)據(jù)庫(kù)則在這個(gè)大背景下孕育而生,結(jié)合了數(shù)據(jù)庫(kù)最核心的技術(shù)和學(xué)術(shù)界最先進(jìn)的算法,打造一款真正的Database for AI,助力深度學(xué)習(xí)算法和模型在工業(yè)界諸多場(chǎng)景下大規(guī)模落地。Milvus是目前全球開源界最火的一款向量數(shù)據(jù)庫(kù)產(chǎn)品,采用了完全分布式、微服務(wù)、云原生的架構(gòu),目前在3000多家用戶的眾多場(chǎng)景中成功落地。
目標(biāo)聽眾群
具有基本人工智能和深度學(xué)習(xí)知識(shí),并且希望將算法和模型大規(guī)模落地的算法工程師和系統(tǒng)工程師
給開源生態(tài)體系帶來的利益
聽眾可以了解到向量數(shù)據(jù)庫(kù)是人工智能和大數(shù)據(jù)時(shí)代的產(chǎn)物,并且了解到向量數(shù)據(jù)庫(kù)在工業(yè)界的落地案例
演講者簡(jiǎn)介
李延凱,國(guó)內(nèi)的最大隱私計(jì)算社區(qū)OpenMPC發(fā)起人、原語科技CEO兼CTO
北航計(jì)算機(jī)碩士
華控清交早期成員,核心架構(gòu)師,參與實(shí)施了多個(gè)隱私計(jì)算項(xiàng)目實(shí)施
十余年技術(shù)管理經(jīng)驗(yàn),曾就職于字節(jié)跳動(dòng)、百度金融、農(nóng)總行軟開等
8月份在OpenMPC與CSDN的Meetup活動(dòng)上做了《開源隱私計(jì)算賦能數(shù)據(jù)合規(guī)流通》主題分享,線上流量達(dá)到近3萬;
原語科技通過開源企業(yè)級(jí)隱私計(jì)算平臺(tái) Primihub以降低隱私計(jì)算技術(shù)應(yīng)用門檻,促進(jìn)更多數(shù)字化方案中嵌入隱私計(jì)算加速數(shù)據(jù)價(jià)值釋放。
原語科技致力于以安全多方計(jì)算、聯(lián)邦學(xué)習(xí)、同態(tài)加密、可信計(jì)算等為基礎(chǔ)的隱私計(jì)算技術(shù)構(gòu)建數(shù)據(jù)信任與安全,秉承技術(shù)開源、開放、透明即是安全,賦能數(shù)據(jù)價(jià)值的安全融合及釋放,提升數(shù)據(jù)應(yīng)用的深度、廣度、精度,為全面構(gòu)建未來數(shù)字型社會(huì)提供支撐。
原語科技致力于攜手開源社區(qū)伙伴打造國(guó)際化的隱私計(jì)算技術(shù)平臺(tái)。
演講題目
《隱私計(jì)算構(gòu)建新型數(shù)據(jù)要素流通基礎(chǔ)設(shè)施》
演講簡(jiǎn)介
? 當(dāng)今社會(huì),無論是簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì)分析,或者是AI模型開發(fā),都需要用到數(shù)據(jù)作為原始材料,數(shù)據(jù)在推動(dòng)經(jīng)濟(jì)發(fā)展,促進(jìn)社會(huì)治理和公共管理方面,起著重要作用。“新基建”、“數(shù)據(jù)要素”等有關(guān)政策相繼發(fā)布,進(jìn)一步明確了數(shù)據(jù)在國(guó)家戰(zhàn)略層面的重要意義。隨著數(shù)字化轉(zhuǎn)型的推進(jìn),越來越多的企業(yè)和組織需要通過多方數(shù)據(jù)協(xié)同來釋放數(shù)據(jù)更大的價(jià)值,提升生產(chǎn)效率,推進(jìn)產(chǎn)業(yè)創(chuàng)新。同時(shí),我國(guó)的數(shù)據(jù)經(jīng)濟(jì)產(chǎn)業(yè)正處于起步階段,數(shù)據(jù)孤島、技術(shù)沉淀不足、數(shù)據(jù)安全隱患等都成為了產(chǎn)業(yè)發(fā)展中亟待解決的問題。
? 在此背景下原語科技開發(fā)的企業(yè)級(jí)綜合性隱私計(jì)算平臺(tái)Primihub:通過應(yīng)用安全多方計(jì)算、聯(lián)邦學(xué)習(xí)、TEE、同態(tài)等隱私計(jì)算技術(shù),在保護(hù)數(shù)據(jù)安全和用戶隱私的前提下,促進(jìn)數(shù)據(jù)高效流通。
生態(tài)影響力:
? 隱私計(jì)算技術(shù)在服務(wù)國(guó)家戰(zhàn)略、服務(wù)改革、服務(wù)實(shí)體經(jīng)濟(jì)、服務(wù)民生、服務(wù)社會(huì)治理等領(lǐng)域的創(chuàng)新應(yīng)用,可以助力數(shù)據(jù)的安全開放和應(yīng)用,更好地開展數(shù)字化和智能化的數(shù)據(jù)新基建,同時(shí)刺激數(shù)據(jù)驅(qū)動(dòng)的經(jīng)濟(jì)和商業(yè)模式不斷創(chuàng)新,反向刺激數(shù)據(jù)要素的生產(chǎn)。
? 作為數(shù)據(jù)流通的底層基礎(chǔ)設(shè)施技術(shù)體系,支持國(guó)家數(shù)字經(jīng)濟(jì)、人工智能、大數(shù)據(jù)產(chǎn)業(yè)、國(guó)有企業(yè)數(shù)字化轉(zhuǎn)型等發(fā)展戰(zhàn)略,打擊黑產(chǎn)數(shù)據(jù)及通過爬蟲等非合規(guī)形式的大數(shù)據(jù)渠道,通過數(shù)據(jù)生產(chǎn)要素的激活和交易幫助企業(yè)實(shí)現(xiàn)業(yè)務(wù)和收入增長(zhǎng),提升社會(huì)數(shù)據(jù)資源價(jià)值,并為新基建形成了一個(gè)完整的“數(shù)據(jù)生態(tài)”。基于各個(gè)物聯(lián)網(wǎng)設(shè)備、大數(shù)據(jù)中心采集的海量數(shù)據(jù)基礎(chǔ)上實(shí)現(xiàn)智能安防、智能制造、智慧城市等領(lǐng)域的場(chǎng)景。
目標(biāo)聽眾群
開發(fā)者、數(shù)據(jù)擁有方、數(shù)據(jù)需求方、數(shù)據(jù)從業(yè)者、數(shù)據(jù)安全需求方、互聯(lián)網(wǎng)從業(yè)者
給開源生態(tài)體系帶來的利益
原語科技隱私計(jì)算平臺(tái)Primihub,集成密碼學(xué)、機(jī)器學(xué)習(xí)技術(shù)和硬件等多種安全方案,打破數(shù)據(jù)孤島,不暴露各參與方敏感數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)可用不可見,滿足安全、合規(guī)的需求。
演講者簡(jiǎn)介
王楠,Jina AI 聯(lián)合創(chuàng)始人兼 CTO,博士畢業(yè)于德國(guó)波鴻魯爾大學(xué)。
自 2009 年開始從事深度學(xué)習(xí)相關(guān)研究,之后先后擔(dān)任德國(guó)知名電商 Zalando 高級(jí)數(shù)據(jù)科學(xué)家,騰訊高級(jí)研究員,在搜索和推薦領(lǐng)域的具有豐富的模型設(shè)計(jì)、實(shí)現(xiàn)和部署經(jīng)驗(yàn)。
專注于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法在 NLP 和搜索領(lǐng)域的實(shí)際應(yīng)用。作為開源神經(jīng)搜索框架 Jina 的核心貢獻(xiàn)者,熱衷于開源軟件和云原生技術(shù)。
演講題目
《DocsQA:智能文檔問答系統(tǒng)》
演講簡(jiǎn)介
對(duì)于很多開源社區(qū)的維護(hù)者來說,都有這樣的一個(gè)困擾。維護(hù)者往往要花大量時(shí)間回答社區(qū)提問,而這些問題其實(shí)在文檔中都可以找到答案。DocsQA是面向開源軟件提供的免費(fèi)智能文檔問答SaaS服務(wù),目前為fastapi、kornia、jina等在內(nèi)的十幾款開源軟件提供文檔智能問答服務(wù)。本次演講我們會(huì)針對(duì)其中的技術(shù)實(shí)現(xiàn)進(jìn)行講解,并分享我們?cè)诖罱ㄟ^程中遇到的問題和解決方案。
目標(biāo)聽眾群
對(duì)智能文檔問答系統(tǒng)搭建感興趣的開源開發(fā)者 以及社區(qū)文檔維護(hù)者
給開源生態(tài)體系帶來的利益
為開源社區(qū)提供一套文檔問答的解決方案
演講者簡(jiǎn)介
許志耿,商湯科技高級(jí)系統(tǒng)研究員,開源推理引擎「OpenPPL」CPU 與加速器方向負(fù)責(zé)人。
本碩畢業(yè)于上海交通大學(xué)計(jì)算機(jī)系,研究方向?yàn)楦咝阅苡?jì)算。曾參與神威·太湖之光超級(jí)計(jì)算機(jī)上的科學(xué)計(jì)算核心深度優(yōu)化;建立了 AI 加速器上的商湯自研推理引擎。在 PARCO、IPDPS、ICPP 等國(guó)際會(huì)議和期刊上發(fā)表過多篇論文。
目前在商湯科技高性能計(jì)算與推理部門負(fù)責(zé) CPU、DSP 和 NPU 等架構(gòu)方向的推理引擎研發(fā)與業(yè)務(wù)落地。
演講題目
《OpenPPL | AI 推理加速在國(guó)產(chǎn) CPU 平臺(tái)上的實(shí)踐與挑戰(zhàn)》
演講簡(jiǎn)介
隨著 AI 應(yīng)用落地日趨成熟,AI 加速硬件逐漸從「單一專用」向「通用高性能」轉(zhuǎn)變。而作為處理器技術(shù)「皇冠上的明珠」,CPU 仍然是未來 AI 高性能計(jì)算平臺(tái)的重要支撐。
在如今國(guó)產(chǎn) CPU 蓬勃發(fā)展的背景下,OpenPPL 基于在通用架構(gòu)上積累的高性能推理技術(shù),對(duì)主流國(guó)產(chǎn) CPU 平臺(tái)進(jìn)行了適配與深入調(diào)優(yōu)。
目標(biāo)聽眾群
本演講主要面向 AI 行業(yè)的開發(fā)者,聽眾將能從演講中收獲關(guān)于 AI 推理引擎的基礎(chǔ)知識(shí)、典型的優(yōu)化方法和最佳實(shí)踐。同時(shí),通過介紹 OpenPPL 在國(guó)產(chǎn) CPU 平臺(tái)的技術(shù)實(shí)踐與業(yè)務(wù)落地案例,期望能給聽眾帶來「學(xué)以致用」的收獲和國(guó)產(chǎn)自研之路的啟發(fā)。
給開源生態(tài)體系帶來的利益
OpenPPL 是國(guó)內(nèi)少數(shù)的開源高性能推理框架,并且積極對(duì)各類開源架構(gòu)進(jìn)行支持。而在性能上,商湯比肩的是 Intel 和 NVIDIA。
我們認(rèn)為,國(guó)產(chǎn)性能框架只有真正開源后,才能為更多開發(fā)者所使用,使框架從數(shù)據(jù)和業(yè)務(wù)中來、再回到中去,形成完整閉環(huán)。
當(dāng)前 AI 的應(yīng)用,早已從消費(fèi)場(chǎng)景走向自動(dòng)駕駛、智慧醫(yī)療等工業(yè)級(jí)應(yīng)用。AI 的技術(shù)離不開深度學(xué)習(xí)。訓(xùn)練和推理,是深度學(xué)習(xí)的一體兩面,有了「訓(xùn)練」對(duì)大量數(shù)據(jù)進(jìn)行碰撞、挖掘,再利用「推理」框架得到想要的結(jié)果,就能實(shí)現(xiàn)智能的精準(zhǔn)達(dá)成。
本次演講,也是希望能有更多 AI 從業(yè)者乃至更廣泛的開發(fā)者能夠了解并認(rèn)識(shí)到國(guó)產(chǎn) AI 框架的能力,并一同利用開源的 AI 能力做出更多有價(jià)值的應(yīng)用。
演講者簡(jiǎn)介
蘭青,亞馬遜云科技算法工程師,碩士畢業(yè)于美國(guó)哥倫比亞大學(xué), 本科畢業(yè)于英國(guó)利物浦大學(xué)。蘭青是DJL 深度學(xué)習(xí)框架的作者之一,也是 Apache MXNet PPMC成員之一,精通深度學(xué)習(xí)框架架構(gòu)以及 Java 開發(fā), 致力于研究并解決用戶在機(jī)器學(xué)習(xí)推理和訓(xùn)練中遇到的難題。?
曾寫過多篇博文和多次演講講解開源技術(shù),推行開源文化,鼓勵(lì)新一代開發(fā)者擁抱開源
演講題目
《使用開源DJLServing單機(jī)部署百億參數(shù)機(jī)器學(xué)習(xí)模型》
演講簡(jiǎn)介
隨著機(jī)器學(xué)習(xí)領(lǐng)域不斷演進(jìn),性能更強(qiáng),體量更大的語言模型如GPT2, OPT, GPT3等模型提供了更好更優(yōu)的推理表現(xiàn)。因?yàn)樗懔Φ囊?#xff0c;這些模型往往需要GPU加速才可以完成延遲率和吞吐量的要求。但是,由于GPU顯存大小的限制,一個(gè)gpu無法放進(jìn)一整個(gè)模型。這個(gè)時(shí)候,我們需要更優(yōu)更快的多模型分割技術(shù)以及多gpu協(xié)同計(jì)算的能力。在這個(gè)背景下,亞馬遜云科技推出了一系列使用DJLServing,一個(gè)開源的機(jī)器學(xué)習(xí)模型服務(wù)器的解決方案。這套解決方案同時(shí)也適用于Amazon SageMaker推理平臺(tái)。在這個(gè)分享會(huì)中,您將獲得從模型分割,壓縮,蒸餾,及性能優(yōu)化等技術(shù)分享,同時(shí)也可以掌握基于開源DJLServing的大模型推理調(diào)優(yōu)等技術(shù)。
目標(biāo)聽眾群
機(jī)器學(xué)習(xí)領(lǐng)域開發(fā)者、開源愛好者,聽眾了解通過開源的更優(yōu)更快的多模型分割技術(shù)以及多gpu協(xié)同計(jì)算的能力,解決大力量與演模型的延遲率和吞吐量問題。
給開源生態(tài)體系帶來的利益
激發(fā)更多中國(guó)大陸的程序員用開源的方式參與公益性應(yīng)用軟件開發(fā)的興趣。
演講者簡(jiǎn)介
黃風(fēng),華為MindSpore框架研發(fā)工程師;碩士畢業(yè)于浙江大學(xué)計(jì)算機(jī)學(xué)院;核心工作為參加自動(dòng)并行代碼相關(guān)開發(fā);曾參加過多個(gè)大模型訓(xùn)練包括鵬城盤古模型千億模型等
演講題目
《MindSpore Transformer大模型和推薦大模型關(guān)鍵技術(shù)》
演講簡(jiǎn)介
Transformer大模型成為當(dāng)前人工智能技術(shù)發(fā)展的重要方向,其在多個(gè)領(lǐng)域的實(shí)際任務(wù)中都有大幅度超越傳統(tǒng)模型的表現(xiàn)。無監(jiān)督預(yù)訓(xùn)練配合下游快速微調(diào)的模型成為了人工智能新的范式。另一方面,相較于傳統(tǒng)的模型,大規(guī)模的參數(shù)使得Transformer大模型的訓(xùn)練、微調(diào)、以及推理都面臨著諸多挑戰(zhàn)。本次議題主要和大家分享MindSpore Transformer大模型和推薦大模型中的關(guān)鍵技術(shù)
目標(biāo)聽眾群
深度學(xué)習(xí)開發(fā)者以及大模型應(yīng)用相關(guān)從業(yè)人員,增強(qiáng)大模型技術(shù)了解和MindSpore解決方案
給開源生態(tài)體系帶來的利益
幫助大模型相關(guān)從業(yè)人員更好的進(jìn)行大模型技術(shù)開發(fā)
演講者簡(jiǎn)介
李薇,“OpenXLab浦源”人工智能開源開放體系,包含了“OpenDataLab浦?jǐn)?shù)”等九大開源項(xiàng)目,覆蓋從感知到?jīng)Q策、從平面到立體、從數(shù)據(jù)到計(jì)算、從技術(shù)到人文教育等方面,將推動(dòng)人工智能對(duì)產(chǎn)學(xué)研各領(lǐng)域全面賦能,為推動(dòng)人工智能科研與技術(shù)突破、交叉創(chuàng)新、產(chǎn)業(yè)落地提供全方位平臺(tái)支撐。
目前OpenDataLab 平臺(tái)已擁有 3500+ 數(shù)據(jù)集、1300+ 任務(wù)類型、40TB 數(shù)據(jù)集規(guī)模,涵蓋 30+的應(yīng)用場(chǎng)景、20+ 標(biāo)注類型、多種數(shù)據(jù)類型,數(shù)據(jù)集具備統(tǒng)一的數(shù)據(jù)集組織結(jié)構(gòu)標(biāo)準(zhǔn)與標(biāo)注格式標(biāo)準(zhǔn),能夠通過多種維度在平臺(tái)上進(jìn)行檢索。所有數(shù)據(jù)集均提供國(guó)內(nèi)開發(fā)者進(jìn)行免費(fèi)、高速、便捷的數(shù)據(jù)下載。OpenDataLab秉承“智慧共享、開源高效”的核心理念,致力于打造具有國(guó)際影響力的數(shù)據(jù)開源平臺(tái)。
演講題目
《建設(shè)開源數(shù)據(jù)生態(tài)體系 ?助力高水平科技創(chuàng)新》
演講簡(jiǎn)介
數(shù)據(jù)是人工智能行業(yè)必不可少的生產(chǎn)要素,而獲取數(shù)據(jù)難,數(shù)據(jù)加工難,數(shù)據(jù)分享難等問題對(duì)人工智能算法研究產(chǎn)生了較大的制約,因此OpenDataLab致力于建設(shè)開源數(shù)據(jù)生態(tài)體系,通過建立數(shù)據(jù)資源共享,數(shù)據(jù)處理工具箱,數(shù)據(jù)標(biāo)準(zhǔn)語言,助力人工智能的研發(fā)和創(chuàng)新。
目標(biāo)聽眾群
人工智能行業(yè)人群
給開源生態(tài)體系帶來的利益
推動(dòng)人工智能數(shù)據(jù)開源開放
演講者簡(jiǎn)介
張海寧,現(xiàn)任VMware中國(guó)研發(fā)先進(jìn)技術(shù)中心技術(shù)總監(jiān), 云原生實(shí)驗(yàn)室主任,聯(lián)邦學(xué)習(xí)開源項(xiàng)目 FATE 開發(fā)專委會(huì)主席,Harbor企業(yè)級(jí)容器鏡像倉(cāng)庫(kù)開源項(xiàng)目創(chuàng)始人,《Harbor權(quán)威指南》《區(qū)塊鏈技術(shù)指南》作者之一。目前著重關(guān)注容器、區(qū)塊鏈和云計(jì)算等領(lǐng)域的研究和開發(fā)工作。
演講題目
《VMware AI新進(jìn)展》
演講簡(jiǎn)介
人工智能時(shí)代中通常有三大要素,分別是算法、算力和數(shù)據(jù)。其中數(shù)據(jù)被認(rèn)為是AI發(fā)展的動(dòng)力的源泉,是新時(shí)代的石油,國(guó)務(wù)院在2020年指出數(shù)據(jù)是生產(chǎn)要素之一。數(shù)據(jù)使用如何保護(hù)隱私,避免數(shù)據(jù)泄露,符合相關(guān)監(jiān)管法規(guī)是重要的技術(shù)挑戰(zhàn)。聯(lián)邦學(xué)習(xí)是解決數(shù)據(jù)隱私問題,合規(guī)使用數(shù)據(jù)的有效方案。VMware深度參與業(yè)內(nèi)首個(gè)工業(yè)級(jí)別的聯(lián)邦學(xué)習(xí)項(xiàng)目FATE的開發(fā)以及運(yùn)營(yíng),并即將開源一個(gè)生命周期管理工具FedLCM,用于管理多云環(huán)境下的聯(lián)邦學(xué)習(xí)平臺(tái),同時(shí)還支持多種聯(lián)邦學(xué)習(xí)的框架。
隨著云計(jì)算和移動(dòng)計(jì)算的發(fā)展和成熟,邊緣計(jì)算模式也迅速興起。如何在異構(gòu)邊緣平臺(tái)上方便、靈活、高效地執(zhí)行、并從云側(cè)運(yùn)維AI任務(wù),是我們關(guān)注并正在解決的挑戰(zhàn)。另一方面,數(shù)據(jù)中心是承載云計(jì)算任務(wù)的基礎(chǔ)設(shè)施,也是IT領(lǐng)域中能源消耗巨大的主要原因。在通過AI技術(shù)在數(shù)據(jù)中心整體運(yùn)維上降低能耗、減少排放、控制成本、提高效率方面,我們最近也取得了一些驗(yàn)證的成果。
目標(biāo)聽眾群
關(guān)注人工智能技術(shù)的開發(fā)者
演講者簡(jiǎn)介
路廣,現(xiàn)任職于VMware首席技術(shù)官辦公室,專注邊緣計(jì)算和可持續(xù)性領(lǐng)域的創(chuàng)新技術(shù)和產(chǎn)品方案。他具有20年跨國(guó)商業(yè)軟件產(chǎn)品和互聯(lián)網(wǎng)/云服務(wù)開發(fā)和管理經(jīng)驗(yàn)。他于2009年加入VMware,曾在云基礎(chǔ)設(shè)施、網(wǎng)絡(luò)和高級(jí)安全、現(xiàn)代應(yīng)用管理、電信等事業(yè)群/部門管理產(chǎn)品研發(fā)團(tuán)隊(duì)。之前他曾供職于Sun、微軟和Aol的研發(fā)部門。他是EdgeX Foundry中國(guó)項(xiàng)目和社區(qū)共同維護(hù)者,曾是OpenOffice.org的早期工程師和布道者。他擁有清華大學(xué)電氣工程學(xué)士和碩士學(xué)位。
演講題目
《VMware AI新進(jìn)展》
演講簡(jiǎn)介
人工智能時(shí)代中通常有三大要素,分別是算法、算力和數(shù)據(jù)。其中數(shù)據(jù)被認(rèn)為是AI發(fā)展的動(dòng)力的源泉,是新時(shí)代的石油,國(guó)務(wù)院在2020年指出數(shù)據(jù)是生產(chǎn)要素之一。數(shù)據(jù)使用如何保護(hù)隱私,避免數(shù)據(jù)泄露,符合相關(guān)監(jiān)管法規(guī)是重要的技術(shù)挑戰(zhàn)。聯(lián)邦學(xué)習(xí)是解決數(shù)據(jù)隱私問題,合規(guī)使用數(shù)據(jù)的有效方案。VMware深度參與業(yè)內(nèi)首個(gè)工業(yè)級(jí)別的聯(lián)邦學(xué)習(xí)項(xiàng)目FATE的開發(fā)以及運(yùn)營(yíng),并即將開源一個(gè)生命周期管理工具FedLCM,用于管理多云環(huán)境下的聯(lián)邦學(xué)習(xí)平臺(tái),同時(shí)還支持多種聯(lián)邦學(xué)習(xí)的框架。
隨著云計(jì)算和移動(dòng)計(jì)算的發(fā)展和成熟,邊緣計(jì)算模式也迅速興起。如何在異構(gòu)邊緣平臺(tái)上方便、靈活、高效地執(zhí)行、并從云側(cè)運(yùn)維AI任務(wù),是我們關(guān)注并正在解決的挑戰(zhàn)。另一方面,數(shù)據(jù)中心是承載云計(jì)算任務(wù)的基礎(chǔ)設(shè)施,也是IT領(lǐng)域中能源消耗巨大的主要原因。在通過AI技術(shù)在數(shù)據(jù)中心整體運(yùn)維上降低能耗、減少排放、控制成本、提高效率方面,我們最近也取得了一些驗(yàn)證的成果。
目標(biāo)聽眾群
關(guān)注人工智能技術(shù)的開發(fā)者
演講者簡(jiǎn)介
李楓,先后就職于摩托羅拉, 三星等IT公司, 現(xiàn)為獨(dú)立開發(fā)者。在移動(dòng)平臺(tái)上積累了十年以上的研發(fā)經(jīng)驗(yàn), 近幾年主要專注于云計(jì)算/邊緣計(jì)算基礎(chǔ)設(shè)施(包括AI, ?Virtualization, Program Runtime, Network, 5G, RISC-V, EDA等軟硬件領(lǐng)域)。
是《灰帽黑客 第4版:正義黑客的道德規(guī)范、滲透測(cè)試、攻擊方法和漏洞分析技術(shù)(ISBN:9787302428671)和《惡意網(wǎng)絡(luò)環(huán)境下的Linux防御之道 》(ISBN: 9787115544384)中文版的主要譯者。
對(duì)技術(shù)創(chuàng)新具有濃厚的興趣和實(shí)踐能力,熱心參與開源社區(qū)的各種活動(dòng),多次參加各類IT會(huì)議并作技術(shù)分享。
之前做過的各種技術(shù)演講(皆為第一作者)可見于下面的鏈接:
?https://github.com/XianBeiTuoBaFeng2015/MySlides
演講題目
《Ray--分布式計(jì)算和人工智能中的瑞士軍刀》
演講簡(jiǎn)介
源自伯克利Riselab的知名開源軟件項(xiàng)目目前已進(jìn)入2.x發(fā)展階段,Ray是用于擴(kuò)展AI和Python應(yīng)用程序的統(tǒng)一框架。它主要由一個(gè)核心分布式運(yùn)行時(shí)和一個(gè)用于加速各種ML工作負(fù)載的庫(kù)工具包(Ray AIR)構(gòu)成。由于設(shè)計(jì)和實(shí)現(xiàn)的先進(jìn)性,Ray已獲得業(yè)界高度關(guān)注與認(rèn)可,并且在生產(chǎn)環(huán)境下Ray及其衍生產(chǎn)品也得到了越來越廣泛的真實(shí)應(yīng)用,Ray的出現(xiàn)與演進(jìn)也極大推動(dòng)了分布式人工智能的發(fā)展。本議題以Ray為中心,將包含下列內(nèi)容;
?1)最新Ray 2.0的趨向和架構(gòu)設(shè)計(jì);
?2)基于ARM平臺(tái)的Ray項(xiàng)目實(shí)踐--使用開源硬件平臺(tái)如樹莓派和基于瑞芯微RK系列處理器的開發(fā)板來嘗試
?搭建Ray集群;
?3)嘗試使用官方CPython之外的Python運(yùn)行時(shí)來加速Ray;
?4) ?Ray項(xiàng)目的重構(gòu)--Ray項(xiàng)目軟件層解析和探討使用Python+Rust來代替目前Python+C++的軟件層。
另附主要技術(shù)棧的相關(guān)鏈接如下:
https://ray.io/
https://github.com/ray-project
https://en.wikipedia.org/wiki/ARM_architecture
https://en.wikipedia.org/wiki/Raspberry_Pi
https://www.rock-chips.com/
https://en.wikipedia.org/wiki/Python_(programming_language)
https://en.wikipedia.org/wiki/C%2B%2B
https://en.wikipedia.org/wiki/Rust_(programming_language)
目標(biāo)聽眾群
對(duì)分布式計(jì)算(主要目標(biāo)是人工智能及大數(shù)據(jù)處理)感興趣的同學(xué),可以從本話題中更深入地了解源自UC Berkeley RISELab的Ray分布式計(jì)算框架, 更好地理解其背后的設(shè)計(jì)思想和動(dòng)機(jī),以及潛在的改進(jìn)和派生。RISELab是在分布式計(jì)算、大數(shù)據(jù)處理、人工智能等領(lǐng)域世界知名的實(shí)驗(yàn)室,其前身AMPLab推出過很多著名開源項(xiàng)目如Apache Spark和Alluxio
給開源生態(tài)體系帶來的利益
隨著人工智能和大數(shù)據(jù)處理的進(jìn)一步發(fā)展對(duì)高性能分布式計(jì)算和集群計(jì)算提出更高的要求,業(yè)界迫切需要高效靈活易用的新一代分布式計(jì)算框架/人工智能引擎。RISELab適時(shí)推出的Ray項(xiàng)目具有獨(dú)特的設(shè)計(jì)視角和新穎的實(shí)現(xiàn)思路,同時(shí)還著力于廣泛采用現(xiàn)代運(yùn)維技術(shù)和DevOps友好的實(shí)踐、以及和人工智能/數(shù)據(jù)處理知名第三方項(xiàng)目的集成。?本話題不僅將探討上述技術(shù)棧,同時(shí)也會(huì)引入自己的思考和探索--Ray項(xiàng)目潛在的改進(jìn)和派生。
本次大會(huì)的線上互動(dòng)群(COSCon'22 @開源人團(tuán)聚)也如約而至。加入社群,了解大會(huì)一手信息,精彩周邊拿不停!
03
年度合作伙伴
掃描二維碼即可報(bào)名 點(diǎn)擊「海報(bào)分享」生成個(gè)人專屬海報(bào)
出品丨COSCon'22組委會(huì)
編輯丨李佳陽
設(shè)計(jì)丨蘇子馨 朱億欽 王夢(mèng)玉
更多精彩丨COSCon'22
#
Vol.1
#
Vol.2
KAIYUANSHE/? ?開源社
#
開源社成立于 2014 年,是由志愿貢獻(xiàn)于開源事業(yè)的個(gè)人成員,依 “貢獻(xiàn)、共識(shí)、共治” 原則所組成,始終維持廠商中立、公益、非營(yíng)利的特點(diǎn),是最早以 “開源治理、國(guó)際接軌、社區(qū)發(fā)展、開源項(xiàng)目” 為使命的開源社區(qū)聯(lián)合體。開源社積極與支持開源的社區(qū)、企業(yè)以及政府相關(guān)單位緊密合作,以 “立足中國(guó)、貢獻(xiàn)全球” 為愿景,旨在共創(chuàng)健康可持續(xù)發(fā)展的開源生態(tài),推動(dòng)中國(guó)開源社區(qū)成為全球開源體系的積極參與及貢獻(xiàn)者。
2017 年,開源社轉(zhuǎn)型為完全由個(gè)人成員組成,參照 ASF 等國(guó)際頂級(jí)開源基金會(huì)的治理模式運(yùn)作。近八年來,鏈接了數(shù)萬名開源人,集聚了上千名社區(qū)成員及志愿者、海內(nèi)外數(shù)百位講師,合作了數(shù)百家贊助、媒體、社區(qū)伙伴。
總結(jié)
以上是生活随笔為你收集整理的论坛介绍|COSCon'22 人工智能(A)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【渝粤教育】电大中专计算机常用工具软件
- 下一篇: 工程师如何对待开源——一个老工程师的肺腑