走进武汉,探索多媒体开发最佳实践
2018年初的音視頻技術生態(tài)并不平靜,Codec的爭奪進入群雄逐鹿的時代,AV1和國產(chǎn)的AVS2對HEVC發(fā)起了挑戰(zhàn);WebRTC 1.0版定稿打通了在瀏覽器、移動端乃至IoT上的多媒體通信;AI、區(qū)塊鏈技術的發(fā)展,正在與多媒體開發(fā)發(fā)生在化學反應,將成為推動生態(tài)發(fā)展的新力量。與此同時,在線答題、在線抓娃娃、O2O與新零售等新的業(yè)務場景探索,賦予了新技術最好的實踐環(huán)境。另外,新技術正在對安防、視頻會議、社交、教育、金融等行業(yè)產(chǎn)生影響,甚至讓行業(yè)生態(tài)重新洗牌。 ?
8月25日·武漢?|?LiveVideoStack聯(lián)合斗魚、即構(gòu)科技、三體云、影普科技等多位大咖,共同探索新技術在音視頻領域的實踐,以及新興應用場景和傳統(tǒng)行業(yè)的突破。
講師與話題
鄭偉 斗魚資深多媒體研發(fā)工程師
Speaker:斗魚資深多媒體研發(fā)工程師、多媒體小組負責人、斗魚架構(gòu)委員會成員,早年從事電視芯片的軟件研發(fā),經(jīng)歷過嵌入式播放器的開發(fā),移動時代的興起也開始移動平臺流媒體相關功能的開發(fā)。隨著近年來AI技術的火熱,也在積極探索將AI與傳統(tǒng)流媒體相結(jié)合的實踐。
Topic:AI賦能游戲直播內(nèi)容識別的實踐
斗魚作為國內(nèi)一流的游戲直播平臺,每天都會有上萬名主播直播,同時會生成海量的視頻內(nèi)容,傳統(tǒng)的直播除了做內(nèi)容審核以外,是不做內(nèi)容的多次消費的。自從短視頻興起后,我們一直在思考一個問題,如何將我們平臺海量的直播內(nèi)容轉(zhuǎn)化為點播內(nèi)容?一種方案是直接提供主播的回看視頻,另一種方案是基于AI的技術進行智能的直播流云剪輯。很顯然第二種方案更好,這也是本次分享主要內(nèi)容。
陳加忠 華中科技大學計算機系統(tǒng)結(jié)構(gòu)博士
Speaker:華中科技大學計算機系統(tǒng)結(jié)構(gòu)博士,長期從事流媒體的研究與教學,擅長結(jié)合視頻編碼算法特點與硬件的指令集與流水線特征,提高視頻編碼算法的時間效率;擅長高效實現(xiàn)深度卷積網(wǎng)絡的底層計算模塊。2002年至2009年參加AVS標準制定視頻工作組,曾經(jīng)主持新加坡科技局ASTAR合作項目:ADI 561上的H.264視頻流媒體服務器開發(fā)、北京現(xiàn)代信息科學與網(wǎng)絡技術重點實驗室開放基金:基于移動環(huán)境視頻失真感知模型的質(zhì)量體驗提升、華為創(chuàng)新研究計劃項目: 移動環(huán)境下圖像處理技術研究。目前研究方向包括:深度學習、計算機視覺、圖像與視頻處理等。在研項目包括教育直播受眾的人臉表情識別、直播敏感內(nèi)容檢測、圖像中關鍵區(qū)域檢測、中國移動用戶大數(shù)據(jù)分析等。
Topic:多媒體應用中的視覺關注 Visual Attention in Multimedia Application
我們周圍的世界包含了巨量的視覺信息,人眼能具有識別其中重要信息的能力,因此人們可以毫不費力地識別所處環(huán)境并無障礙地行走。視覺關注致力于讓機器找出場景中人眼關注的區(qū)域,以解決和視覺相關的諸多媒體應用問題,如:廣告投放位置選擇、圖像分割、目標識別、基于內(nèi)容的圖像檢索、圖像視頻的壓縮與傳輸、圖像的適配顯示、環(huán)境感知的手機節(jié)電模式優(yōu)化等。
冼牛 即構(gòu)科技技術副總裁
Speaker:北京郵電大學計算機碩士,香港大學工商管理碩士,負責即構(gòu)實時音視頻引擎的開發(fā)與研究,專注視頻直播、音視頻社交、物聯(lián)網(wǎng)和在線教育等行業(yè)。
Topic:實時音視頻技術在跨國網(wǎng)絡與教育場景中的應用
在線教育應用場景對實時音視頻技術的要求可以用兩個關鍵詞來概括:穩(wěn)定性和高質(zhì)量。在線英語培訓的場景中,穩(wěn)定性就要求在跨國網(wǎng)絡下做到高連通率,低延遲和不卡頓,跨國的實時視頻云調(diào)度系統(tǒng)要充分考慮就近接入、負載均衡、動態(tài)路由、第一公里、最后一公里和節(jié)點之間智能調(diào)度的策略。在線樂器陪練的場景中,高質(zhì)量就要求音視頻技術能很好地還原音樂聲,對回聲消除、全帶語音和噪音抑止等技術有極致的要求。謹借此機會,分享一下即構(gòu)科技在在線英語培訓場景和在線樂器陪練場景中的技術實踐。
李幸原?三體云實時視頻高級工程師
Speaker:北京工業(yè)大學碩士,7年視頻編解碼,流媒體研發(fā)經(jīng)歷,曾經(jīng)主導了無線桌面共享系統(tǒng),移動遠程醫(yī)療平臺的架構(gòu)設計和研發(fā),參與過大型互聯(lián)網(wǎng)直播項目,對視頻編解碼,流媒體,軟硬件協(xié)同設計等有濃厚的興趣。
Topic:低延時實時視頻通信
音視頻實時通訊的應用場景已經(jīng)隨處可見,從游戲語音對講、直播連麥,到答題組隊開黑。對于開發(fā)者而言,除了關注如何能快速實現(xiàn)不同應用場景的實時視頻通訊,更需要關注的就是用戶體驗,而其中低延時無疑是重點。本次分享將從三體云實時視頻通信架構(gòu)詳細講解低延時技術實現(xiàn)與難點分析。
吉長江 影普科技創(chuàng)新研發(fā)中心負責人
Speaker:創(chuàng)新研發(fā)中心負責技術的研究開發(fā),科研、專利項目的申報,新技術的推廣與應用,解決重大技術難題,組織技術攻關等。負責人吉長江是中科大少年班畢業(yè),在視頻技術領域擁有多項發(fā)明專利。
Topic:基于語義與幾何的視頻植入
精美禮品
我們在現(xiàn)場準備了精美的禮品,現(xiàn)場參與的小伙伴還有機會贏得LiveVideoStackCon 2018音視頻技術大會的門票、熱門技術圖書《數(shù)字視頻處理》。
LiveVideoStackCon 2018音視頻技術大會門票
《數(shù)字視頻處理》英文原版
馬克杯
T恤
LiveVideoStack抱枕
數(shù)據(jù)線
筆記本
拖鞋
購買VIP票的小伙伴更有機會參加講師交流晚宴。點擊【閱讀原文】報名。
總結(jié)
以上是生活随笔為你收集整理的走进武汉,探索多媒体开发最佳实践的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 快手QoE指标设计的分析初探
- 下一篇: 刘歧:FFmpeg Filter深度应用