董海冰:2018风云再起 ,期待AV1、AI和AR
從CCTalk、途牛再到TutorABC,董海冰帶領(lǐng)他的團隊攻下一個個戰(zhàn)略要地。他說:兵無常勢,水無常形。兵不在多,小團隊也往往能改變整個戰(zhàn)局。他還說,要擁抱開源和DevOps,多泡GitHub,努力追尋“心的方向”。LiveVideoStack郵件采訪了TutorABC研發(fā)總監(jiān)董海冰,暢聊了自己作為一名技術(shù)人的歷程。
策劃 / LiveVideoStack
LiveVideoStack:什么時候開始接觸計算機?接觸開發(fā)?第一門語言是什么?第一個開發(fā)的程序or軟件是什么樣的?
董海冰:剛開始接觸計算機是在大學(xué)的時候,課堂上學(xué)習(xí)的第一門計算機語音是Fortran,這是一門為了滿足科學(xué)、工程計算的“比較較古老的”高級語言。當(dāng)時學(xué)得不過癮,就又自學(xué)了C語言。后來在大四搞畢業(yè)設(shè)計的時候,我的導(dǎo)師李老師鼓勵我搞點和以往不同的課題,就自學(xué)Authorware、HTML、JavaScript,搞了一個CAI的課件。當(dāng)時我們系只有我搞編程方面的東西,其他人都忙著畫圖,盡管新東西難啃,但是我卻做得樂在其中,最后畢設(shè)的成績還不錯。所以我一直覺得“興趣”是最好的老師。而我在之后的工作中也會盡量選擇自己感興趣的發(fā)展領(lǐng)域,努力追尋“心的方向”。
LiveVideoStack:在求學(xué)和工作中什么人或者哪一件事對你影響很大?
董海冰:從一個普通的程序員摸爬滾打一步步成長起來,所走的的每一步都離不開恩師、領(lǐng)導(dǎo)們的教誨和鼓勵,兄弟、朋友們的信任與支持。很多時候我們要面對復(fù)雜的業(yè)務(wù)邏輯,N多的棘手的技術(shù)難題,但資源卻很有限,怎么辦?一定要更加深入地了解行業(yè)的發(fā)展趨勢,熟悉業(yè)務(wù)的產(chǎn)品特征,找到最合適的人才,組建一支團結(jié)、精干的團隊。兵不在多而在精,也許有人覺幾個人的小團隊做不成什么大事,但是別忘了“兵無常勢,水無常形”,如果能因勢利導(dǎo),巧妙運用,小團隊也會取得輝煌的戰(zhàn)果。例如:北宋時期,宋遼交戰(zhàn)時的“徐河之戰(zhàn)”,大宋主帥李繼隆巧妙布局,名將尹繼倫不辱使命,率領(lǐng)一支不足千人的巡邊小隊,英勇無畏地從后偷襲了有數(shù)萬(一說八萬之眾)大遼主力的耶律休哥大營,重傷其主帥,加上正面宋軍的及時出擊,讓遼軍主力一路潰敗,契丹從此銳氣大挫,數(shù)年之內(nèi)再不敢冒犯北宋邊關(guān)。一場小團隊發(fā)起的奇襲就這樣逆轉(zhuǎn)了當(dāng)時宋遼雙方的戰(zhàn)略大局。從我的自身發(fā)展經(jīng)歷看,從打造CCTalk的移動版,到途牛的自助游移動端改版等,都是從三、五個人的“敏捷”小團隊,披荊斬棘,取得了突出的階段性成果之后,才逐步發(fā)展、壯大,形成了更有戰(zhàn)斗力的專業(yè)研發(fā)團隊。
LiveVideoStack:您從2005年開始應(yīng)該就一直深耕在教育行業(yè),包括前期在英孚教育,后來加入到滬江負責(zé)架構(gòu),在您看來這些年音視頻對教育的發(fā)展最本質(zhì)的影響是什么?未來的發(fā)展又會是什么樣的?
董海冰:十年前做在線教育,受很多軟硬件條件的制約,當(dāng)時的Visual Classroom還是以音頻交互為主的,一間教室一般在10人以下,人多了會出現(xiàn)掉線、卡頓等很多問題。我記得2000年的時候,一塊Polycom的PCI視頻卡就要上萬塊錢,做實時音視頻成本非常高。但是今天隨著光纖入戶,個人PC的軟硬件的性能也有大幅提升,甚至連手機這樣的移動設(shè)備都已經(jīng)內(nèi)置了H.264的硬解碼功能,實時交互的多路高清視頻,專業(yè)的MCU、SFU性能大幅提升,甚至AR、VR效果的線上教室也在不斷探索中。總之,隨著實時交互的音視頻等互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,線上教室的體驗必將全面超越線下。若干年以后,大家將會發(fā)現(xiàn),實時交互的音視頻技術(shù)只是在線教育系統(tǒng)的一個基礎(chǔ)能力,更多的炫酷的新技術(shù)會賦能全新的在線教育體驗:
首先,線上的老師、學(xué)生的交互數(shù)據(jù)都是可以被記錄下來的,這就給我們做大數(shù)據(jù)分析和人工智能的數(shù)據(jù)訓(xùn)練提供了更好的條件,也讓千人千面的個性化學(xué)習(xí)成為可能。其次,虛擬現(xiàn)實技術(shù)會把學(xué)習(xí)過程融入到沉浸式的教學(xué)體驗中,今后的學(xué)習(xí)過程將不再枯燥,未來的在線教育要同娛樂行業(yè),特別是電子游戲行業(yè)競爭。上一堂課要比打一場游戲更加“過癮”,讓學(xué)生真正“愛上”學(xué)習(xí)。再有,在線教育解決了交通不便,為大家節(jié)省了在路上的時間,并且解決了教育資源分布不平均的等許多線下教育解決不好的問題。而且對于更多”復(fù)雜交互“的場景,線上教育同樣大有可為,例如:編程、繪畫、音樂、健身等。
但無論在線教育怎么發(fā)展,“效率”和“效果”都是核心關(guān)鍵。“效率”為用戶節(jié)省大量時間,提升有效學(xué)習(xí)的速度。不能夠為用戶節(jié)省時間的教學(xué)產(chǎn)品,根本不具備收費條件。同時,隨著用戶年齡的遞增,會越來越重視學(xué)習(xí)的“效果”,不以“效果”為目標的在線學(xué)習(xí)產(chǎn)品是不可持續(xù)的,對于那些教學(xué)質(zhì)量把控不嚴,只考慮降低老師成本,只是“哄孩子玩,卻學(xué)不到東西”的線上教學(xué)產(chǎn)品,最終用戶會選擇用腳投票。
LiveVideoStack:在輕量的客戶端或者微信端,TutorABC近期或者未來是有一個怎樣的規(guī)劃?
董海冰:TutorABC的TutorMeet+系統(tǒng)從一開始就是基于WebRTC標準支持純HTML5的web應(yīng)用,我們已經(jīng)在測試環(huán)境成功進行了Safari和Chrome之間的互聯(lián)互通。采用W3C的標準協(xié)議Codec,讓我們也可以非常方便的支持微信瀏覽器和小程序,我們已經(jīng)實現(xiàn)了云講堂產(chǎn)品在這兩塊的支持,并且發(fā)布了測試版。但是,因為微信小程序還沒有完整的支持標準的WebRTC協(xié)議,只支持了RTMP協(xié)議,如果要實現(xiàn)雙向交互就需要我們進一步升級服務(wù)或者需要綁定騰訊云,否則就只能等小程序后續(xù)的升級了。接下來,我們也會進一步打造輕量級的Windows Native的Client端,從而為更多用戶提供更好的PC端教學(xué)體驗。
LiveVideoStack:如果讓您選擇幾個關(guān)鍵詞來預(yù)測2018年或未來若干年對音視頻領(lǐng)域產(chǎn)生重大影響的技術(shù),您會選哪些?為什么?
董海冰:我對2018的音視頻的發(fā)展充滿期待,最關(guān)注的是3個“A”:AV1、AI和AR。AV1是對標H.265的新一代編解碼標準,開源、免費是一大特色,聽說今年會發(fā)布1.0(LiveVideoStack注:AOM聯(lián)盟伙伴正在做AV1最終定稿,預(yù)計上半年發(fā)布),希望可以盡快集成到WebRTC的新版本中,讓大家盡快享受新一代的高清體驗。
我們都知道AI領(lǐng)域發(fā)展最快的就包括音視頻領(lǐng)域,通過機器學(xué)習(xí)我們會更好的了解動態(tài)的視、音頻內(nèi)容,精準跟蹤我們要了解的用戶數(shù)據(jù)。并且,AI和AR(VR)的快速發(fā)展不僅僅個我們帶來了日益精準的人臉識別、虛擬展示等應(yīng)用,也有更多更酷的動態(tài)面具表情和虛擬背景生成等。隨著新技術(shù)的快速發(fā)展,相信之前需要借助昂貴的專業(yè)設(shè)備的虛擬演播室,場景化模擬,沉浸式教學(xué)等嶄新的音視頻體驗都會逐步涌現(xiàn)出來,到那時。目前的在線教育領(lǐng)域競爭日趨激烈,卓越的公司要脫穎而出,必須要從“業(yè)務(wù)導(dǎo)向“轉(zhuǎn)向”創(chuàng)新導(dǎo)向“。2018的在線教育市場,風(fēng)云再起,讓我們拭目以待。
LiveVideoStack:不少技術(shù)人轉(zhuǎn)崗去做音視頻技術(shù)研發(fā),如何能更快速的上手?對此您有哪些建議?
董海冰:建議大家先多了解一下近些年音視頻通訊技術(shù)的發(fā)展歷程,要避開一些不成熟,甚至已經(jīng)過時的技術(shù),防止閉門造車。WebRTC作為目前應(yīng)用最廣泛的國際標準已經(jīng)得到了絕大多數(shù)互聯(lián)網(wǎng)巨頭們的支持,多了解WebRTC的相關(guān)技術(shù)對從事音視頻行業(yè)非常有意義。早期的音視頻項目方面的代碼多是C、C++寫的,例如:Janus、Jitsi、Kurento等。目前,隨著開源項目逐步成熟,基于Golang和Docker的技術(shù)新項目已經(jīng)開始出現(xiàn)了。Golang在音視頻通訊的基礎(chǔ)平臺建設(shè)和音視頻流信令控制、系統(tǒng)集成、分布式部署和高可用等方面有著得天獨厚的優(yōu)勢。Docker可以隔離系統(tǒng)組件依賴,簡化部署,讓我們更好的擁抱DevOps。這兩方面的技術(shù)發(fā)展,大家都可以更多關(guān)注GitHub上的開源項目。
音視頻的編解碼方面除非有特殊場景,否則沒有必要搞新的私有協(xié)議。用目前已經(jīng)廣泛采用的H.264、VP8、VP9、Opus、AAC即可達到基本的要求,采用通用協(xié)議可以有效降低服務(wù)器轉(zhuǎn)碼方面的開銷,有利于各個瀏覽器、移動端的互聯(lián)互通。如果將來AOM發(fā)起的AV1成熟了,大家也可以踴躍進行嘗試。衷心希望音視頻領(lǐng)域的開源社區(qū)和開源項目都能發(fā)展的越來越好!
WebRTCon 2018 8折最后2天!
此前WebRTC前端應(yīng)用基本以Native為主,這主要由于應(yīng)用端必須集成處理音視頻的Windows、Mac或者mobile SDK。而研發(fā)Native的Client則帶來很多弊端。但隨著Chrome、Safari為代表的主流瀏覽器的快速發(fā)展,越來越多的Web端即使不使用Flash也可以輕松創(chuàng)建基于H5的WebRTC音視頻實時互動應(yīng)用。特別是當(dāng)微信已經(jīng)成為新的流量入口,輕量級的前端應(yīng)用借助微信瀏覽器或者微信小程序也可以進行輕松進行復(fù)雜的音視頻實時交互,盡情享受移動互聯(lián)網(wǎng)帶來的流量、便利紅利。
董海冰老師將攜手騰訊課堂、TutorABC等多位大咖共同打造“WebRTC與前端”專題,更多詳情請點擊【閱讀原文】。
總結(jié)
以上是生活随笔為你收集整理的董海冰:2018风云再起 ,期待AV1、AI和AR的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 动态优化器—一种感知视频编码优化框架
- 下一篇: AI 趋势