七牛云徐晶:低延迟互动时代看好WebRTC和SRT
在 LiveVideoStackCon 2018 前夕,七牛云教育行業(yè)解決方案高級專家徐晶接受了 LiveVideoStack 的采訪,聊到了流媒體的技術(shù)發(fā)展與技術(shù)棧迭代。在當(dāng)今的低延遲的互動時代,WebRTC、SRT 等技術(shù)得到了快速發(fā)展。
文 / 徐晶
策劃 / LiveVideoStack
LiveVideoStack:徐晶你好,能否向 LiveVideoStack 的讀者介紹下自己,及目前的主要工作和關(guān)注的技術(shù)方向?
徐晶:我在互聯(lián)網(wǎng)視音頻行業(yè) 9 年工作經(jīng)驗(yàn),3 年傳統(tǒng)廣電視音頻經(jīng)驗(yàn)。曾任阿里巴巴大文娛流媒體業(yè)務(wù)負(fù)責(zé)人,優(yōu)酷直播品牌創(chuàng)始人,現(xiàn)為七牛云智慧教育行業(yè)產(chǎn)品負(fù)責(zé)人。
我常年從事互聯(lián)網(wǎng)流媒體相關(guān)工作,接觸最底層的協(xié)議,從最早的流媒體協(xié)議 mms 到標(biāo)準(zhǔn) RTMP/HLS 協(xié)議,再到目前流行的低延時音視頻 WebRTC 協(xié)議,都在這些協(xié)議上構(gòu)建業(yè)務(wù)模型,驅(qū)動業(yè)務(wù),形成業(yè)務(wù)閉環(huán)。
2010 始,創(chuàng)建優(yōu)酷直播品牌,構(gòu)建 B 端的高清業(yè)務(wù)模型,打通傳統(tǒng)媒體的音視頻與互聯(lián)網(wǎng)音視頻的技術(shù)壁壘,形成業(yè)內(nèi)首個 to B 互聯(lián)網(wǎng)商業(yè)直播平臺,建立互聯(lián)網(wǎng)的 HD-SDI 全高清標(biāo)準(zhǔn),同步推出優(yōu)化的 RTMP 協(xié)議。2014 年完成營收 1.2 億人民幣。后續(xù)又將電商屬性和媒體屬性相結(jié)合,孵化了淘寶直播產(chǎn)品,在電商直播領(lǐng)域形成行業(yè)領(lǐng)先。
在阿里巴巴 8 年后,加入七牛云團(tuán)隊(duì),開始探索整個市場的直播 3.0 時代,即擁有互動能力的實(shí)時直播體系。在資本市場大量投向在線教育產(chǎn)業(yè)之際,開始推進(jìn)在線教育的云計算解決方案。深入研究谷歌的 WebRTC 協(xié)議,利用該低延時的音視頻傳送建立教育行業(yè)的技術(shù)模型,目前已完成教育音視頻通訊、教育白板、音視頻加解密、海外傳輸優(yōu)化、教育存儲和大數(shù)據(jù)分析等云計算產(chǎn)品的嘗試。后續(xù)將會深耕在線教育和互聯(lián)網(wǎng)的行業(yè)解決方案,拓展和創(chuàng)建新的音視頻教育模型。
LiveVideoStack:回顧過去,你認(rèn)為互聯(lián)網(wǎng)流媒體技術(shù)經(jīng)歷了哪些階段?
徐晶:我認(rèn)為互聯(lián)網(wǎng)的視音頻發(fā)展大致分為 3 個階段:
1.0 時代:典型標(biāo)志是標(biāo)清傳送。這是互聯(lián)網(wǎng)音視頻的最初階段,通常沒有較好的畫質(zhì)及用戶體驗(yàn),存在流媒體不穩(wěn)定情況,但可以將傳統(tǒng)音視頻搬到互聯(lián)網(wǎng)上來生根發(fā)芽。
2.0 時代:典型標(biāo)志是在線觀看。這個屬性定義主要是單向的用戶收看體驗(yàn),在這個階段,開始有高清畫質(zhì)提供,開始注重用戶體驗(yàn)和簡單互動,如打賞、點(diǎn)贊。
3.0 時代:即當(dāng)前狀態(tài),典型標(biāo)志為實(shí)時互動。越來越多的互聯(lián)網(wǎng)音視頻用戶不僅需要高清觀看,還需要強(qiáng)互動,從而交流話題形成社區(qū)。
在每個時代,都有特定的技術(shù)支撐體系。
1.0 時代:我利用微軟的整套解決方案做技術(shù)核心建立平臺,并不斷調(diào)整優(yōu)化。比如在 mms 時代由于不采用數(shù)字化的音視頻采集,很容易出現(xiàn)聲畫不同步問題,技術(shù)上沒有很好的時間戳解決方案,我們會對 mms 協(xié)議進(jìn)行必要的改進(jìn),對編碼前的時間算法進(jìn)行了二次開發(fā),讓模擬信號在采集的同時可以進(jìn)行一定時延調(diào)整;利用 Windows Media Encoder 的內(nèi)核,擴(kuò)大 buffer 空間,形成業(yè)內(nèi)第一個可調(diào)整同步的編解碼方案。
2.0 時代:蘋果的 HLS 與 Adobe 的 RTMP 開始深入互聯(lián)網(wǎng)的時代,高清開始發(fā)展。我當(dāng)時負(fù)責(zé)技術(shù)上突破高清采集的限制,由于采集原始的音視頻信號存在數(shù)據(jù)吞吐量大的問題,我們建立了嵌入式硬件的解決方案,與美國的一家公司合作建立互聯(lián)網(wǎng) Full HD 無損采集標(biāo)準(zhǔn),建立 CCU 信號的初始編碼規(guī)范,從而形成行業(yè)內(nèi)第一個全高清商業(yè)直播平臺,為各大品牌客戶提供直播流媒體服務(wù)。包括奧迪、寶馬發(fā)布會;戛納電影節(jié);蘋果新品發(fā)布會、蘋果 WWDC 開發(fā)者大會;世界互聯(lián)網(wǎng)大會、央視春晚、天貓雙十一晚會等。
2.0 時代還孵化了電商直播「淘寶直播」。突破橫豎屏限制,推出服務(wù)端優(yōu)化和合流能力。其中最大的挑戰(zhàn)就是在流媒體中增加互動交易能力,我們建立云端導(dǎo)播(即當(dāng)前的云導(dǎo)播能力)嵌入包裝系統(tǒng),建立實(shí)時音視頻字幕系統(tǒng)增加業(yè)務(wù)端配套能力。與淘寶、天貓構(gòu)建 PUGC 的移動直播工具,讓直播的門檻足夠降低,努力達(dá)到“天下沒有難做的生意”目標(biāo)。
3.0 時代開始,低延時需求越來越成為開發(fā)者用戶的關(guān)注點(diǎn)。WebRTC 技術(shù)慢慢提上日程,WebRTC 原來不規(guī)范的信令標(biāo)準(zhǔn)在近期開始建立行業(yè)標(biāo)準(zhǔn),阿里、騰訊、七牛云等紛紛開始拓展云計算帶來的價值。而在互動領(lǐng)域,教育是最大的應(yīng)用市場之一,其 2017 年體量約為 1800 億人民幣,但排名前十的營收僅為 41 億人民幣,空缺很大,這也意味著低延時流媒體的需求有相當(dāng)大的空間。教育最難的突破點(diǎn)為行業(yè)性較深,有很多流媒體以外的需求痛點(diǎn),如白板能力和 IM 能力,需要很好的集成,這是難點(diǎn)也是挑戰(zhàn)。
LiveVideoStack:展望整個多媒體通訊領(lǐng)域,你認(rèn)為哪些(開源)技術(shù)棧將會快速發(fā)展?
徐晶:在互聯(lián)網(wǎng)多媒體通訊領(lǐng)域,我認(rèn)為現(xiàn)在的時代是互動時代,是低延時時代,因此首當(dāng)其沖的技術(shù)就是 WebRTC。其實(shí)從谷歌 WebRTC 開源到現(xiàn)在已經(jīng)有不少年頭,但是期間遇到了很多瓶頸和規(guī)范問題,比如原來的信令系統(tǒng)沒有定義和規(guī)范,早期的 WebRTC 處在 peer to peer 模式,沒有很好的音視頻網(wǎng)絡(luò)抖動保障和群組碼率保障的機(jī)制,導(dǎo)致在群組多媒體通訊時往往因?yàn)橐环降木W(wǎng)絡(luò)抖動導(dǎo)致整個通話的傳輸質(zhì)量下降。當(dāng)然,2017 年底,WebRTC 真正地開始發(fā)展起來,一方面是市場對低延時流媒體的需求迅速擴(kuò)張,直播 3.0 時代的到來和強(qiáng)互動需求都給了 WebRTC 技術(shù)很多的想象空間。
還有一些開源協(xié)議和技術(shù)規(guī)范發(fā)展起來,如 Haivision 的 SRT 技術(shù)開始被應(yīng)用在互聯(lián)網(wǎng)傳送,并且在一些特殊場景下沿用嵌入式硬件解決方案,這也從另一方面為低延時提供保障。VLC 從 3.0 開始對 SRT 協(xié)議進(jìn)行有效支持,同時在低延時延展編碼中采用該協(xié)議作為同步,這都會在未來 1~2 年開始逐步推向商業(yè)化。
LiveVideoStack:您參與過娛樂直播、電商直播和在線教育,這三種業(yè)務(wù)場景對技術(shù)支撐分別有哪些挑戰(zhàn)?
徐晶:娛樂直播中最重要的屬性是觀看,其實(shí)就是直播的 2.0 時代的產(chǎn)物,他的挑戰(zhàn)是畫質(zhì)的高清和網(wǎng)絡(luò)傳輸?shù)牧鲿?#xff0c;目前這部分都在被云計算的解決方案所覆蓋,形成標(biāo)準(zhǔn)組件。2018 年的挑戰(zhàn)是基于 4K 顯示和編碼的 OTT 延展技術(shù)和 4K+MR 的多媒體混合編解碼方案,這些是技術(shù)上的突破,目前國內(nèi)部分大廠商已經(jīng)在開始著手研究 4K 領(lǐng)域的高校傳輸問題。
電商直播中最重要的屬性在于互動和包裝,即電商直播開始在原有的音視頻基礎(chǔ)上需要對畫面進(jìn)行增加字幕、顯示包裝等操作,同時還需要適配到各端的互動能力,因此最大的挑戰(zhàn)在于互動與直播流媒體之間的低延時同步問題。如一個電商直播在 20 點(diǎn)整的時候開始搶購,需要同步在流媒體中輸入有效的字幕,及同步所有的互動交互組件進(jìn)行適配觸發(fā)某些功能的實(shí)現(xiàn)。我們通過給流媒體加上相對時間軸和相對互動時間打點(diǎn)機(jī)制來完成,這個技術(shù)行業(yè)內(nèi)叫流媒體時間戳。
教育類直播是直播垂直領(lǐng)域的一個分支,其重點(diǎn)的技術(shù)突破就是足夠的低延時,能夠讓雙向的直播不會因?yàn)闀r延而讓雙方交流不暢。重點(diǎn)是 WebRTC 技術(shù)的運(yùn)用與優(yōu)化,難點(diǎn)也是 WebRTC 的優(yōu)化和相關(guān)配套能力(如白板、虛擬環(huán)境)的協(xié)同。比如如何解決 Peer to Peer 的不穩(wěn)定問題,如何利用 P2S 模型建立更強(qiáng)大的服務(wù)端能力,比如服務(wù)端的 GPU 加速合流、錄制能力,同時通過編解碼的方式優(yōu)化是否可以在服務(wù)端建立二次編解碼能力做端上低碼率適配等等。
LiveVideoStack:能否介紹下七牛云在教育和實(shí)時通訊領(lǐng)域有哪些特色技術(shù)和產(chǎn)品,未來有哪些發(fā)展規(guī)劃?
徐晶:加入七牛云以來,一直致力于開拓云計算平臺的教育行業(yè)解決方案,我認(rèn)為未來云計算平臺將不止于提供基礎(chǔ)的云計算能力,還會圍繞不同場景提供整體的行業(yè)解決方案,教育就是其中一個。教育行業(yè)的難點(diǎn)在于需要很多的基礎(chǔ)產(chǎn)品進(jìn)行結(jié)合,同時還會有很多的流媒體意外的痛點(diǎn)需要大量被集成和協(xié)同。
七牛云智慧教育行業(yè)解決方案的優(yōu)勢在于依托于七牛云的云計算平臺,能夠快速集成行業(yè)應(yīng)用,滿足業(yè)務(wù)需求。比如在音視頻方面,目前大量的實(shí)時通訊的公司都在 WebRTC 協(xié)議上加了一層自己的私有化協(xié)議做基礎(chǔ)保障,這樣開放性低,兼容度不高,后續(xù)的維護(hù)成本過高。而七牛云是基于標(biāo)準(zhǔn) WebRTC 開發(fā),全程采用基礎(chǔ)協(xié)議,這樣無論在 SDK 的包體大小還是在后續(xù)的兼容度上看,會更有優(yōu)勢,好比是做了一個 App store,后續(xù)的功能其實(shí)可以通過開放的生態(tài)來構(gòu)筑。當(dāng)然七牛云智慧教育解決方案還有不少優(yōu)勢,比如精度可達(dá)全高清,不久將支持 4K 能力,再比如七牛的基于 GPU 的教育視頻合流能力以及描述性白板同步能力,未來的七牛云智慧教育行業(yè)解決方案還會拓展 AI 和大數(shù)據(jù)的分析,針對傳統(tǒng)教育行業(yè)的一些痛點(diǎn)進(jìn)行深入化的單點(diǎn)打透。
LiveVideoStack:說說你將在 LiveVideoStackCon 2018 分享的內(nèi)容吧。
徐晶:首先很榮幸可以在這樣的平臺上進(jìn)行交流和分享,我擅長技術(shù)驅(qū)動,從而帶動整合產(chǎn)品的模型發(fā)展,因此我會在這個分享會上去分享我在七牛云建立教育行業(yè)解決方案的最初思考,以及在這個思考背后所作出的技術(shù)改進(jìn)和努力,同時也會將我目前所做的產(chǎn)品方案以及為什么會有這樣的產(chǎn)品發(fā)展路徑和選擇和大家做一些互動。
總結(jié)
以上是生活随笔為你收集整理的七牛云徐晶:低延迟互动时代看好WebRTC和SRT的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 音视频技术开发周刊 64期
- 下一篇: 2023年多播ABR市场将达8亿美元