魏伟:学习音视频技术要先理论再实现
LiveVideoStack采訪了京東云視頻云產品研發部的負責人魏偉,他分享了個人經歷,對多媒體技術及行業的趨勢,以及如何抓住這些趨勢。
文 / 魏偉
策劃 / LiveVideoStack
LiveVideoStack:魏偉你好,能否向LiveVideoStack的讀者介紹下自己,以及目前主要的工作以及關注的技術方向?
魏偉:我目前是京東云視頻云產品研發部的負責人,有十多年視頻行業研發經驗,先后從事于AVS標準制定、廣電音視頻系統、互聯網視頻平臺、視頻云服務平臺的架構設計和研發工作,具有豐富的廣電、互聯網視頻、視頻云等行業的研發和管理經驗。2018年加入京東云,現在主要關注媒體處理、RTC、直播、點播、CDN等視頻云服務相關技術和產品。
LiveVideoStack:十多年聚焦在視頻行業,這個領域有什么魔力讓你不離不棄呢?沒有考慮過更換領域嗎?
魏偉:視頻是信息表達的重要方法,從文字、聲音到視頻,以后還會有VR\AR;視頻服務從電視到網絡流媒體其需求越來越多,在各行各業都是重要應用,也逐漸成為很多行業的基礎能力。最近這十多年里經過了從H.264到H.265、AVS標準從制定到正式商用,也有VP9、AV1等標準出現;清晰度720P、1080P到4K,觀看終端從PC到移動終端、互聯網電視,產品形態包括了點播、直播、短視頻、視訊等等逐漸豐富,開放的視頻云服務快速發展。視頻行業在標準和實現、技術和產品、行業和應用等各個方面都在快速發展,相信未來隨著5G、IoT的發展,視頻的信息傳輸和溝通表達能力會更強更便捷,應用場景也會更加廣泛,8K、H.266、HDR、VR等等會更加快速的發展和普及。
LiveVideoStack:展望整個多媒體通訊領域,你認為哪些(開源)技術棧將會快速發展?
魏偉:面向視頻體驗改善相關的技術都會一直快速發展,比如讓延時更低的RTC相關、讓畫質更好的4K普及和HDR、讓碼率更低的H.265普及和H.266制定、讓視頻服務更易獲得的云服務、視頻內容安全和版權等等,另外CV和AI也在結合視頻和多媒體快速發展。
LiveVideoStack:一種觀點認為,現在做多媒體開發比十年前容易很多,因為有許多強大的開源框架、工具(如WebRTC、FFmpeg、x.264)以及像京東云視頻云 這樣的多媒體PaaS平臺,你怎么看這種觀點?
魏偉:應該說隨著云服務的快速普及,多媒體的應用開發比十年前要容易很多,云服務提供了標準化的IaaS、PaaS、SaaS服務,調用接口再加少量開發就能滿足多種業務需求;客戶可以把精力放在自己的業務上,平臺相關的技術實現、穩定性等由云服務來保障。其實十年前也有很多強大的開源框架,但從開源框架開發到穩定可用的產品是需要很大投入和很多時間的,現在標準云服務把這些工作都做好了。我的理解開源框架確實有很大幫助,但不是開源框架了使得多媒體開發容易,而標準化的云服務確實是降低了多媒體產品的開發難度,特別是京東云視頻云的多媒體PaaS平臺:)
LiveVideoStack:搞多媒體開發需要學習大量的基礎知識,而且需要在實際工作中摸爬滾打。對于學習多媒體開發,您有哪些建議?能否推薦一些多媒體開發相關的學習資料或書籍。
魏偉:多媒體開發大體上可以分成視頻、音頻、圖像處理,建議先理解基礎理論再看實現方法。假如從零開始建議從《電視原理》開始理解最基礎和經典的相關原理、《視頻處理與通信》的理論和實現也很好,視覺方向推薦《數字圖像處理》、《圖像處理、分析與機器視覺》,《計算機網絡》也要學習一下。實現方面,視頻標準建議深入理解MPEG-2、H.264以及變化演進,視頻封裝方面建議深入理解TS、MP4的設計和實現,還有各種相關的開源代碼和具體關注點的論文。
LiveVideoStack:音視頻領域還有哪些學界、工業界公認的難點?未來今年,哪些難點有可能取得突破?
魏偉:這個問題太大。H.266/VVC應該算難點,但相信會如期發布;主觀質量提升、低延時RTC也會很快普及,音視頻主觀質量的客觀評價方法似乎一直沒有特別好辦法;視覺、AI方向大家都很關注,也會發展很快。
LiveVideoStack:回顧十多年的從業經歷,技術、行業不斷演變,企業起起落落,有哪些讓你印象 深刻的關鍵詞(技術、企業、人、產品)?
魏偉:移動互聯網,對包括視頻在內的很多行業帶來巨大變化,觀看入口從PC轉到移動端,且流量快速增長;運營、產品和技術上的交互邏輯、產品邏輯、視頻處理和傳輸方式都向移動化方向調整。直播和短視頻的爆發,也只會在移動互聯網場景才會爆發,在PC時代很難爆發起來,正在快速普及的RTC也在重點推進移動端。正如你所說的技術、行業不斷演變,企業起起落落,產學研各界的不間斷投入,或淺顯或深刻,才會有視頻行業的持續發展,才會有自主知識產權視頻標準AVS、OTT、互聯網視頻和直播的快速發展。
LiveVideoStack:您如何看待音視頻云的市場?這里涉及到服務交付與付費模式,定價,渠道等等。在這個市場中,京東云的 優勢是什么?
魏偉:云服務市場是個標準化、產品化的市場,IaaS、PaaS更重標準化,SaaS也在快速進入各個行業。需求越來越多、接受程度也越來越高,標準化的市場也是非常公平的市場,京東云一直以來主張, 生而卓越、只為可信賴,做好產品、做好服務的穩定性、為客戶創造價值,相信會和市場、客戶一起快速發展。
LiveVideoStack:說說你將在LiveVideoStackCon 2018分享的內容吧。就提升用戶視頻觀看體驗而言,涉及到全鏈路及各個環節,如服務端架構、Codec、網絡算法、CDN、視頻前后處理等等。京東云視頻云具體做了哪些探索?
魏偉:LiveVideoStackCon 2018上會介紹我們理解的視頻服務體驗和所做的一些工作,包括音視頻、CDN、存儲、高可用服務以及我們在AI和主觀質量提升上做的一些工作。
總結
以上是生活随笔為你收集整理的魏伟:学习音视频技术要先理论再实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Xilinx:让FFmpeg在FPGA上
- 下一篇: LiveVideoStackCon 20