章琦:能坚持的唯一的原因就是兴趣
從虹軟、思科再到唐橋,章琦一直在關注視頻編解碼和實時通信開發(fā)。作為架構師,他認為軟件設計和下圍棋一樣,都是“簡單細胞組合成復雜藝術作品”的真實體現。LiveVideoStack郵件采訪了唐橋科技首席架構師章琦,暢聊了自己成長的過程,以及對多媒體技術生態(tài)未來的看法。
策劃 / LiveVideoStack
LiveVideoStack:章琦你好,能否簡要介紹下自己,包括目前的主要工作及關注領域?
章琦:我畢業(yè)于浙江大學數學系,研究方向為數字圖像處理。畢業(yè)后的第一份工作是視頻編解碼器的開發(fā),有感于編解碼器之外的技術世界的瑰麗,于是輾轉于編解碼器之上層技術應用。目前的工作是為唐橋科技設計下一代實時音視頻通信系統(tǒng)以及衍生于此系統(tǒng)之上的行業(yè)應用。關注領域包括視頻編碼解碼技術,實時通信,QoS,實時語音處理,人工智能,現實增強,虛擬現實等。
LiveVideoStack:您怎么理解架構師這個崗位?
章琦:架構師承擔了企業(yè)中的技術方案制定,架構設計,未來技術戰(zhàn)略規(guī)劃等職責,看起來雖然抽象,實質上跟普通的程序員并無區(qū)別。對于架構師而言,最大的成就莫過于以簡單的結構,解決了現實中的復雜問題。每個程序員也在做同樣的事情,無非是規(guī)模不同而已。我很喜歡程曉流在《圍棋發(fā)陽論新解》中的一句話:無論結構多么復雜的藝術作品,都是由許多簡單的細胞組合而成。晶瑩的水滴固然澄澈無奇,它們一旦匯集起來,大海的波濤又將是何等的瑰異綺麗。軟件設計領域, 同樣如此!
LiveVideoStack:從虹軟,思科,再到唐橋,一直沒有離開多媒體開發(fā)領域,究竟有什么原因讓你不離不棄?
章琦:能堅持的唯一的原因就是興趣。
LiveVideoStack:虹軟和思科都是非常令人敬佩的公司,能聊聊在這兩個公司的難忘的經歷嗎?
章琦:虹軟是我碩士畢業(yè)后的第一份工作,從此起步開始學習視頻編解碼的算法和處理器相關的優(yōu)化。我能在多媒體開發(fā)領域工作至今,很大程度是托了虹軟的福。我在虹軟工作的兩年,公司和領導給了我非常寬松的環(huán)境和給力的支持。我在虹軟負責H.264 Codec開發(fā)的時候,技術方案的選擇上跟美國的大Boss有分歧,本地的Manager請我按照自己的想法繼續(xù)設計和實現,所有的壓力由他承擔。至今想來,仍覺感激。
思科是一家偉大的公司,我在實時通信領域所學習到的知識,大多是源于在思科的經歷。思科的同事中藏龍臥虎,技術大牛非常多,甚至能遇到業(yè)內頂尖的高手,和他們共事,向他們學習。?
LiveVideoStack:對于那些非“科班”出身的多媒體開發(fā)者如何更好的入門、深入學習,您有哪些建議?
章琦:我也是非“科班”出身的開發(fā)者,我曾和不少算法領域和應用領域的開發(fā)者有過交談,一個常見現象是: 算法領域的工程師輕視應用,應用領域的工程師則覺得算法設計非常高大上,難以學習。實際并非如此,除了極少數開拓性的研究工作之外,絕大多數的技能都是普通人可以學習并精通。其關鍵還是在于保持專注,并能沿正確的方向堅持下去。至于如何尋找正確的方向,現在互聯網上的資料非常多,基礎學科可以看公開課,比較推薦網易公開課。深入的領域則尋找業(yè)內評價高的開源項目以及相關資料學習。
LiveVideoStack:能否描述一下您典型的一天的日程?幾點入睡,幾點起床?
章琦:一般早晨7:00起床,12:00之前入睡。除了工作之外,還喜歡閱讀,喜歡讀的書除了技術類,還有歷史,數學,圍棋,國學等等。還有一個日程是陪孩子玩,在孩子身上,似乎找到了過去的自己。
LiveVideoStack:回顧過去十多年音視頻通信技術的發(fā)展,取得了哪些突破?當下還有哪些難點需要業(yè)界共同探索的方向?
章琦:視頻編碼技術從H.261,MPEG2(H.262),MPEG4/H.263,H.264/VP8,H.265/VP9/AV1,每一代編碼標準的更新,就帶來RD(碼率失真)性能的極大提升。以AEC為代表的語音處理算法也有了長足進步,網絡帶寬預測/丟包補償等技術在現在的實時通信領域得到了成功應用,未來結合當前的深度學習和自適應算法,進一步提升編碼算法的效率(H.266等),音視頻質量增強(SR,deblur,denoise等),內容分析,識別處理等,更準確的預測網絡變化,效率更好的回音抑制算法(non-linear adaptive filter)等等,如何將AR/VR跟實時音視頻通信相結合等等, 都會是我們需要共同探索的方向。
LiveVideoStack:5G、4K乃至8K高清,給多媒體開發(fā)生態(tài)帶來了哪些機遇和挑戰(zhàn)?
章琦:多媒體生態(tài)的發(fā)展離不開硬件設備的成熟和基礎網絡的建設,隨著5G時代的來臨,可以預想到的是用戶接入網絡帶寬的提升和流量費用的進一步降低,使高流量的4k甚至8k,VR視頻應用成為可能。用戶體驗的提升伴隨著網絡帶寬需求的上升,可以肯定是,網絡帶寬永遠是不能滿足需求的。所以,視頻編碼的RD性能能否進一步提升,網絡QoS算法是否能更加準確的估計網絡帶寬,在弱網下能否提供平穩(wěn)的用戶體驗會是永恒的挑戰(zhàn)。
LiveVideoStack:展望未來,您看好哪些新興行業(yè)或應用場景將會重度使用音視頻通信技術?
章琦:新興行業(yè)中IoT,自動駕駛,機器人等等都需要依賴于音視頻處理及通信技術,傳統(tǒng)行業(yè)比如教育,醫(yī)療,零售等也會越來越增加與音視頻通信技術的粘性,從而拓展出豐富的增值功能。
LiveVideoStack:您看好哪些新興的技術(如區(qū)塊鏈、AI等)與多媒體行業(yè)結合帶來新價值?
章琦:對區(qū)塊鏈了解不多,就談談AI技術吧。AI最有可能為多媒體行業(yè)帶來新的增長點的新技術,基于語音、視頻內容的分析識別,基于深度學習的質量增強算法等等,除了會改變多媒體應用本身,還會讓多媒體技術跟新興行業(yè)和傳統(tǒng)行業(yè)融合,衍生出豐富多彩的行業(yè)應用。此外,AR/VR技術的成熟,也勢必能激發(fā)出新的應用類型和用戶體驗。
LiveVideoStack:您如何看待WebRTC對行業(yè)的影響?相對于一些成熟的私有協(xié)議(如Zoom,WebEx等),WebRTC的短板是什么?
章琦:在2011年WebRTC未開源前, 實時音視頻通信系統(tǒng)的搭建的技術門檻非常高, 能自己獨立研發(fā)這個系統(tǒng)的公司屈指可數。WebRTC的誕生及演進,不僅僅為瀏覽器應用生態(tài)增加了多媒體功能,而且大大降低了企業(yè)自主研發(fā)音視頻通信系統(tǒng)的難度,現在的國內的多媒體研發(fā)的火熱局面,WebRTC功不可沒。但是相比Zoom、WebEx這些成熟的系統(tǒng),WebRTC僅僅是一個實時音視頻通信的引擎,不包含信令系統(tǒng),也無法直接應用于多方會議系統(tǒng),很多功能是缺失的,開發(fā)難度依然不小。
WebRTCon 2018
經歷了起跑、 熱炒、失落的7年長跑后,伴隨1.0版定稿,獲得iOS端支持,WebRTC具備了打通主流生態(tài)系統(tǒng)和端的能力,2018年也將是WebRTC落地的最好時機。由LiveVideoStack音視頻技術社區(qū)出品,WebRTCon 2018將于5月在上海舉行,這是一次對過去幾年WebRTC技術實踐與應用落地的總結。
本文受訪者也將出席,與大家分享、討論如何基于WebRTC設計多方視頻會議系統(tǒng),從而提供最優(yōu)的視頻通訊質量。除此之外,還有其他全球領先的WebRTC技術專家,為參會者帶來全球同步的技術實踐與趨勢解讀。
點擊 [閱讀原文] 了解更多相關信息,快來報名吧!
總結
以上是生活随笔為你收集整理的章琦:能坚持的唯一的原因就是兴趣的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 聚焦北京,探秘多媒体开发新趋势(内附资料
- 下一篇: 小哥哥,WebRTC 了解一下