见良:学习多媒体主要靠实践
LiveVideoStack郵件采訪了北京美攝網(wǎng)絡(luò)科技有限公司CTO 見良,作為十多年的多媒體老兵,他認為學(xué)習(xí)多媒體技術(shù)主要通過實踐,必須在實際的項目中鍛煉自己。對于未來,機器學(xué)習(xí)結(jié)合計算機圖形學(xué)可以實現(xiàn)智能剪輯,制作出更有趣的視頻。
文 / 見良
策劃 / LiveVideoStack
LiveVideoStack:見良你好,能否向LiveVideoStack的讀者介紹下自己,以及目前主要的工作以及關(guān)注的技術(shù)方向?
見良:目前主要是移動端高質(zhì)量的視音頻技術(shù)解決方案,包括視音頻的采集,編輯,特效合成,為各種視音頻應(yīng)用提供底層技術(shù)支持。目前主要關(guān)注視音頻處理架構(gòu)設(shè)計,算法設(shè)計,視音頻AI處理。
LiveVideoStack:15年來一直在從事視頻處理相關(guān)的研發(fā),沒有考慮過更換個技術(shù)方向嗎?如何保持對技術(shù)的好奇心?
見良:視音頻技術(shù)總是在不斷發(fā)展的,以前用傳統(tǒng)計算機圖形學(xué)、圖像處理算法難以解決的問題,現(xiàn)在通過卷積神經(jīng)網(wǎng)絡(luò)能解決的相當不錯。同時市場用戶不斷提出新的要求,不再滿足一般低質(zhì)量、五毛特效,要求效果越來越真實,更炫酷,更簡便。廠商要求技術(shù)也越來越高,更高的清晰度,更小的資源,更高的效率。
LiveVideoStack:一種觀點認為,現(xiàn)在做多媒體開發(fā)比十年前容易很多,因為有許多強大的開源框架、工具(如WebRTC、FFmpeg、x264),您怎么看這種觀點?
? ? ?
見良:確實是強大的開源框架能助力開發(fā),但是視音頻處理要求更高,所以開源的項目要謹慎選擇,它們普適性很強,為了追求更好效果、更高的質(zhì)量,我們有自有的高效率框架,在需要的地方合理的去使用這些開源技術(shù)。
LiveVideoStack:搞多媒體開發(fā)需要學(xué)習(xí)大量的基礎(chǔ)知識,而且需要在實際工作中摸爬滾打。對于學(xué)習(xí)多媒體開發(fā),您有哪些建議?能否推薦一些多媒體開發(fā)相關(guān)的學(xué)習(xí)資料或書籍。
見良:學(xué)習(xí)多媒體主要靠實踐,比如可以閱讀一些開源項目的源代碼(比如FFmpeg,GStreamer等)并使用其做一些簡單的項目,如果參與到其開發(fā)中那就更好了。此外再接觸一些商業(yè)的多媒體框架,比如DirectShow, MediaFoudation, AVFoundation等等,這樣可以比較快速地了解多媒體的基本概念以及基本處理流程。
LiveVideoStack:您認為CTO的核心職責包括哪些?是否需要寫(或review)代碼呢?
見良:CTO主要確定公司的技術(shù)方向,構(gòu)建公司的技術(shù)體系,為公司的戰(zhàn)略提供強有力的技術(shù)支撐。CTO在每個階段的工作重點是不一樣的,是有必要寫代碼的。
LiveVideoStack:您主導(dǎo)開發(fā)了敦煌視覺效果合成系統(tǒng),能否簡單介紹下這個產(chǎn)品。在研發(fā)的過程中,有哪些難忘的故事?
見良:敦煌視覺效果合成系統(tǒng)是國內(nèi)第一款后期合成包裝系統(tǒng),這個產(chǎn)品主要面向電影,電視劇廣告的后期合成包裝,它涉及顏色校正,摳像,遮罩,跟蹤,三維攝像機反求等等非常復(fù)雜的算法,它的定位是頂級的視音頻合成系統(tǒng),也是獲得國家科技進步一等獎項目的技術(shù)核心部分。最難忘的是當時我們做算法就封閉開發(fā)了一年多,算法效果出來后我們請了國內(nèi)頂尖的做后期合成的專業(yè)人士來幫我們看這些效果是否可以用于高端視音頻制作了,經(jīng)過專家三天的詳細測評對比給了相當滿意的結(jié)果,這樣我們有堅定的信念去軟件架構(gòu)的搭建和應(yīng)用軟件的開發(fā)了
LiveVideoStack:能否介紹下美攝SDK這個產(chǎn)品,他有什么技術(shù)特點?
? ??
見良:兼容性,高效率,高質(zhì)量,可擴展性。
LiveVideoStack:音視頻領(lǐng)域還有哪些學(xué)界、工業(yè)界公認的難點?未來幾年,哪些難點有可能取得突破?
? ? ?
見良:智能的剪輯合成是困難的,未來通過機器學(xué)習(xí)的技術(shù)結(jié)合傳統(tǒng)計算機圖形學(xué)圖像處理能有效降低視頻制作的難度,同時提供有趣的視頻玩法出來。
總結(jié)
以上是生活随笔為你收集整理的见良:学习多媒体主要靠实践的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MSU发布2018年视频压缩评比报告
- 下一篇: LiveVideoStackCon讲师热