对话MPEG创始人Leonardo Chiariglione: MPEG精神将在MPAI中延续
翻譯/編輯:Alex
技術(shù)審校:李忠
Leonardo Chiariglione本人也審閱了采訪的中、英文版本,特此感謝。
Leonardo Chiariglione
人物對話
#001#
Leonardo Chiariglione(照片由Leonardo Chiariglione本人提供)
?
作為MPEG的創(chuàng)始人,Leonardo Chiariglione曾將MP3、DVD和數(shù)字電視帶進(jìn)了千家萬戶。他近期出版了第一本書:The history of MPEG and how it made digital media happen, 這本書講述了MPEG 32年的輝煌歷史,以及它如何通過標(biāo)準(zhǔn)化方法改變了通信的本質(zhì)。
在領(lǐng)導(dǎo)MPEG 32年之后,Leonardo Chiariglione去年宣布關(guān)閉MPEG,并創(chuàng)立了一個新的組織——MPAI(Moving Picture, Audio and Data Coding by Artificial Intelligence)。據(jù)他介紹,MPEG 的精神會在 MPAI 中得以延續(xù)。
最近Leonardo Chiariglione接受了LiveVideoStack的郵件采訪,在采訪中,我們和他一起討論了新書 、MPEG 和 MPAI。下面是整理的采訪稿。
LiveVideoStack:Chiariglione先生,非常感謝您接受采訪,您的新書Even the stars die: The history of MPEG and how it made digital media happen?已于暑期出版,您能告訴大家您為什么會寫這本書嗎?
Even the stars die: The history of MPEG and how it made digital media happen
?
Leonardo Chiariglione:毫無疑問, MPEG是一個傳奇故事——一個草根組織掀起了一場媒體數(shù)字化的革命。作為MPEG的創(chuàng)始人,并領(lǐng)導(dǎo)了這個組織32年,我認(rèn)為我有責(zé)任不讓這一偉大成就被世人遺忘,或者發(fā)展到更壞的地步——被毫無道德準(zhǔn)則的人利用達(dá)到自己不可告人的目的。
?
LiveVideoStack:您能說一個大家應(yīng)該讀這本書的理由嗎?
?
Leonardo Chiariglione:歷史不會簡單地重演,但歷史演進(jìn)的軌道卻十分相似。世界肯定不是33年前的世界,技術(shù)也不再是33年前的技術(shù)。但人類所遵循的模式卻驚人地一致。對于那些想要了解媒體數(shù)字化歷程的讀者,這本書是必讀之物。同樣,那些心有遠(yuǎn)大理想的人也能從MPEG獨特的故事中汲取靈感。
LiveVideoStack: 您去年辭去了MPEG主席一職,并宣布關(guān)閉MPEG,但MPEG卻并不同意您的說法,您和這個視頻標(biāo)準(zhǔn)組織之間究竟發(fā)生了什么?
Leonardo Chiariglione:首先我們必須就某些詞語的含義達(dá)成一致。1991年,當(dāng)蘇聯(lián)解體時,生活在該政權(quán)下的人民和土地消失了嗎?不,他們沒有。他們變成了俄羅斯聯(lián)邦、烏克蘭、哈薩克斯坦等。MPEG的消失正如蘇聯(lián)一樣,它已經(jīng)被那些令人興奮的組織名稱所替代,如WG 1、WG 2等。
?
我在1988年所創(chuàng)立的組織已經(jīng)不復(fù)存在,它已經(jīng)被一批其他組織所替代。
?
如果你說:“MPEG不同意”,你應(yīng)該告訴我你所指的MPEG是什么。
?
如果你問我:“您和這個視頻標(biāo)準(zhǔn)組織之間究竟發(fā)生了什么?”我會說:正如一個犯罪團伙劫持了飛機一樣,MPEG也被“劫持”了。這樣的事情,在《三國演義》所記載的封建時代里隨處可見,并依然在今天的ISO組織中延續(xù)。
?
如果你問我:“您和MPEG的人之間發(fā)生了什么?”我的答案是:除了“劫機者”,我和其他人絕對沒有任何矛盾。幾十年來,我同一起在MPEG中共事過的數(shù)千位同事保持著良好的關(guān)系。
LiveVideoStack: 對于MPEG,有什么令您感到后悔的事嗎?或者一些您本來想做,但沒有做成的事情?
?
Leonardo Chiariglione: 像MPEG這樣的組織已經(jīng)經(jīng)歷了數(shù)十年的磨礪,它本應(yīng)該繼續(xù)輝煌下去,未來有更多的數(shù)十年在等待著它。在第100次會議的慶祝活動中,我曾說過,如果100年后MPEG不復(fù)存在,那肯定是因為有人想要“殺死”它。沒想到一語成讖。
?
LiveVideoStack: 既然您已經(jīng)開始了您的新事業(yè)——MPAI, 那么您對MPAI有什么樣的期待?
?
Leonardo Chiariglione: MPAI并不能稱為新的事業(yè)。MPAI希望能在制定基于人工智能的數(shù)據(jù)編碼標(biāo)準(zhǔn)上扮演重要角色,如同曾經(jīng)的MPEG在基于數(shù)字化處理的媒體編碼上所扮演的角色一樣。這不僅僅是一個計劃,最近MPAI已經(jīng)發(fā)布了3個草案文件,正在征求社區(qū)意見,參見:?
https://mpai.community/standards/mpai-mmc/draft-standard/,
https://mpai.community/standards/mpai-cui/draft-standard/ 和?https://mpai.community/governance。
前兩個標(biāo)準(zhǔn)草案將于 9 月 30 日發(fā)布。在接下來的幾個月中,將發(fā)布更多標(biāo)準(zhǔn)。
?
LiveVideoStack: MPAI中正在進(jìn)行的標(biāo)準(zhǔn)有哪些?您能詳細(xì)說一下嗎?
?
Leonardo Chiariglione:?我來詳細(xì)說說。計劃今年10月發(fā)布的AI框架(MPAI-AIF)是基礎(chǔ)標(biāo)準(zhǔn),它是一個標(biāo)準(zhǔn)環(huán)境,其中可以執(zhí)行由基礎(chǔ)算子(被稱為AI模塊)構(gòu)成的工作流。AI工作流和AI模塊已經(jīng)經(jīng)過了安全、一致和性能方面的檢查,可以直接從MPAI商店中下載(參見https://mpai.community/governance)。一個編碼標(biāo)準(zhǔn)的實現(xiàn),其性能是通過可靠性、健壯性、可復(fù)制性和公平性來評估。
?
另一個標(biāo)準(zhǔn)是上文提到的多模態(tài)對話(MPAI-MMC),計劃9月份發(fā)布。MPAI-MMC的情感對話支持與由語音合成和人臉動畫所模擬的機器進(jìn)行視聽對話;多模態(tài)問答支持對所顯示對象請求信息。單向、雙向和一對多語音翻譯支持使用語音合成的會話翻譯,保留說話人的語音特征。
?
LiveVideoStack: 第一個標(biāo)準(zhǔn)將在什么時間發(fā)布?您認(rèn)為需要多長時間這些標(biāo)準(zhǔn)可以獲得大范圍的應(yīng)用?
?
Leonardo Chiariglione:9月30日將很有可能發(fā)布兩個標(biāo)準(zhǔn):MPAI-MMC 和 MPAI-CUI。后者包含一個被稱為“基于AI的公司業(yè)績預(yù)測”的用例。通過該用例,用戶可以在一個給定的預(yù)測范圍內(nèi)(如3或5年)評估某個公司的組織健康度、違約概率以及業(yè)務(wù)不可持續(xù)概率。
?
一些 MPAI 成員在標(biāo)準(zhǔn)發(fā)布后會立即實施。
?
LiveVideoStack: 您認(rèn)為EVC和AV1的發(fā)展會削弱VVC的專利限制嗎?
?
Leonardo Chiariglione:?我曾寫過不少文章,介紹MPEG所推動的優(yōu)秀技術(shù)是如何獲取報酬的正確實踐。但現(xiàn)狀卻不斷惡化,這需要被重新審視。我不知道未來情況是否會有所改善。我唯一知道的是,只有12%的互聯(lián)網(wǎng)視頻使用HEVC。人人都知道是誰造成今天這種失敗的局面。
?
LiveVideoStack: 基于AI的視頻編碼方法(端到端,多場景應(yīng)用)會是未來趨勢嗎?在實現(xiàn)過程中最大的挑戰(zhàn)是什么?(比如標(biāo)準(zhǔn)的缺失,硬件問題)
?
Leonardo Chiariglione: 毫無疑問,AI在未來視頻編解碼中肯定會發(fā)揮重要作用。但遺憾的是,決定使用哪種編碼方法的下一階段的研究,既不會基于技術(shù),也不會是商業(yè)價值或者用戶需求,而是基于支持過去視頻編碼標(biāo)準(zhǔn)的專利。
?
LiveVideoStack: 您認(rèn)為基于AI的編解碼器將很快超越傳統(tǒng)編碼器嗎?還是兩種編碼器將共存很長時間?
?
Leonardo Chiariglione:傳統(tǒng)的數(shù)據(jù)處理技術(shù)仍然會大顯身手,但在很多領(lǐng)域,它已經(jīng)走到了發(fā)展的盡頭。而人工智能,才剛剛開始。
?
幾天前,我發(fā)表了一篇文章(參見
https://blog.chiariglione.org/the-governance-of-the-mpai-ecosystem/)。
文中,我寫道:“如果一臺AI機器通過仔細(xì)訓(xùn)練后,可以發(fā)現(xiàn)某些特定的編碼模式比其他模式更通用,那么它將很可能會比人類按照概率論機制所推導(dǎo)的編碼模式取得更好的壓縮率。” AI可以像人類那樣根據(jù)經(jīng)驗解釋新事物,因此機器積累經(jīng)驗的能力必然會隨著處理和存儲能力的增加而增加。然而,不要指望AI視頻編碼將在短期內(nèi)超越傳統(tǒng)視頻編碼。技術(shù)雖然發(fā)展很快,但是對過去技術(shù)的投資如此巨大,新技術(shù)的部署必然需要長久的時間。
?
激動人心的未來就在眼前。
LiveVideoStack: 在中國,您是否發(fā)現(xiàn)了MPAI的機會?
?
Leonardo Chiariglione: MPAI中有幾位來自中國的成員,但是中國如此之大,所以我期待更多中國成員加入進(jìn)來。
掃描圖中二維碼或點擊閱讀原文
了解大會更多信息
喜歡我們的內(nèi)容就點個“在看”吧!
總結(jié)
以上是生活随笔為你收集整理的对话MPEG创始人Leonardo Chiariglione: MPEG精神将在MPAI中延续的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【今晚7点半】:华为云视频直播在各细分场
- 下一篇: MPAI正式启动端到端的AI编码标准