视频云的全景蓝图,想象力的允诺之地
視頻有邊界嗎?
在過去,答案是肯定的。
那時(shí)視頻可能會(huì)被鎖在電視機(jī)里,關(guān)在大銀幕中。可隨著越來越多的硬件設(shè)備進(jìn)入家庭,隨著網(wǎng)絡(luò)技術(shù)層層變革,隨著計(jì)算能力持續(xù)升級(jí),隨著視頻的編解碼能力不斷提升…… 視頻,已然成為一種新的信息載體,而作為新時(shí)代大視頻產(chǎn)業(yè)的底座,視頻云就被賦予了可以變革社會(huì)的關(guān)鍵使命。
7 月 10 日,“Imagine”——2021 阿里云視頻云全景創(chuàng)新峰會(huì)暨全球視頻云創(chuàng)新挑戰(zhàn)賽決賽頒獎(jiǎng)典禮在北京舉辦。關(guān)于視頻未來的發(fā)展前景,關(guān)于視頻云的全景藍(lán)圖,關(guān)于學(xué)術(shù)界、藝術(shù)界、創(chuàng)投界多界聯(lián)動(dòng),關(guān)于開發(fā)者與音視頻技術(shù)領(lǐng)域的多維探索,通過這場峰會(huì)的觀點(diǎn)碰撞,我們似乎已然能夠窺到未來視頻發(fā)展的康莊之路。
從視頻化到超視頻化,視頻云角色加碼
在前幾年,視頻化一詞被越來越多的提及。那么什么是視頻化?
簡單來講,就是信息的傳遞逐漸加入了視頻作為載體。由于視頻生產(chǎn)門檻持續(xù)的降低,用戶接受度不斷提高,用戶使用時(shí)長也在不斷增加,內(nèi)容全視頻化時(shí)代已然到來。與此同時(shí),視頻不僅僅在消費(fèi)領(lǐng)域大放異彩,在教育、會(huì)議、醫(yī)療、金融等各行各業(yè)也在衍生出新的需求。
用戶花在視頻上的整體時(shí)間消耗明顯在增加,整個(gè)社會(huì)基于視頻在各種各樣的業(yè)務(wù)場景中的交互也上升明顯。“內(nèi)容在更多的向視頻演進(jìn),交互的形式更加多樣,相比以前的視頻化來講,這是一個(gè)超視頻化時(shí)代。” 阿里巴巴研究員、阿里云智能視頻云負(fù)責(zé)人林昊如此定義當(dāng)前的這些變化。
想要定義一個(gè)時(shí)代,就需要了解這個(gè)時(shí)代。林昊解釋稱超視頻化時(shí)代有五大特點(diǎn),超內(nèi)容,超交互、超鏈接、超語言能力及超未來圖景。解析來看,其意味著視頻的形式持續(xù)演進(jìn),交互更加豐富,其傳播跨越了語言限制,并且還能夠以 AR、VR 等途徑影響到大眾的日常。
那么超視頻化的時(shí)代是怎樣到來的呢?林昊認(rèn)為 5G 起到了重要的推動(dòng)作用,5G 的大帶寬推動(dòng)了 AI 與 IoT 發(fā)展為智聯(lián)網(wǎng);5G 激活了超高清視頻與 VR/AR,使得網(wǎng)絡(luò)峰值速率達(dá)到了 20Gbit/s,無線接口延時(shí) 1ms,分辨率顯著提升;更為重要的,5G 開拓了數(shù)字內(nèi)容的新業(yè)態(tài),無論是數(shù)字游戲、互動(dòng)娛樂、影視動(dòng)漫、立體影像還是數(shù)字表演等,視頻的表現(xiàn)能力和形式都得到了極大的豐富。
更為關(guān)鍵的還在于,云 + 視頻形成了場景革新的催化劑,讓虛實(shí)結(jié)合成為了可能。云邊端一體化協(xié)同讓邊緣算力上移,云端算力下沉,降低了處理壓力和時(shí)延問題;而云端一體化的音視頻技術(shù)使得雙端體驗(yàn)一致成為可能;AI 技術(shù)發(fā)展后實(shí)現(xiàn)了視頻全鏈路的賦能,智能化顛覆了以往的內(nèi)容生產(chǎn)方式;同時(shí),混合現(xiàn)實(shí)技術(shù)也突破了內(nèi)容和交互的新形態(tài),使得物理世界和數(shù)字世界的最后一道壁壘被打破鏈接起來,讓視頻這一載體擁有了更多的可能。
喬布斯說過,“在較低的帶寬下,人們傳遞的是信息,更高的帶寬將用來傳遞情感。” 超視頻化時(shí)代的誕生不僅僅是因?yàn)閹挼奶嵘?#xff0c;還因?yàn)榧夹g(shù)的演進(jìn)。
技術(shù)演進(jìn)則分為了兩大方向,即內(nèi)容的演進(jìn)和交互的演進(jìn)。內(nèi)容的演進(jìn)路徑遵循更大密度、更多維度、更多感官、拓?fù)淇臻g四大特征,其具體表現(xiàn)也就形成了從文字、到圖像、影音、直播短視頻、資訊及知識(shí)的視頻化,乃至全場景內(nèi)容視頻化,最終形成沉浸式內(nèi)容形態(tài)。交互的演進(jìn)則遵循了多端鏈接、多人共享、打破空間、虛實(shí)無縫融合的特征,演進(jìn)路徑就形成了從線下、線上、交互全場景線上化到沉浸式交互的過程。
由此不難發(fā)現(xiàn),沉浸式交互和內(nèi)容形態(tài)將會(huì)是我們能夠探知的真正未來。“信息將會(huì)從一個(gè)交互對象,自然地傳遞到另一個(gè)交互對象。而數(shù)字將與物理共存并增強(qiáng)。”
像《頭號(hào)玩家》一樣的交互方式絕非天方夜譚。當(dāng)然,在一切想象力的背后都是技術(shù)的深度挖掘,視頻的背后不會(huì)是對 AI、數(shù)據(jù)、編解碼等單點(diǎn)技術(shù)的升級(jí),而是要求以視頻云為基礎(chǔ)的整個(gè)技術(shù)體系的打造。視頻云不僅僅是云端的技術(shù),還要在視頻整體技術(shù)上不斷演進(jìn),不管是三維化還是全息化,都要不斷的演進(jìn)和布局,最終讓視頻與場景有更多結(jié)合,從而實(shí)現(xiàn)數(shù)智化音視頻賦能的 “云上創(chuàng)新,價(jià)值創(chuàng)造”。
大視頻產(chǎn)業(yè)的底座,視頻云的行業(yè)演進(jìn)
伴隨超視頻化發(fā)展,互聯(lián)網(wǎng)也在發(fā)展。而在評(píng)估某一行業(yè)的價(jià)值時(shí),已經(jīng)不再是用設(shè)備數(shù),而是時(shí)間數(shù)。當(dāng)互聯(lián)網(wǎng)各個(gè)領(lǐng)域的紅利已經(jīng)近乎枯竭之時(shí),視頻相關(guān)領(lǐng)域卻在去年表現(xiàn)出巨大的紅利。并且艾瑞研究院副總經(jīng)理徐樊磊表示,這一紅利還將持續(xù)下去。
從行業(yè)發(fā)展的角度來看,現(xiàn)階段的大視頻產(chǎn)業(yè)具有碎片化、去中心化、高清化、實(shí)時(shí)性等一系列的特點(diǎn),也就是說在需求端大家對于視頻的追求越發(fā)趨于 “短、頻、快”,追求極致畫質(zhì)體驗(yàn),需要實(shí)時(shí)音視頻,實(shí)時(shí)交互重塑視頻應(yīng)用價(jià)值,從而覆蓋到金融服務(wù)、醫(yī)療、公共事業(yè)、社交、教育、咨詢等諸多行業(yè)。
而如果我們把視角抬高,縱覽人類歷史當(dāng)中信息傳播的歷程,那么視頻在其中扮演的角色也十分重要。最初,人類的溝通更多的是肢體語言,其對體力要求很高且容易歧義;隨后,人類有了語言,其不會(huì)有體力問題卻會(huì)被空間時(shí)間束縛,且很難傳承下去;后來我們有了文字,傳承千年已然無憂,但是文字天生的門檻和信息豐富度的缺乏促使視頻的出現(xiàn)。而視頻也在持續(xù)演進(jìn),從最初的電視,到離線的播放器視頻,再到現(xiàn)在的實(shí)時(shí)音視頻以及互動(dòng)視頻。
而視頻依然不是完美的,其主要問題有兩點(diǎn),第一是視頻的線性問題,其雖然可以快進(jìn)到某個(gè)地方卻無法實(shí)現(xiàn)全局縱覽;第二則是修改相比文字較慢,難度也更高。而基于這些問題,行業(yè)會(huì)越來越多的來與視頻進(jìn)行結(jié)合。也就是說視頻已經(jīng)不再是行業(yè),而是一種底層的基礎(chǔ)能力,基于視頻云打造的視頻應(yīng)用會(huì)成為必選項(xiàng)。視頻成為必選項(xiàng),因此可以說,“視頻云是新時(shí)代大視頻產(chǎn)業(yè)的底座”。
行業(yè)與視頻的深度結(jié)合其影響絕不僅僅是產(chǎn)品,很多行業(yè)的格局因此而改變。但是由于行業(yè)的復(fù)雜性存在,其對于視頻能力的訴求各不相同卻又有一定的共同之處。首先便是要求易于集成、易于計(jì)量,其需要以更低的成本、更彈性的擴(kuò)縮容以實(shí)現(xiàn)云上的嘗試,能夠敏捷試錯(cuò)快速投入生產(chǎn)。
因此,視頻云需要在生產(chǎn)、處理、傳輸、消費(fèi)等不同環(huán)節(jié)提供不同的解決方案和流程加持。除了視頻本身被云服務(wù)深度和分工細(xì)化之外,其還能夠大幅降低制作高質(zhì)量、有價(jià)值視頻的門檻。
這一過程中云服務(wù)對視頻的加持極為重要,在視頻生產(chǎn)環(huán)節(jié),視頻云能夠提供智能化的內(nèi)容處理能力,大幅提高創(chuàng)作效率和實(shí)現(xiàn)高效的媒資管理。在處理環(huán)節(jié),視頻云通過視頻處理和智能編碼,達(dá)到成本和畫質(zhì)的最優(yōu)平衡。在傳輸環(huán)節(jié),視頻云基于 CDN 智能加速,云邊端協(xié)同,降低傳輸時(shí)延和節(jié)省帶寬成本。在最終的消費(fèi)環(huán)節(jié),視頻云還能提供美顏、美聲、沉浸式交互等多元化玩法豐富用戶體驗(yàn)。
視頻云在結(jié)合了行業(yè)之后自身也在持續(xù)的演進(jìn)。現(xiàn)階段視頻云雖然主要集中在互聯(lián)網(wǎng)和泛娛樂領(lǐng)域中,但其已然具備了不同環(huán)節(jié)中提供支持的能力,能夠在各個(gè)行業(yè)中持續(xù)深度演進(jìn)發(fā)展;同時(shí),視頻云解決方案也給了用戶更多選擇,無論是應(yīng)用級(jí)能力,還是行業(yè)性通用型平臺(tái)企業(yè),不同維度不同用戶,能夠有不同的答案。
此外,視頻云在技術(shù)層面依然在追求極致,其雖然并未真正成熟,去解決高清化、實(shí)時(shí)化和互動(dòng)性的問題,但是軟件定義一切的理念正在協(xié)同硬件處理如路由器、存儲(chǔ)、計(jì)算等諸多環(huán)節(jié);同時(shí),低代碼開發(fā)也在大量的視頻云及視頻產(chǎn)業(yè)中出現(xiàn),其可以讓從業(yè)者更快速、更敏捷的調(diào)用功能,提升易用性,實(shí)現(xiàn)易調(diào)用、易集成。
未來,基于視頻云有可能會(huì)打造更多的創(chuàng)新,其能夠?yàn)橛脩籼峁└嗟逆溄?#xff0c;更低的門檻,展現(xiàn)更普惠的能量。視頻云這種技術(shù)對于視頻整體行業(yè)及大視頻產(chǎn)業(yè)而言,就是成為了一個(gè)底座功能。
視頻云的可持續(xù)發(fā)展,技術(shù)的難點(diǎn)與突破
視頻云作為產(chǎn)業(yè)底座,其一大特質(zhì)便是兼容并包。尤其是當(dāng)下,用戶對于視頻互動(dòng)性、呈現(xiàn)方式和沉浸式體驗(yàn)需求增加,AI 的深度融入將會(huì)成為視頻云及視頻產(chǎn)業(yè)創(chuàng)新的關(guān)鍵。當(dāng)視頻云在社交、娛樂、教育等領(lǐng)域開荒拓土之時(shí),深度學(xué)習(xí)也在圖像、語音、語言、大數(shù)據(jù)特征提取等多個(gè)方面持續(xù)發(fā)揮出巨大價(jià)值。可以說,未來視頻云技術(shù)的突破,一定程度上將由基于深度學(xué)習(xí)的人工智能所驅(qū)動(dòng)。
在活動(dòng)最后的圓桌論壇中,中國科學(xué)院計(jì)算技術(shù)研究所智能信息處理實(shí)驗(yàn)室研究員王樹徽則表示,深度學(xué)習(xí)時(shí)代帶來了第三次人工智能的興起,此次興起主要以應(yīng)用為目的,使得深度學(xué)習(xí)技術(shù)在很多任務(wù)有著良好效果,但其內(nèi)核卻存在問題。因此,想要實(shí)現(xiàn)視頻技術(shù)的突破,從深度學(xué)習(xí)內(nèi)在機(jī)理方面應(yīng)當(dāng)解決三大技術(shù)問題。
- 第一,現(xiàn)有的深度學(xué)習(xí)太過依賴數(shù)據(jù),其對數(shù)據(jù)的處理性能和對知識(shí)的利用是不夠的,所以基于這個(gè)考慮做網(wǎng)絡(luò)多模態(tài)跨媒體數(shù)據(jù)的知識(shí)構(gòu)建將會(huì)是未來的一大重要發(fā)展方向;
- 第二,要建好知識(shí)庫,來支撐機(jī)器系統(tǒng)的推理工作,從而讓機(jī)器能夠?qū)θ我獠煌瑏碓吹臄?shù)據(jù)形成舉一反三的推理能力。
- 第三,早期的時(shí)候人對計(jì)算機(jī)來說是不對等的,比如內(nèi)容創(chuàng)作時(shí)的人機(jī)協(xié)同。而在核心過程當(dāng)中,算法、系統(tǒng)和人之間是需要可信的,相互的信賴、協(xié)作及可信賴的推理將會(huì)是為了主要需要解決的問題。
當(dāng)然,AI 雖然有很多問題存在,卻也一樣在視頻之中發(fā)揮了重要作用。達(dá)摩院資深算法專家謝宣松表示,AI 在視頻方面發(fā)揮的作用主要分成兩類,第一類是最基礎(chǔ)的視頻或者圖像的理解,包括分類、打標(biāo)、檢測、分割等等;第二類與生產(chǎn)類相關(guān),比如生產(chǎn)、編輯、加工、擦除、擦入等等,其中還包括底層視覺相關(guān)的增強(qiáng)等。
視頻的圖像增強(qiáng)是 AI 的一大應(yīng)用方向,分辨率低時(shí)候視頻的信息量體驗(yàn)將會(huì)非常差,更生動(dòng)的色彩也會(huì)讓體驗(yàn)加分;而更加沉浸式的體驗(yàn)則是為了發(fā)展的方向。如果想要打造一款 4K 內(nèi)容,細(xì)節(jié)、流暢度和色彩比如是需要關(guān)注的重點(diǎn)。但是從技術(shù)角度來看以下三大問題必須要直接面對,第一,越是追求細(xì)節(jié)就越可能出現(xiàn)瑕疵,如何保證細(xì)節(jié)還原且能夠保證瑕疵控制,這是很核心的技術(shù);第二,算法的源頭是數(shù)據(jù),數(shù)據(jù)的源頭普遍有兩種,如低分辨率和高分辨率,低畫質(zhì)和高畫質(zhì),數(shù)據(jù)獲取最終往往需要用人工方式這種高成本的方式解決,這也是一大難點(diǎn);第三,在 AI 技術(shù)實(shí)踐當(dāng)中,把效果和效率平衡做好也是一個(gè)問題。
當(dāng)前 AI 也在朝著兩個(gè)維度走,一個(gè)是走向消費(fèi)者,為大家服務(wù),另一個(gè)則是深入到各行各業(yè)來降本提效,創(chuàng)造各種各樣的機(jī)會(huì)。
當(dāng)然,驅(qū)動(dòng)創(chuàng)新和技術(shù)升級(jí)的,歸根結(jié)底依然是人。那么 AI 熱度已經(jīng)高漲很多年了,很多學(xué)校也開啟了 AI 相關(guān)人才與教育,但對于市場和行業(yè)而言,人才缺乏問題依然嚴(yán)重,那么人才都去哪里了呢?王樹徽表示,他帶過的研究生大多數(shù)都已經(jīng)加入了行業(yè)戰(zhàn)場,學(xué)校已經(jīng)給行業(yè)輸送了大量的人才,但是因?yàn)樾袠I(yè)發(fā)展實(shí)在太快,高水平人才本就稀少,不同實(shí)驗(yàn)室定位不同,也無法盲目擴(kuò)大規(guī)模。
同時(shí),實(shí)驗(yàn)室的研究是把問題從現(xiàn)實(shí)中剝離出來再通過數(shù)學(xué)的方法來解決問題的,可是企業(yè)對于學(xué)生的要求是不同的,他們會(huì)希望企業(yè)了解業(yè)務(wù)并用以實(shí)踐。從學(xué)術(shù)研究到業(yè)務(wù)應(yīng)用這本身就有很長的鏈條,學(xué)生難以實(shí)現(xiàn)即插即用。而意識(shí)到這一點(diǎn)的顯然不僅僅是學(xué)校,還有行業(yè)和企業(yè)。
今年阿里云聯(lián)手英特爾主辦、與優(yōu)酷戰(zhàn)略技術(shù)合作的全球視頻云創(chuàng)新挑戰(zhàn)賽在此次峰會(huì)上舉辦最終的頒獎(jiǎng)典禮。本屆大賽由天池平臺(tái)和阿里云視頻云承辦,聚焦于視頻云技術(shù)在全行業(yè)的應(yīng)用與創(chuàng)新領(lǐng)域,吸引了全球 23 個(gè)國家、4000 余支參賽戰(zhàn)隊(duì),大賽分為 “算法 “和” 創(chuàng)新應(yīng)用 “兩大賽道,充分發(fā)掘人才,鼓勵(lì)并期待參賽者激發(fā)未來更多的想象力。
此外,阿里云天池平臺(tái)在此次峰會(huì)上還發(fā)布了天池數(shù)據(jù)集開源計(jì)劃,涵蓋電商、金融、物流、醫(yī)療、能源等 60 多個(gè)有真實(shí)業(yè)務(wù)場景的產(chǎn)業(yè)稀缺數(shù)據(jù)集,希望通過開放真實(shí)的業(yè)務(wù)場景和數(shù)據(jù),與各界社會(huì)力量一道打造專業(yè)的科研大數(shù)據(jù)平臺(tái)。
視頻云的發(fā)展成為了時(shí)代的選擇,也變革了商業(yè)與社會(huì),化作大視頻產(chǎn)業(yè)的底座;視頻云技術(shù)可以充滿想象力,突破時(shí)間與空間,也能讓人與人的溝通更加無縫和愜意。
未來已來,全新的視頻化世界,你準(zhǔn)備好了嗎?
原文鏈接:https://developer.aliyun.com/article/785241?
版權(quán)聲明:本文內(nèi)容由阿里云實(shí)名注冊用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識(shí)產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權(quán)投訴表單進(jìn)行舉報(bào),一經(jīng)查實(shí),本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。 與50位技術(shù)專家面對面20年技術(shù)見證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的视频云的全景蓝图,想象力的允诺之地的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于边缘云的机器流量管理技术实战
- 下一篇: Flink + Iceberg + 对象