2021 音视频技术趋势不完全预测
The Economist (經(jīng)濟學(xué)人)在 The World in 2021 特別刊的編者序中寫到:“21?是一個與好運、冒險、機遇和擲骰子有關(guān)的數(shù)字 —— 它是一個標(biāo)準(zhǔn)骰子六面數(shù)字相加的總和(即前6個自然數(shù)——1 + 2 + 3 + 4 + 5 + 6 = 21——的和,也稱三角形數(shù))”。
維基百科又告訴我們,21 是庫德族旗幟中太陽光線的數(shù)量;是化學(xué)元素鈧的原子序數(shù);是斐波那契數(shù)列的最小非平凡數(shù);是用于 FTP 連接的標(biāo)準(zhǔn) TCP/IP 端口號。
此外,21 克還被認為是靈魂的重量。
所有這一切都離奇地應(yīng)和著這個不同尋常的年份 ——?2021,它帶著巨大的不確定性由遠及近—— 風(fēng)險沒有變小,但吹來了新的風(fēng)口,帶來了新的需求 —— 需求刺激著市場,出現(xiàn)了新的商機 ——?而技術(shù)本身,也由此開始加速迭代。
以下是 LiveVideoStack 最為關(guān)注的2021年(不完全)音視頻技術(shù)趨勢,也是LiveVideoStackCon 2021 上海站?——??新技術(shù),新機會 —— 聚焦的技術(shù)熱點。
關(guān)于邊緣計算,大部分人都不會否認它代表的未來,不僅因為集中式架構(gòu)面臨巨大的網(wǎng)絡(luò)成本,也因為用戶對時延愈發(fā)苛刻的需求。但要實現(xiàn)邊緣與中心協(xié)調(diào)的架構(gòu),需要時間和平臺方更多的投入 —— 就像AWS等云廠商在云計算初期面臨的挑戰(zhàn)一樣。
5G等基礎(chǔ)設(shè)施的建設(shè)將為邊緣計算打下關(guān)鍵的基礎(chǔ);關(guān)鍵應(yīng)用場景和殺手級應(yīng)用也將真正成為驅(qū)動邊緣計算發(fā)展的一股力量:如工業(yè)領(lǐng)域?qū)W(wǎng)絡(luò)時延的需求,云游戲?qū)A窟吘売嬎愎?jié)點的需求,超高清或VR視頻對超高帶寬的需求等等。
本次 LiveVideoStackCon 2021 上海站,將有更多邊緣計算相關(guān)的當(dāng)下業(yè)務(wù)場景及其未來應(yīng)用實例的技術(shù)分享。
實時音視頻通訊、云游戲、超高清視頻、VR/AR等應(yīng)用與場景的落地和商業(yè)化,都離不開端到端低延時的支持。而想要實現(xiàn)超低延時,不僅體現(xiàn)在終端設(shè)備的迭代升級、硬件加速以及底層Codec的不斷優(yōu)化,網(wǎng)絡(luò)架構(gòu)的升級、傳輸協(xié)議的優(yōu)化、鏈路策略的選擇等等都是至關(guān)重要的因素。
5G、8K 時代的到來(或即將到來),不僅帶來了傳輸帶寬、終端運算能力的提升,VR/AR、沉浸式、高自由度視頻技術(shù)等也得以快速發(fā)展。從高幀率到高分辨率,再到如今的 HDR,我們不斷追求最極致的畫質(zhì),這又進一步帶來了全新的真實現(xiàn)場感和交互式體驗。目前來看,AR/VR 在許多教育、培訓(xùn)場景下已經(jīng)得到驗證,并且正在向泛娛樂領(lǐng)域過渡,也許在未來 1-2 年內(nèi),VR 效果的短視頻觀看體驗就會得到普及。
如今,似乎每一個軟件投資和產(chǎn)品公關(guān)都要提及“無代碼”平臺或功能。與云計算類似,無代碼本身也不是一個固有類別,而是用戶與軟件工具交互方式的轉(zhuǎn)變。就像PC普及了軟件的使用、API 普及了軟件連接、云普及了軟件的購買和部署一樣,無代碼或許能夠通過普及特定的技術(shù)技能來引領(lǐng)下一波企業(yè)創(chuàng)新。?
快手與聲網(wǎng)等互聯(lián)網(wǎng)公司也都成立了專門的團隊進行“無代碼/低代碼”項目的研發(fā)。
“低代碼(Low Code)”和“無代碼(No Code)”經(jīng)常被互換地提到,但它們的概念卻截然不同。低代碼和無代碼都抽象了底層代碼及其技術(shù)性,低代碼旨在通過有限的抽象提高開發(fā)人員的效率,而無代碼則想通過更強大的抽象來增強開發(fā)人員和非技術(shù)人員的能力。
根據(jù)Forrester Research, 截至2020年,84%的企業(yè)已經(jīng)開始使用低代碼/無代碼技術(shù),Gartner預(yù)測,到2024年,低代碼/無代碼將占到所有應(yīng)用程序開發(fā)的65%。
一直以來,與音頻相關(guān)的技術(shù)(無論硬件軟件)分享都較為小眾,但人耳對聲音品質(zhì)的追求卻越來越高:無論是RTC場景下的 AI 降噪、回音消除,還是針對 TWS 耳機的數(shù)字信號處理以及更加未來向的音頻 VR 技術(shù),都在越來越多地受到關(guān)注與重視。目前為止,針對 RTC 場景的音頻算法與傳輸,還沒有一個通用的解決方案與評測標(biāo)準(zhǔn),但與此同時,我們也看到了各家在音頻技術(shù)上越來越多的投入。
在本次上海站的“音頻新體驗”專場,我們首次將音頻專題擴展為全天 7 個場次,分為硬件與軟件兩個半天的場次,內(nèi)容涉及云視頻會議的音頻體驗、基于深度學(xué)習(xí)的噪聲控制、手機播放端及硬件系統(tǒng)的音頻算法、支持多平臺多語言的自動口型生成項目,以及后續(xù)(春節(jié)后)將會陸續(xù)確定的更多講師與分享議題(敬請期待)。
隨著視頻內(nèi)容需求的飛速增長,其在網(wǎng)絡(luò)上的傳輸量也越來越大——動輒幾十、上百兆的碼率,這對視頻編解碼算力提出了更高的要求。對比 GPU、FPGA、ASIC 等硬件方案,從延時控制及能耗等方面觀察,ASIC 加速看上去是更好的選擇,但定制化特性又使得它的前期投入不容小覷。因此,GPU 和FPGA?在特定場景下依舊保持著不可或缺的優(yōu)勢與地位。
伴隨多媒體技術(shù)的日新月異,內(nèi)容形式與需求也在不斷變化與增長,抖音、快手、B站等視頻平臺的崛起,極大滿足了人們的精神需求,然而內(nèi)容生產(chǎn)往往受限于創(chuàng)作者的精力與想象力,難以高頻度持續(xù)供給優(yōu)質(zhì)內(nèi)容。從Google的?url2video?到百度的 VidPress,從NLP、TTS到網(wǎng)易AI生成歌曲《醒來》,多媒體技術(shù)革新正將自動化智能生產(chǎn)推向人們的日常生活,并提供了更多元、更有趣的音頻與視頻內(nèi)容。與此同時,未來多媒體消費的不斷升級,也將推動自動化生產(chǎn)工具迎來更加快速的發(fā)展周期與更優(yōu)質(zhì)的內(nèi)容體驗。
低時延流式數(shù)據(jù)處理框架、嵌入式軟件媒體處理框架、OWT、FFmpeg、Gstreamer、SRS、WebRTC、VVC、AV1......
No need to?say?more.
最后借用微幀科技的聯(lián)合創(chuàng)始人&CEO 朱政老師為 LiveVideoStackCon 2021 上海站? “技術(shù)商業(yè)策略” 圓桌所寫的專題描述做結(jié)尾:
“疫情的風(fēng)暴席卷全球,改變著人們的生產(chǎn)和生活方式。許多公司在艱難中尋求發(fā)展,也有許多公司在蓬勃中站上浪尖。視頻的大時代在加速到來,多媒體新技術(shù)、新產(chǎn)品、新應(yīng)用不斷迸發(fā)。浪淘風(fēng)簸,如何在激烈的挑戰(zhàn)中尋找機會?吹盡狂沙,如何將技術(shù)轉(zhuǎn)換為商業(yè)價值?”
2021, LiveVideoStack 希望陪你一同不斷前行,尋找答案。
LiveVideoStackCon 2021 Shanghai
這個世界沒有“準(zhǔn)備好”這一說
機會和技術(shù)不會主動敲開你的門
LiveVideoStackCon 2021?上海站
北京時間:2021年4月16日-4月17日
點擊【閱讀原文】了解大會詳情
總結(jié)
以上是生活随笔為你收集整理的2021 音视频技术趋势不完全预测的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Netflix 付费用户达2亿、苹果VR
- 下一篇: 【线上分享】音频多麦盲分技术