音视频技术开发周刊 | 192
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨。
新聞投稿:contribute@livevideostack.com。
HYPER: 充滿挑戰(zhàn)和成就的十年
自從Flash Player和Adobe Media Server多年以來一直跟隨我的人知道,在過去的15年中,我一直在忙于開發(fā)編碼器,播放器以及通用軟件體系結(jié)構(gòu),以實(shí)現(xiàn),增強(qiáng)和優(yōu)化大規(guī)模的視頻流。特別是在2021年,我要慶祝Hyper成立10周年,它也是這些成就之一,但讓我們從頭開始。
https://sonnati.wordpress.com/2021/03/30/hyper-a-decade-of-challenges-and-achievements/
Chrome 91新特性:手寫識(shí)別,WebXR平面檢測(cè)等
除非另有說明,否則以下描述的更改適用于Android,Chrome OS,Linux,macOS和Windows的最新Chrome beta通道版本。通過提供的鏈接或ChromeStatus.com上的列表,詳細(xì)了解此處列出的功能。Chrome 91將于2021年4月22日發(fā)布Beta版。
https://blog.chromium.org/2021/04/chrome-91-handwriting-recognition-webxr.html
華為云薛浩:走進(jìn)視頻“新時(shí)代”
隨著社會(huì)發(fā)展,視頻產(chǎn)業(yè)的發(fā)展也在迅速加快。視頻“新時(shí)代”帶來了新的機(jī)遇、也有新的挑戰(zhàn)。本次分享我們邀請(qǐng)到了華為云的薛浩先生,他向我們分享了華為云在面對(duì)視頻“新時(shí)代”的想法、投入及對(duì)產(chǎn)業(yè)界的看法。
淘系音視頻技術(shù)的演進(jìn)之路
隨著社會(huì)的發(fā)展,音視頻技術(shù)在電商運(yùn)營(yíng)中占據(jù)的位置越來越重要。不僅時(shí)代在進(jìn)步,音視頻技術(shù)也在前進(jìn)。本次LiveVideoStackCon 2021 上海站中,我們邀請(qǐng)到了淘系技術(shù)的陳穎老師為我們分享淘系內(nèi)容電商技術(shù)的過去、現(xiàn)在及其未來展望。
音視頻技術(shù)在云會(huì)議場(chǎng)景的拓展和未來
音視頻技術(shù)不斷發(fā)展,云會(huì)議場(chǎng)景在人們生活中也越來越常見。那么如何將云會(huì)議場(chǎng)景中的音視頻技術(shù)不斷提升改善?本次分享會(huì)我們邀請(qǐng)到了來自騰訊會(huì)議的商世東先生,他將與我們分享云視頻技術(shù)在騰訊會(huì)議里面的一些領(lǐng)域使用情況和他們對(duì)未來的一些思考。
阿里云窄帶高清的演進(jìn)與思考
窄帶高清實(shí)際上是一套以人眼的主觀感受最優(yōu)為基準(zhǔn)的視頻編碼技術(shù),研究的是在帶寬受限的情況下,如何追求最佳的視覺感受。今天我們請(qǐng)到了來自阿里云智能視頻云的王豪老師,他將與我們分享窄帶高清是什么、現(xiàn)在的窄帶高清主要關(guān)注哪些內(nèi)容、以及未來的布局是什么。
目標(biāo)檢測(cè),FFmpeg中第一個(gè)基于深度學(xué)習(xí)模型的視頻分析功能
2021年4月,終于把目標(biāo)檢測(cè)(object detection)加到FFmpeg upstream了,有maintainer身份加持,還是交互了將近100封郵件,花了兩個(gè)多月才完成upstream,這還不包括前面的開發(fā)時(shí)間,當(dāng)然,這么多的交流也對(duì)最后的代碼有很大的提升。
遮擋視頻實(shí)例分割,牛津阿里最新開源OVIS數(shù)據(jù)集!
當(dāng)場(chǎng)景中存在嚴(yán)重的遮擋時(shí),作者的視頻理解系統(tǒng)能感知對(duì)象嗎?為了回答這個(gè)問題,作者收集了一個(gè)名為OVIS的大規(guī)模數(shù)據(jù)集,用于遮擋視頻實(shí)例分割,即同時(shí)檢測(cè)、分割和跟蹤遮擋場(chǎng)景中的實(shí)例。OVIS由來自25個(gè)語義類別的296k高質(zhì)量實(shí)例掩碼組成,對(duì)象遮擋通常發(fā)生在這些類別中。
5G+邊緣計(jì)算,對(duì)于VR移動(dòng)電競(jìng)游戲來說意味著什么?
這是一個(gè)5G+邊緣計(jì)算意義的問題。其實(shí)對(duì)VR游戲(特別是電競(jìng)游戲)這類大流量/低延遲的應(yīng)用服務(wù)來說,大多數(shù)人第一時(shí)間想到的優(yōu)點(diǎn)會(huì)是高達(dá)1Gbps/s的數(shù)據(jù)傳輸速度,雖然事實(shí)確實(shí)如此,但并不是全部。
從WinZips到Cat GIF,Jacob Ziv的算法提供了數(shù)十年的壓縮能力
無損壓縮的先驅(qū)者獲得了2021年IEEE榮譽(yù)勛章。
https://spectrum.ieee.org/geek-life/profiles/from-winzips-to-cat-gifs-jacob-zivs-algorithms-have-powered-decades-of-compression
會(huì)議更流暢,表情更生動(dòng)!視頻生成編碼 VS 國(guó)際最新 VVC 標(biāo)準(zhǔn)
阿里云視頻云的標(biāo)準(zhǔn)與實(shí)現(xiàn)團(tuán)隊(duì)與香港城市大學(xué)聯(lián)合開發(fā)了基于 AI 生成的人臉視頻壓縮體系,相比于 VVC 標(biāo)準(zhǔn),兩者質(zhì)量相當(dāng)時(shí)可以取得 40%-65% 的碼率節(jié)省,旨在用最前沿的技術(shù),普惠視頻通話、視頻會(huì)議、在線教育等重要應(yīng)用領(lǐng)域。
評(píng)估使用SL-HDR1壓縮HDR的比特率
本文是來自VidTrans 21的演講,演講者是來自Cobalt Digital的Ciro Noronha,演講的主要內(nèi)容是評(píng)估使用SL-HDR1壓縮HDR的比特率。
評(píng)估廣播工作流程中視頻質(zhì)量的一個(gè)新范例
本次演講來源于2021年3月1日視頻服務(wù)論壇(VSF)的年度會(huì)議VidTrans,演講者M(jìn)argaret H Pinson來自國(guó)家電信和信息管理局(NTIA)。
Facebook基于Transformer的目標(biāo)檢測(cè) (DETR)的詳細(xì)指南
DEtection TRansformer (DETR)是Facebook研究團(tuán)隊(duì)巧妙地利用了Transformer 架構(gòu)開發(fā)的一個(gè)目標(biāo)檢測(cè)模型。在這篇文章中,我將通過分析DETR架構(gòu)的內(nèi)部工作方式來幫助提供一些關(guān)于它的直覺。
Twitter在Android和iOS上推出4K圖像支持
在公司于3月進(jìn)行測(cè)試之后,iOS和Android上的Twitter用戶現(xiàn)在都可以以4K上傳和查看圖像。為此,你所需要做的就是導(dǎo)航到設(shè)置菜單的“數(shù)據(jù)使用情況”部分,并更新高品質(zhì)圖像選項(xiàng)上的選擇。
https://www.engadget.com/twitter-4k-image-uploads-mobile-171149369.html
VR/AR/MR/XR 概念辨析
虛擬現(xiàn)實(shí)(Virtual Reality,VR)、增強(qiáng)現(xiàn)實(shí)(Augmented Reality,AR)等業(yè)務(wù)以其三維化、自然交互、空間計(jì)算等完全不同于當(dāng)前移動(dòng)互聯(lián)網(wǎng)的特性,被認(rèn)為將是下一代通用計(jì)算平臺(tái)。
LiveVideoStack主編觀察03 /大會(huì)見聞&思考
時(shí)隔兩年,4月16-17日,LiveVideoStackCon再次來到上海。也許是疫情讓大家彼此疏離了太久,因此,本次LiveVideoStackCon是有史以來上海站參會(huì)者數(shù)量最多的一次,本周我就來聊聊在這次大會(huì)上的見聞與思考。
后疫情時(shí)代音視頻行業(yè)思考LVSCon2021SH
作為一個(gè)參與了3次LVSCon大會(huì)的從業(yè)者(2020年因疫情原因,遺憾未能參與),對(duì)于本次在上海舉辦的LVSCon,感受到了與以往完全不一樣的氛圍。
2021上海LVS音視頻大會(huì)觀感和思考
其實(shí)音視頻這個(gè)領(lǐng)域非常的窄,很長(zhǎng)一段時(shí)間都沒有屬于自己專一和垂直的社區(qū)。最近幾年,隨著國(guó)外的FFmpeg和WebRTC的普及,國(guó)內(nèi)SRS和LVS在這個(gè)領(lǐng)域也變得越來越活躍。從2017年LVS組織第一次線下大型活動(dòng)到現(xiàn)在已經(jīng)五個(gè)年頭了,感謝LVS提供的平臺(tái)和機(jī)會(huì),讓大家每年有一兩次線下面對(duì)面交流機(jī)會(huì),也感謝這個(gè)時(shí)代對(duì)音視頻技術(shù)的持續(xù)推動(dòng)。
一個(gè) RTC 開發(fā)者在 LVS 音視頻技術(shù)大會(huì)的見聞與思考
兩天的大會(huì),全程一場(chǎng)緊接著一場(chǎng)的聽下來,不知道其他參會(huì)者感覺如何,反正我是挺累的。當(dāng)然,不能白累,收獲是必須的。下面我就分享下自己在 LVS 音視頻技術(shù)大會(huì)的一些收獲。
小提示:鏈接跳轉(zhuǎn)僅支持公眾號(hào)相關(guān)鏈接
插圖源自Pexels
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 192的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Vulkan Video实现GPU加速视
- 下一篇: 体验共享——技术实现瓶颈与突破