音视频技术开发周刊 | 170
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨。
新聞投稿:contribute@livevideostack.com。
傳輸網(wǎng)絡(luò)
實時5G實時視頻流必不可少的6個原因
正如最近在博客中詳細(xì)討論的那樣,以視頻為中心的社交活動,沉浸式娛樂,教育,遠(yuǎn)程醫(yī)療等方面的趨勢使網(wǎng)絡(luò)對實時視頻豐富的個人體驗的支持成為網(wǎng)絡(luò)空間新時代的特征。從分散的勞動力投入到視頻監(jiān)控,再到在工程設(shè)計,建筑,培訓(xùn),手術(shù)和其他方面的沉浸式協(xié)作,實時視頻傳輸也正在成為商業(yè)生活中各種應(yīng)用程序的重要組成部分。
https://www.red5pro.com/blog/6-reasons-real-time-5g-live-video-streaming-is-essential/
引入XDN(體驗交付網(wǎng)絡(luò))
互聯(lián)網(wǎng)上無處不在的視頻使我們進(jìn)入了一個過渡點,對實時視頻互動體驗的支持已開始定義在線參與的下一個時代。
https://www.red5pro.com/blog/introducing-xdn-experience-delivery-network/
Android
細(xì)數(shù) 2020 年官方對 Android 的那些重大更新
不知不覺,2020 年也已接近尾聲,今年雖然困難重重,但是 Android 社區(qū)的更新熱情卻并未消減 ,Google I/O 大會取消的同時,官方也為我們提供了一系列優(yōu)質(zhì)的節(jié)目:Now In Android[1] 、Kotlin Vocabulary[2]、11 Weeks of Android[3]。本篇文章就帶大家看一看今年以來,Android 相關(guān)最新的動態(tài),嘗鮮我們今后可以使用的功能。
https://mp.weixin.qq.com/s/bh-lI7Ue5x_LmSfZBg_Hsg
編解碼
AV1生態(tài)現(xiàn)狀概覽
AV1(Alliance for Open Media Video 1)是 2018 年6月由AOM聯(lián)盟(Alliance for Open Media,開放媒體聯(lián)盟)發(fā)布的新一代視頻編碼標(biāo)準(zhǔn)。
https://mp.weixin.qq.com/s/NK2KFfGRD7zfEjANhn2LIw
JPEG Pleno圖像編碼技術(shù)
本篇來自ICIP2020,演講者是來自意大利Cagliari大學(xué)的Cristian Perra博士,演講主題是 JPEG Pleno圖像編碼技術(shù)。
https://mp.weixin.qq.com/s/kybALVa3OQ3imwuhwzDweA
Fraunhofer多功能視頻解碼器(VVdeC)
Fraunhofer多功能視頻解碼器(VVdeC)是一種快速的VVC x86軟件解碼器實現(xiàn)。解碼器支持Main10概要文件中可用的大多數(shù)標(biāo)準(zhǔn)功能,但對某些高級功能的支持仍需等待。
https://github.com/fraunhoferhhi/vvdec
騰訊開源國內(nèi)首個H.266/VVC視頻播放器
騰訊O266player的開源不僅是騰訊視頻編解碼技術(shù)進(jìn)展的又一個重要里程碑,更是騰訊在推動多媒體技術(shù)生態(tài)不斷演進(jìn)的一個重要布局。未來騰訊多媒體將聯(lián)合各行業(yè),通過標(biāo)準(zhǔn)制定與產(chǎn)品研發(fā)將最新技術(shù)輸出至行業(yè),為數(shù)字化產(chǎn)業(yè)建設(shè)提供新的技術(shù)助力。
https://mp.weixin.qq.com/s/FiLF9b_m8COjahN8aKg9Nw
國內(nèi)外視頻編解碼標(biāo)準(zhǔn)體系
針對國內(nèi)外視頻編解碼標(biāo)準(zhǔn),典型涉及的標(biāo)準(zhǔn)組織或聯(lián)盟包括MPEG、ISO、ITU、AOM、AVS等。從編解碼體系角度來看,現(xiàn)有標(biāo)準(zhǔn)組織可粗略分三個陣營。本文就來分別說說MPEG、ITU、AOM、AVS的演進(jìn)歷程。
https://mp.weixin.qq.com/s/yNmKDUtDrNtkZgP_RHjwfw
ICIP2020:VVC幀內(nèi)編碼復(fù)雜度分析
本文來自ICIP2020論文《COMPLEXITY ANALYSIS OF VVC INTRA CODING》。
https://mp.weixin.qq.com/s/-5YvoR2vRuzIqCLS_pK9Jg
音視頻技術(shù)
“云端一體”的智能媒體生產(chǎn)制作演講之路
智能媒體生產(chǎn)制作的鏈路當(dāng)中,生產(chǎn)制作是核心,智能是輔助,那么AI技術(shù)是如何融入在整個生產(chǎn)制作流程當(dāng)中的?阿里云智能視頻云 高級技術(shù)專家 鄒娟在LiveVideoStackCon 2020 北京站的演講中就智能媒體生產(chǎn)制作的技術(shù)演進(jìn)之路,從三個部分為大家?guī)碓敿?xì)的講解。
https://mp.weixin.qq.com/s/E0AHuqT9IfkgNvrwst-bdA
Q音直播編譯優(yōu)化與二進(jìn)制集成方案
Q音直播抽離成pod庫分別引入到QQ音樂和Fan直播兩個獨立app中,而對于直播業(yè)務(wù)來講,直播SDK通過pod本地引入集成到Demo中進(jìn)行日常直播業(yè)務(wù)的開發(fā),通過Demo來精簡工程規(guī)模,提高研發(fā)效率。
https://mp.weixin.qq.com/s/5q_PLdLeuuuQnsLrbzaOeQ
大型多語言音像配音
實現(xiàn)嘴型同步對應(yīng)的自動語言翻譯。
https://arxiv.org/abs/2011.03530
實時音視頻助力在線教育風(fēng)口
TRTC全稱是騰訊實時音視頻,是在騰訊云上以SDK和REST API的方式提供售賣的云服務(wù)。騰訊云TRTC客戶端的產(chǎn)品架構(gòu)師蔣磊,將從疫情影響下在線教育市場的變化情況出發(fā),介紹實時音視頻實踐過程中的踩坑與填坑以及一些新的嘗試。
https://mp.weixin.qq.com/s/2XMYXVxoeIJ0irl9R-FPtg
主流VR頭顯FOV實測:與官方數(shù)據(jù)差別很大
為了對比15款VR頭顯實際FOV的大小,德國費爾巴赫的VDC(虛擬維度中心)利用特制的頭部模型來進(jìn)行模擬測量,結(jié)果發(fā)現(xiàn)15款頭顯中Pimax 8K視場角達(dá)141.5°,Pico G2視場角僅78.5°,幾乎每款頭顯的實際FOV觀感都與官方規(guī)格有所出入。
https://mp.weixin.qq.com/s/RfTcHLeebTMYMDvQ2SQ7Fg
AI智能
YOLO V4 Tiny改進(jìn)版來啦!速度294FPS精度不減YOLO V4 Tiny(附論文下載)
為了提高目標(biāo)檢測的實時性,本文提出了一種基于YOLOv4-tiny的快速目標(biāo)檢測方法。它首先使用ResNet-D網(wǎng)絡(luò)中的兩個ResBlock-D模塊,而不是Yolov4-tiny中的兩個CSPBlock模塊,從而降低了計算復(fù)雜度。其次,設(shè)計了輔助殘差網(wǎng)絡(luò)塊,以提取更多的物體特征信息,以減少檢測誤差。
https://mp.weixin.qq.com/s/fPlnMnwq2R-Pat5Jx1lFMg
算法
大規(guī)模視頻直播中的關(guān)鍵算法
伴隨著2020年大部分的體育賽事、音樂會、節(jié)日活動和其他聚集性活動的停滯,面向2021年我們會發(fā)現(xiàn)對支持大型活動的流媒體傳輸?shù)臐撛谛枨笫蔷薮蟮摹I(yè)界各公司將怎樣分發(fā)實時流事件來滿足這些潛在的史無前例的需求呢?最近發(fā)布在 Algorithm Series的文章深入研究了調(diào)整大規(guī)模實時視頻事件交付的數(shù)學(xué)和工作流決策算法。
https://mp.weixin.qq.com/s/EB7lccvXhRvcxb7KNA_tGg
活動推薦
LiveVideoStackCon 2020 美國站
灣區(qū)最原汁原味的技術(shù),全球最前沿的應(yīng)用實踐。
無需漂洋過海,我們在線上等您!
點擊【閱讀原文】了解更多大會信息
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 170的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【LiveVideoStack线上分享】
- 下一篇: 【线上分享】基于人眼主观视觉的画质评价与