音视频技术开发周刊 | 173
每周一期,縱覽音視頻技術(shù)領(lǐng)域的干貨。
新聞投稿:contribute@livevideostack.com。
閱讀推薦
新版SVT-AVS3發(fā)布 編碼效率提升并提供更靈活的編碼工具
SVT-AVS3的用戶(hù)正在從廣電領(lǐng)域滲透到互聯(lián)網(wǎng)企業(yè)。
https://mp.weixin.qq.com/s/xO1tefcT5mkoimJvrmTeuA
架構(gòu)
選擇HLS或WebRTC需要考慮的五個(gè)因素
當(dāng)問(wèn)到直播視頻時(shí)使用低延遲HLS還是WebRTC,WebRTC顯然是贏家。
https://mp.weixin.qq.com/s/UBktJBCoSrd74T2B0X41Ng
WebRTC + NDI: Part II
Janus 加強(qiáng)了對(duì) NDI 的支持,使其可以投入到生產(chǎn)環(huán)境使用了。
https://www.meetecho.com/blog/webrtc-ndi-part-2/
WebRTC服務(wù)器設(shè)計(jì)小結(jié)
本文我們來(lái)侃一侃對(duì)服務(wù)器設(shè)計(jì)細(xì)節(jié)的思考。
https://juejin.cn/post/6901682950673760269
傳輸網(wǎng)絡(luò)
亞洲地區(qū)的下一代CDN服務(wù)演進(jìn)
本文來(lái)自Streaming Media的一篇演講,作者是Baishan云公司的產(chǎn)品高級(jí)總監(jiān)Angel Chin,內(nèi)容是亞洲地區(qū)的下一代服務(wù)演進(jìn)。
https://mp.weixin.qq.com/s/G4WARzTuHgKLlSYTXgBpoA
『CDN』讓你的網(wǎng)站訪問(wèn)起來(lái)更加柔順絲滑
當(dāng)你在訪問(wèn)淘寶、京東準(zhǔn)備剁手的時(shí)候,雖然進(jìn)入頁(yè)面的時(shí)候有很多的圖片、很多的內(nèi)容,但是加載起來(lái)卻很快,讓你剁手的動(dòng)作如水般絲滑。難道就是靠大廠背后充足的服務(wù)器、寬帶資源以及過(guò)硬的優(yōu)化技術(shù)了嗎?當(dāng)然了,這肯定是必要的條件,除此之外就靠我們今天要說(shuō)的 CDN 技術(shù)了。
https://mp.weixin.qq.com/s/UcH83h88yvSjxIc15W_rmA
CDN工作原理及其在淘寶圖片業(yè)務(wù)中的應(yīng)用
淘寶的圖片訪問(wèn),有98%的流量都走了CDN緩存,只有2%會(huì)回源到源站,節(jié)省了大量的服務(wù)器資源。
但是,如果在用戶(hù)訪問(wèn)高峰期,圖片內(nèi)容大批量發(fā)生變化,大量用戶(hù)的訪問(wèn)就會(huì)穿透cdn,對(duì)源站造成巨大的壓力。
今年雙11,淘寶鹿班的主圖價(jià)格表達(dá)升級(jí)項(xiàng)目,就面臨了這種挑戰(zhàn),讓我們看看是如何解決的吧。
https://juejin.cn/post/6901479190244098062
資訊速覽
長(zhǎng)視頻戰(zhàn)爭(zhēng):十年 1000 億人民幣,燒出了三家電視臺(tái)
我們采訪了這個(gè)行業(yè)數(shù)十位從業(yè)者、投資人,幾乎沒(méi)人能總結(jié)出這場(chǎng)戰(zhàn)爭(zhēng)的意義,唯一得到的一個(gè)結(jié)論是:他們?cè)伊顺^(guò) 1000 億人民幣。
https://mp.weixin.qq.com/s/zVEgHePsel_46qB1rnTLHA
軟銀以6.9億美元入股提供基于云的“全渠道”語(yǔ)音,視頻和消息服務(wù)公司 Sinch
盡管世界各地的人們已經(jīng)接受了移動(dòng)消息傳遞功能來(lái)與親朋好友互動(dòng),但是大多數(shù)企業(yè)尚未抓住這一機(jī)會(huì)。
https://techcrunch.com/2020/12/01/softbank-takes-a-690m-stake-in-cloud-based-swedish-crm-company-sinch/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29
編解碼
視頻基礎(chǔ)和MP4容器解封裝
最近在研究基于移動(dòng)端平臺(tái)上使用視頻做動(dòng)畫(huà)載體的方案,目前移動(dòng)端平臺(tái)使用動(dòng)畫(huà)的方案有:gif圖、apng、webp、lottie、svga等,各有各的優(yōu)勢(shì),也有相應(yīng)的劣勢(shì),而使用視頻做動(dòng)畫(huà)的目的,尋求的是完美還原設(shè)計(jì)師的設(shè)計(jì)特效外,同時(shí)性能達(dá)到極致。在這個(gè)過(guò)程中,也積累了一些視頻相關(guān)的知識(shí),借此同大家分享下。
https://mp.weixin.qq.com/s/-n9-J-ld-YrT4hnaaKGHcQ
云端無(wú)壓縮視頻&廣播的未來(lái)
本文記述了SMPTE的一次關(guān)于云端無(wú)壓縮視頻&廣播的未來(lái)的Webinar,由IABM的CTO與幾位亞馬遜公司廣播方面的專(zhuān)家參與。本次研討會(huì)主要圍繞著云端無(wú)壓縮視頻以及廣播媒體未來(lái)的幾個(gè)重要問(wèn)題進(jìn)行了探討。
https://mp.weixin.qq.com/s/ika-gvIJW5HjlMd5CzaYxg
音視頻技術(shù)
One Shot 3D Photography
3D攝影是一種新的媒體,它使觀眾可以更充分地體驗(yàn)捕捉的瞬間。
https://facebookresearch.github.io/one_shot_3d_photography/
使用帶有字節(jié)范圍尋址的LL-HLS來(lái)實(shí)現(xiàn)低延遲流中的互操作性
本文將研究使用基于范圍的尋址可以解決的問(wèn)題,使其有效運(yùn)行所要滿足的要求以及通過(guò)大規(guī)模部署它可以獲得的好處。
https://mp.weixin.qq.com/s/4gsfHGcPYO3al3ZuPoUaoQ
ATSC3.0:下一代電視廣播標(biāo)準(zhǔn)
本次討論來(lái)自THE VIDEO INSIDERS,參與討論的有來(lái)自IBM媒體與娛樂(lè)的首席技術(shù)官Peter Guglielmino。本次討論主要涵蓋了NextGen TV(ATSC3.0)背后的用例、商業(yè)模式和技術(shù)部署。
https://mp.weixin.qq.com/s/PFqDK620My5gSEV8MVONLQ
AI智能
告別渣畫(huà)質(zhì),視頻會(huì)議帶寬降90%,英偉達(dá)公開(kāi)Maxine服務(wù)背后重要技術(shù)
10 月初,英偉達(dá)推出了一項(xiàng) AI 視頻會(huì)議服務(wù) Maxine,使用了 AI 來(lái)提升分辨率、降低背景噪聲、壓縮視頻、對(duì)齊人臉以及執(zhí)行實(shí)時(shí)翻譯和轉(zhuǎn)錄。最近,英偉達(dá)團(tuán)隊(duì)發(fā)布的新論文揭露了這背后的技術(shù)。
https://mp.weixin.qq.com/s/C9jQN_fvJ_9To3Ua8xz3Tw
研究人員的AI技術(shù)能夠?qū)崟r(shí)匹配活頁(yè)樂(lè)譜與MIDI音頻
音樂(lè)AI技術(shù)正在快速發(fā)展。
https://mp.weixin.qq.com/s/ACR2HCnwrdxY2eS9wG4jww
AlexNet:深度卷積神經(jīng)網(wǎng)絡(luò)開(kāi)始興起
雖然Yann LeCun在上個(gè)世紀(jì)就提出了卷積神經(jīng)網(wǎng)絡(luò)LeNet,并使用LeNet進(jìn)行圖像分類(lèi),但卷積神經(jīng)網(wǎng)絡(luò)并沒(méi)有就此飛速發(fā)展。在LeNet提出后的將近20年里,神經(jīng)網(wǎng)絡(luò)一度被其他機(jī)器學(xué)習(xí)方法超越,如支持向量機(jī)。
https://mp.weixin.qq.com/s/zuktls_ktybxaAK8GlEMfw
圖像
圖片壓縮庫(kù) compressor 學(xué)習(xí)
compressor 是一個(gè) Android 平臺(tái)上的開(kāi)源圖片壓縮庫(kù),使用它,可以方便的對(duì)本地圖片進(jìn)行壓縮,并提供了各種壓縮參數(shù)設(shè)置。
https://juejin.cn/post/6901804309671837709
資源推薦
小型深度學(xué)習(xí)框架:tinygrad
tinygrad 是美國(guó)知名黑客 George Hotz 開(kāi)源的小型深度學(xué)習(xí)框架 tinygrad,代碼不足 1k 行,兼具 PyTorch 和 micrograd 的功能。
https://github.com/geohot/tinygrad
輕量級(jí)目標(biāo)檢測(cè):NanoDet
NanoDet 一個(gè)超快輕量級(jí)無(wú)錨對(duì)象檢測(cè)模型,支持實(shí)時(shí)移動(dòng)設(shè)備。特性:
? 超級(jí)輕量級(jí):模型文件只有 1.8 mb。
? 超快:在 ARM CPU 上 97 fps (10.23 ms) 。
???? 訓(xùn)練友好:GPU 內(nèi)存成本遠(yuǎn)低于其他模型。在 GTX1060 6G 上可用 Batch-size 80 運(yùn)行。
???? 易部署:基于 ncnn 推理框架提供 C++ 實(shí)現(xiàn)和 Android 演示。
https://github.com/RangiLyu/nanodet
活動(dòng)推薦
12月11-13日,20位海外技術(shù)專(zhuān)家+2場(chǎng)高端圓桌對(duì)話,不一樣的技術(shù)視角,新一代標(biāo)準(zhǔn)與協(xié)議,全新的落地實(shí)踐。
中英文字幕+實(shí)時(shí)互動(dòng)機(jī)會(huì),更有AOM彩蛋等你發(fā)現(xiàn)!
點(diǎn)擊【閱讀原文】了解詳情
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 | 173的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 视频质量评估的新方式:VMAF百分位数
- 下一篇: 【线上分享】边缘计算与云原生架构应用及实