當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

音视频技术开发周刊 54期

發(fā)布時間：2024/4/11 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了音视频技术开发周刊 54期小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

『音視頻技術(shù)開發(fā)周刊』由LiveVideoStack團(tuán)隊出品，專注在音視頻技術(shù)領(lǐng)域，縱覽相關(guān)技術(shù)領(lǐng)域的干貨和新聞投稿，每周一期。點擊『閱讀原文』，瀏覽第54期內(nèi)容，祝您閱讀愉快。

策劃 / LiveVideoStack

架構(gòu)

如何看待Pensieve：MIT基于神經(jīng)網(wǎng)絡(luò)的流媒體碼率自適應(yīng)策略

今年的SIGCOMM上， MIT CSAIL的一支研究團(tuán)隊，發(fā)表了一篇名為Pensieve的工作，即利用神經(jīng)網(wǎng)絡(luò)優(yōu)化碼率自適應(yīng)算法，用于提高媒體傳輸質(zhì)量。本文對其進(jìn)行了簡單的介紹，并發(fā)表了一些看法。

李大龍：音視頻技術(shù)是互聯(lián)網(wǎng)品質(zhì)生活的連接器

結(jié)識李大龍源于LiveVideoStackCon 2017，忙碌的工作讓我們在會場擦肩而過，并相約一場采訪。通過采訪，我深深的感受到他對行業(yè)的執(zhí)著與熱情，他將音視頻技術(shù)定義為互聯(lián)網(wǎng)品質(zhì)生活的連接器，而我們這些社區(qū)媒體不也是這些開發(fā)者與生態(tài)的連接器嗎？

直播終端技術(shù)比較

目前，連麥直播的終端主要包括：原生APP、瀏覽器H5、瀏覽器WebRTC、微信小程序。瀏覽器上的應(yīng)用包括H5和WebRTC，前者可以拉流觀看，后者可以實現(xiàn)推流和拉流。

WebSocket Go

本文主要介紹了WebSocket 協(xié)議、WebSocket 的 Go 語言實現(xiàn)，以及 socket.io 服務(wù)端庫的 Go 語言實現(xiàn)的理解。

WebRTC下的媒體網(wǎng)絡(luò)連接STUN、TURN、UDP、TCP

WebRTC對等連接：連接不同設(shè)備上的瀏覽器

本文詳細(xì)介紹了如何在不需要服務(wù)器的情況下（只需要在開始交互的時候使用服務(wù)器），使不同設(shè)備上的兩個瀏覽器相互交流。

音頻/視頻技術(shù)

移形換影 - 短視頻色彩特效背后的故事

本文介紹了騰訊云短視頻（UGSV）眾多視頻特效中的一種——移形換影。

詳解音視頻中的DRM數(shù)字版權(quán)技術(shù)

本文首先簡單介紹了當(dāng)前移動端DRM的一些基本概念，并通過實例重點介紹了安卓視頻開發(fā)的DRM處理。

Pensieve：AI帶來的更流暢的高質(zhì)量觀看體驗

麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室（MIT CSAIL）開發(fā)的基于機(jī)器學(xué)習(xí)的流媒體系統(tǒng)能更好的適應(yīng)不同的網(wǎng)絡(luò)條件，從而提供更加流暢的流媒體傳輸體驗。LiveVideoStack對原文進(jìn)行了摘譯。

FFmpeg3.3.2+SDL2實現(xiàn)流媒體音頻播放

本文介紹了如何通過FFmpeg+SDL實現(xiàn)簡單的播放器效果。

編解碼

視頻編碼與封裝方式詳解

本文為大家介紹了視頻編碼的方式、封裝格式、以及標(biāo)準(zhǔn)兩大系統(tǒng)，并指出幾種常用的視頻編碼方式以及存儲封裝格式。

Zoe Liu：被Chrome Media團(tuán)隊的專注精神感染

在WebRTCon 2018期間，Google軟件工程師Zoe Liu接受了LiveVideoStack社區(qū)編輯丁雪豐的采訪。Zoe暢談了AV1及VP9的現(xiàn)狀與應(yīng)用前景，以及從On2到Chrome Media堅持20多年做編解碼研發(fā)的團(tuán)隊。

AVS2音頻標(biāo)準(zhǔn)頒布，中國自主音視頻標(biāo)準(zhǔn)比翼雙飛

2018年6月7日，繼AVS2視頻部分2016年底頒布為國家標(biāo)準(zhǔn)后，我國第二代數(shù)字音頻編碼標(biāo)準(zhǔn)《信息技術(shù) 高效多媒體編碼第3部分：音頻》（簡稱AVS2音頻標(biāo)準(zhǔn)）將于2019年1月1日正式實施。

Android 基于FFmpeg開發(fā)簡易播放器 - FFmpeg解封裝

AI智能

深度學(xué)習(xí)AI美顏系列---AI瘦身效果算法揭秘

商湯基于深度學(xué)習(xí)研發(fā)了整套瘦身SDK，包括了瘦腿，瘦腰，瘦胳膊，瘦頭型等等功能，并給出了酷炫的實時瘦身視頻，驚艷到了眾人！本文將以瘦腰和瘦腿為例，給大家詳細(xì)講解一下。

圖像語義分割的工作原理和CNN架構(gòu)變遷

圖像分割是根據(jù)圖像內(nèi)容對指定區(qū)域進(jìn)行標(biāo)記的計算機(jī)視覺任務(wù)，本文聚焦于語義分割任務(wù)，即在分割圖中將同一類別的不同實例視為同一對象。作者將沿著該領(lǐng)域的研究脈絡(luò)，說明如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割的任務(wù)。

從ISCA論文看AI硬件加速的新技巧

總得來說，專門針對ML/DNN的硬件架構(gòu)已經(jīng)是ISCA連續(xù)幾年的熱點了，經(jīng)過大家的努力，對相關(guān)問題的挖掘已經(jīng)越來越深。目前，對ML/DNN硬件加速技術(shù)的研究主要圍繞提高Inference的處理效率展開。

圖像

壓縮效率第一！CVPR圖像壓縮挑戰(zhàn)賽騰訊音視頻實驗室勝出

CVPR 2018 圖像壓縮挑戰(zhàn)賽（CLIC）結(jié)果已經(jīng)出爐，騰訊音視頻實驗室和武漢大學(xué)陳震中教授聯(lián)合團(tuán)隊于該項挑戰(zhàn)賽上取得壓縮性能第一。

具有感興趣區(qū)域的靜止圖像壓縮編碼算法研究

為了提高感興趣區(qū)域的圖像質(zhì)量，在信道資源和存儲空間有限的條件下，提出感興趣區(qū)域的零樹編碼算法EZW_ROI（Embedded Zerotree Wavelet with Region of interests），它對感興趣區(qū)域圖像和背景圖像采用不同的壓縮步驟，使感興趣區(qū)域內(nèi)的圖像比背景圖像具有更好的圖像質(zhì)量。

代碼簡單實現(xiàn)模擬噪聲

本文介紹了圖像噪聲的概念、來源、幾種常見的圖像噪聲形式以及如何通過代碼簡單實現(xiàn)模擬噪聲。

總結(jié)

以上是生活随笔為你收集整理的音视频技术开发周刊 54期的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Pensieve：AI带来的更流畅的高质
下一篇：视频编码末日将至？