音视频技术开发周刊 54期
『音視頻技術(shù)開發(fā)周刊』由LiveVideoStack團(tuán)隊出品,專注在音視頻技術(shù)領(lǐng)域,縱覽相關(guān)技術(shù)領(lǐng)域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第54期內(nèi)容,祝您閱讀愉快。
策劃 / LiveVideoStack
架構(gòu)
如何看待Pensieve:MIT基于神經(jīng)網(wǎng)絡(luò)的流媒體碼率自適應(yīng)策略
今年的SIGCOMM上, MIT CSAIL的一支研究團(tuán)隊,發(fā)表了一篇名為Pensieve的工作,即利用神經(jīng)網(wǎng)絡(luò)優(yōu)化碼率自適應(yīng)算法,用于提高媒體傳輸質(zhì)量。本文對其進(jìn)行了簡單的介紹,并發(fā)表了一些看法。
李大龍:音視頻技術(shù)是互聯(lián)網(wǎng)品質(zhì)生活的連接器
結(jié)識李大龍源于LiveVideoStackCon 2017,忙碌的工作讓我們在會場擦肩而過,并相約一場采訪。通過采訪,我深深的感受到他對行業(yè)的執(zhí)著與熱情,他將音視頻技術(shù)定義為互聯(lián)網(wǎng)品質(zhì)生活的連接器,而我們這些社區(qū)媒體不也是這些開發(fā)者與生態(tài)的連接器嗎?
直播終端技術(shù)比較
目前,連麥直播的終端主要包括:原生APP、瀏覽器H5、瀏覽器WebRTC、微信小程序。瀏覽器上的應(yīng)用包括H5和WebRTC,前者可以拉流觀看,后者可以實現(xiàn)推流和拉流。
WebSocket Go
本文主要介紹了WebSocket 協(xié)議、WebSocket 的 Go 語言實現(xiàn),以及 socket.io 服務(wù)端庫的 Go 語言實現(xiàn)的理解。
WebRTC下的媒體網(wǎng)絡(luò)連接STUN、TURN、UDP、TCP
WebRTC對等連接:連接不同設(shè)備上的瀏覽器
本文詳細(xì)介紹了如何在不需要服務(wù)器的情況下(只需要在開始交互的時候使用服務(wù)器),使不同設(shè)備上的兩個瀏覽器相互交流。
音頻/視頻技術(shù)
移形換影 - 短視頻色彩特效背后的故事
本文介紹了騰訊云短視頻(UGSV)眾多視頻特效中的一種——移形換影。
詳解音視頻中的DRM數(shù)字版權(quán)技術(shù)
本文首先簡單介紹了當(dāng)前移動端DRM的一些基本概念,并通過實例重點介紹了安卓視頻開發(fā)的DRM處理。
Pensieve:AI帶來的更流暢的高質(zhì)量觀看體驗
麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室(MIT CSAIL)開發(fā)的基于機(jī)器學(xué)習(xí)的流媒體系統(tǒng)能更好的適應(yīng)不同的網(wǎng)絡(luò)條件,從而提供更加流暢的流媒體傳輸體驗。LiveVideoStack對原文進(jìn)行了摘譯。
FFmpeg3.3.2+SDL2實現(xiàn)流媒體音頻播放
本文介紹了如何通過FFmpeg+SDL實現(xiàn)簡單的播放器效果。
編解碼
視頻編碼與封裝方式詳解
本文為大家介紹了視頻編碼的方式、封裝格式、以及標(biāo)準(zhǔn)兩大系統(tǒng),并指出幾種常用的視頻編碼方式以及存儲封裝格式。
Zoe Liu:被Chrome Media團(tuán)隊的專注精神感染
在WebRTCon 2018期間,Google軟件工程師Zoe Liu接受了LiveVideoStack社區(qū)編輯丁雪豐的采訪。Zoe暢談了AV1及VP9的現(xiàn)狀與應(yīng)用前景,以及從On2到Chrome Media堅持20多年做編解碼研發(fā)的團(tuán)隊。
AVS2音頻標(biāo)準(zhǔn)頒布,中國自主音視頻標(biāo)準(zhǔn)比翼雙飛
2018年6月7日,繼AVS2視頻部分2016年底頒布為國家標(biāo)準(zhǔn)后,我國第二代數(shù)字音頻編碼標(biāo)準(zhǔn)《信息技術(shù) 高效多媒體編碼 第3部分:音頻》(簡稱AVS2音頻標(biāo)準(zhǔn))將于2019年1月1日正式實施。
Android 基于FFmpeg開發(fā)簡易播放器 - FFmpeg解封裝
AI智能
深度學(xué)習(xí)AI美顏系列---AI瘦身效果算法揭秘
商湯基于深度學(xué)習(xí)研發(fā)了整套瘦身SDK,包括了瘦腿,瘦腰,瘦胳膊,瘦頭型等等功能,并給出了酷炫的實時瘦身視頻,驚艷到了眾人!本文將以瘦腰和瘦腿為例,給大家詳細(xì)講解一下。
圖像語義分割的工作原理和CNN架構(gòu)變遷
圖像分割是根據(jù)圖像內(nèi)容對指定區(qū)域進(jìn)行標(biāo)記的計算機(jī)視覺任務(wù),本文聚焦于語義分割任務(wù),即在分割圖中將同一類別的不同實例視為同一對象。作者將沿著該領(lǐng)域的研究脈絡(luò),說明如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割的任務(wù)。
從ISCA論文看AI硬件加速的新技巧
總得來說,專門針對ML/DNN的硬件架構(gòu)已經(jīng)是ISCA連續(xù)幾年的熱點了,經(jīng)過大家的努力,對相關(guān)問題的挖掘已經(jīng)越來越深。目前,對ML/DNN硬件加速技術(shù)的研究主要圍繞提高Inference的處理效率展開。
圖像
壓縮效率第一!CVPR圖像壓縮挑戰(zhàn)賽騰訊音視頻實驗室勝出
CVPR 2018 圖像壓縮挑戰(zhàn)賽(CLIC)結(jié)果已經(jīng)出爐,騰訊音視頻實驗室和武漢大學(xué)陳震中教授聯(lián)合團(tuán)隊于該項挑戰(zhàn)賽上取得壓縮性能第一。
具有感興趣區(qū)域的靜止圖像壓縮編碼算法研究
為了提高感興趣區(qū)域的圖像質(zhì)量,在信道資源和存儲空間有限的條件下,提出感興趣區(qū)域的零樹編碼算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它對感興趣區(qū)域圖像和背景圖像采用不同的壓縮步驟,使感興趣區(qū)域內(nèi)的圖像比背景圖像具有更好的圖像質(zhì)量。
代碼簡單實現(xiàn)模擬噪聲
本文介紹了圖像噪聲的概念、來源、幾種常見的圖像噪聲形式以及如何通過代碼簡單實現(xiàn)模擬噪聲。
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 54期的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pensieve:AI带来的更流畅的高质
- 下一篇: 视频编码末日将至?