音视频技术开发周刊 63期
『音視頻技術(shù)開發(fā)周刊』由LiveVideoStack團(tuán)隊(duì)出品,專注在音視頻技術(shù)領(lǐng)域,縱覽相關(guān)技術(shù)領(lǐng)域的干貨和新聞投稿,每周一期。點(diǎn)擊『閱讀原文』,瀏覽第63期內(nèi)容,祝您閱讀愉快。
架構(gòu)
傅德良:選擇視頻編碼器的誤區(qū)
本文來自Hulu全球高級(jí)研發(fā)經(jīng)理、視頻編解碼與傳輸領(lǐng)域資深專家傅德良在LiveVideoStackCon 2018熱身分享,并由LiveVideoStack整理而成。在分享中,傅德良以 Hulu實(shí)踐為基礎(chǔ),介紹了視頻編解碼標(biāo)準(zhǔn)與視頻編碼器間的紛爭以及視頻編碼器對比中的常見誤區(qū)。
林緒虹:看好QoE、音視頻內(nèi)容理解與AV1
還記得你在大學(xué)時(shí)候的夢想嗎?職場上打拼多年,你的工作領(lǐng)域與你之前的專業(yè)還有多少相關(guān)?技術(shù)、行業(yè)與時(shí)代的洪流將一些人推上人生巔峰,又把一些人無情的拍向谷底。LiveVideoStack郵件采訪了YY音視頻算法中心負(fù)責(zé)人林緒虹,從直播領(lǐng)域的起伏聊到時(shí)代,從學(xué)習(xí)方法聊到技術(shù)趨勢。
Cloudflare Nginx優(yōu)化成果:每天為互聯(lián)網(wǎng)節(jié)約54年
Nginx是世界范圍內(nèi)使用最廣泛的負(fù)載均衡器和web服務(wù)器之一。Cloudflare大規(guī)模使用Nginx來支持自身的邊緣節(jié)點(diǎn)。在其使用過程中碰見了一些問題,通過優(yōu)化這些問題,Nginx的性能得到了極大提升。本文是Cloudflare對其所做的一些優(yōu)化的具體分析和結(jié)論,對于工程師和架構(gòu)師來說,十分值得一讀。
從Go高性能日志庫zap看如何實(shí)現(xiàn)高性能Go組件
zap是uber開源的Go高性能日志庫。本文作者深入分析了zap的架構(gòu)設(shè)計(jì)和具體實(shí)現(xiàn),揭示了zap高效的原因。并且對如何構(gòu)建高性能Go語言庫給出自己的建議。
PWA初探
HTML 5 曾被認(rèn)為是移動(dòng)應(yīng)用的明天,卻被原生App在性能和功能上輕易戰(zhàn)勝,Web逐漸成為App的附屬。然而,馬云“爸爸”告訴我們:“夢想還是要有的,萬一實(shí)現(xiàn)了呢?”如今,我們離夢想又近了一步。
金山云三招保障百萬級(jí)直播
央視網(wǎng)是本屆亞運(yùn)會(huì)移動(dòng)端直播的重要平臺(tái),將在亞運(yùn)會(huì)期間密集直播各項(xiàng)賽事。金山云作為央視網(wǎng)的合作伙伴,將為客戶提供直播保障,帶給觀眾身臨其境的視聽體驗(yàn)。
十年磨一劍:英偉達(dá)最「閃」GPU 登場,揭曉新一代芯片架構(gòu)
從今年年初開始,英偉達(dá)將發(fā)布新一代架構(gòu)的消息就已經(jīng)傳的沸沸揚(yáng)揚(yáng),傳聞稱架構(gòu)代號(hào)也許會(huì)是「Ampere」,也可能是「Turing」。在SIGGRAPH 大會(huì)上,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在其主題演講上發(fā)布了這一新架構(gòu),除此之外還推出了全新的 RTX 系列 GPU。
音頻/視頻技術(shù)
音視頻開發(fā)
音視頻開發(fā),就是要掌握圖像、音頻、視頻的基礎(chǔ)知識(shí),并且學(xué)會(huì)如何對它們進(jìn)行采集、渲染、處理、傳輸?shù)纫幌盗械拈_發(fā)和應(yīng)用。
iOS音視頻-01-音頻播放(FFMpeg+AudioUnit)
本文主要介紹如何使用FFmpeg完成一個(gè)音視頻播放Demo,用AudioUnit播放一個(gè)Mp3, AAC文件。
如何快速實(shí)現(xiàn)移動(dòng)端短視頻功能?
在“互聯(lián)網(wǎng)+”概念被炒的如火如荼的今天,短視頻以視頻短、傳播快、生產(chǎn)流程簡單、制作門檻低、參與性強(qiáng)等特點(diǎn)在互聯(lián)網(wǎng)所有的熱門的焦點(diǎn)中脫穎而出,出現(xiàn)在公眾的視野里。那么如何快速實(shí)現(xiàn)移動(dòng)端短視頻功能呢?本文作者將根據(jù)其對行業(yè)的洞察,結(jié)合網(wǎng)易云信技術(shù)進(jìn)行具體的分析。
流媒體技術(shù)筆記
Darwin Streaming Server簡稱DSS。DSS是Apple公司提供的開源實(shí)時(shí)流媒體播放服務(wù)器程序。整個(gè)程序使用C++編寫,在設(shè)計(jì)上遵循高性能,簡單,模塊化等程序設(shè)計(jì)原則,務(wù)求做到程序高效,可擴(kuò)充性好。
編解碼
Capped CRF:節(jié)省編碼成本和數(shù)據(jù)流
Capped CRF編碼是一種單通道編碼方法,與雙通道VBR相比,可以節(jié)省編碼成本。Capped CRF也是一種簡單的per-title編碼方法,可以降低帶寬成本并且提高觀眾的體驗(yàn)質(zhì)量。本文來自資深多媒體技術(shù)咨詢師Jan Oze,LiveVideoStack對原文進(jìn)行了摘譯。
iOS硬編解碼相關(guān)知識(shí)
蘋果在iOS 8.0系統(tǒng)之前,沒有開放系統(tǒng)的硬件編碼解碼功能,不過Mac OS系統(tǒng)一直有,被稱為Video ToolBox的框架來處理硬件的編碼和解碼,終于在iOS 8.0(即WWDC 2014 513)后,蘋果將該框架引入iOS系統(tǒng)。
FFmpeg編碼支持與定制
FFmpeg本身支持一些音視頻編碼格式、文件封裝格式與流媒體傳輸協(xié)議,但是支持的數(shù)量仍然有限,FFmpeg所做的只是提供一套基礎(chǔ)的框架,所有的編碼格式、文件封裝格式與流媒體協(xié)議均可以做為FFmpeg的一個(gè)模塊掛載在FFmpeg框架中。
Netty 編碼解碼應(yīng)用
Tcp基于字節(jié)流的傳輸層通信協(xié)議,把數(shù)據(jù)流分區(qū)成適當(dāng)長度的報(bào)文段,報(bào)文段長度有限,當(dāng)傳輸大量數(shù)據(jù),需要將大報(bào)文拆分成為小報(bào)文對傳輸?shù)膱?bào)文進(jìn)行粘包和拆包。
MediaCodec AudioRecord 硬編 AAC 格式音頻(一)
AAC是一種音頻壓縮格式,區(qū)別于無損的 PCM 數(shù)據(jù)格式,其中分成了兩種:ADTS 和 ADIF 格式。
Chromium中 WebRTC 視頻解碼過程分析
WebRTC 默認(rèn)采用的編碼格式為 VP8,所以解碼對應(yīng)的解碼方法也是 VP8.?
AI智能
深度學(xué)習(xí)入門---Numpy圖像處理
在Python的學(xué)習(xí)過程中,我們實(shí)際上有各種圖像處理庫可以使用,比如opencv,Matplotlib,Scipy等等,這里我們使用Numpy來實(shí)現(xiàn)圖像處理算法,以此來加深Numpy和圖像算法的學(xué)習(xí)。
App基于手機(jī)殼顏色換膚?先嘗試一下用KMeans來提取圖像中的主色
k - 平均算法(中文: k -means clustering)源于信號(hào)處理中的一種向量量化方法,現(xiàn)在則更多地作為一種聚類分析方法流行于數(shù)據(jù)挖掘領(lǐng)域 .k - 平均聚類的目的是:把n個(gè)點(diǎn)(可以是樣本的一次觀察或一個(gè)實(shí)例)劃分到 k個(gè)聚類中,使得每個(gè)點(diǎn)都屬于離他最近的均值(此即聚類中心)對應(yīng)的聚類,以之作為聚類的標(biāo)準(zhǔn)。這個(gè)問題將歸結(jié)為一個(gè)把數(shù)據(jù)空間劃分為Voronoi cells的問題。
清華&商湯開源CVPR2018超高精度人臉對齊算法LAB
人臉的邊緣信息和人臉關(guān)鍵點(diǎn)有很明顯的重要關(guān)系,而以往的人臉對齊(Face Alignment)算法并沒有很好的利用邊緣信息,本文提出一種基于邊緣感知的人臉關(guān)鍵點(diǎn)檢測算法,將人臉邊緣線所描述的結(jié)構(gòu)信息融入到關(guān)鍵點(diǎn)檢測中,極大地提升了算法在大側(cè)臉、夸張表情、遮擋、模糊等極端情況下的檢測精度。
如何通過深度學(xué)習(xí)輕松實(shí)現(xiàn)自動(dòng)化監(jiān)控?
這是一篇關(guān)于使用基于深度學(xué)習(xí)的目標(biāo)檢測來實(shí)現(xiàn)監(jiān)控系統(tǒng)的快速教程。在教程中通過使用 GPU 多處理器來比較不同目標(biāo)檢測模型在行人檢測上的性能。
對抗深度學(xué)習(xí): 魚 (模型準(zhǔn)確性) 與熊掌 (模型魯棒性) 能否兼得?
分類的準(zhǔn)確度長期以來都是評(píng)價(jià)圖像分類模型性能的最核心甚至唯一標(biāo)準(zhǔn)。但最近研究表明,即使是充分訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型也很容易被對抗攻擊算法攻破。對抗攻擊是指在圖像上加入特定的且人眼無法察覺的微量噪聲,使得目標(biāo)模型對加噪之后得到的對抗樣本做出錯(cuò)誤分類。
比RNN快136倍!上交大提出SRNN,現(xiàn)在RNN也能做并行計(jì)算了
上海交通大學(xué)最新提出切片循環(huán)神經(jīng)網(wǎng)絡(luò)(SRNN),其速度是標(biāo)準(zhǔn)RNN的136倍,并且還能更快!對六個(gè)大型情緒分析數(shù)據(jù)集的實(shí)驗(yàn)表明,SRNN的性能均優(yōu)于標(biāo)準(zhǔn)RNN。
圖像
Metal入門教程總結(jié)
本文介紹Metal和Metal Shader Language,以及Metal和OpenGL ES的差異性,也是實(shí)現(xiàn)入門教程的心得總結(jié)。
HDR質(zhì)量評(píng)價(jià)技術(shù)
本文聚焦HDR質(zhì)量評(píng)價(jià)技術(shù),對于編解碼、色調(diào)映射以及逆色調(diào)映射等不同任務(wù),通常會(huì)采取不同的評(píng)價(jià)方法。本部分先從主觀評(píng)價(jià)和客觀評(píng)價(jià)兩個(gè)角度對常用的HDR視覺質(zhì)量評(píng)價(jià)技術(shù)做整體介紹。
超強(qiáng)干貨來襲 云風(fēng)專訪:近40年碼齡,通宵達(dá)旦的技術(shù)人生總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 63期的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 朱政:金山H.265诞生记
- 下一篇: 快手QoE指标设计的分析初探