音视频技术开发周刊 92期
『音視頻技術(shù)開發(fā)周刊』由LiveVideoStack團隊出品,專注在音視頻技術(shù)領域,縱覽相關技術(shù)領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第92期內(nèi)容,祝您閱讀愉快。
架構(gòu)
從通信到AI FreeSWITCH與WebRTC
FreeSWITCH是一個開源的軟交換平臺,具有模塊化結(jié)構(gòu),支持包括WebRTC在內(nèi)的多種互通互聯(lián)。本文來自FreeSWITCH 中文社區(qū)創(chuàng)始人杜金房在LiveVideoStack線上交流分享中的演講,詳細介紹了FreeSWITCH的功能特性、架構(gòu)以及現(xiàn)狀。
如何利用免版稅視頻流技術(shù)構(gòu)建優(yōu)質(zhì)視頻體驗?
隨著全行業(yè)及消費者對版權(quán)技術(shù)的越發(fā)重視,如何利用免版稅技術(shù)在不受專利限制的影響下提供高質(zhì)量的在線視頻服務,成為當前所面臨的最大難題。Mux流媒體專家Phil Cluff總結(jié)了其在探索免版稅視頻流技術(shù)過程中所做的一些工作。
SRS-開源流媒體服務器
SRS定位是運營級的互聯(lián)網(wǎng)直播服務器集群,追求更好的概念完整性和最簡單實現(xiàn)的代碼。SRS提供了豐富的接入方案將RTMP流接入SRS。
三體云周思進:在紅海中尋找藍海
時隔一年,三體云CEO周思進再次接受了LiveVideoStack的采訪,他說“寒冬”對企業(yè)思考商業(yè)本質(zhì)是件好事,5G、AI、IoT這些藍海本質(zhì)上都是紅海,關鍵在于企業(yè)能否把紅海變藍。
WebRTC 之ICE淺談
隨著WebRTC的應用越來越普遍,無論是Native端還是Web端,由于廣泛的適應能力以及對未來網(wǎng)絡的支持,ICE作為一種綜合的解決方案將有著非常廣闊的應用前景。
Web 實時推送技術(shù)的總結(jié)
隨著 Web 的發(fā)展,用戶對于 Web 的實時推送要求也越來越高 ,比如,工業(yè)運行監(jiān)控、Web 在線通訊、即時報價系統(tǒng)、在線游戲等,都需要將后臺發(fā)生的變化主動地、實時地傳送到瀏覽器端,而不需要用戶手動地刷新頁面。本文對過去和現(xiàn)在流行的 Web 實時推送技術(shù)進行了比較與總結(jié)。
傳輸網(wǎng)絡
范醒哲:5G時代是時候全面解決TCP的效率問題了
本文由LiveVideoStack對Cascade Range Networks CTO/聯(lián)合創(chuàng)始人范醒哲的郵件采訪整理而成,作為一名研究UDP和TCP十多年的老兵,范醒哲剖析了UDP與TCP的優(yōu)勢與不足,并預測了5G將帶來的網(wǎng)絡協(xié)議與應用變革。
音頻/視頻技術(shù)
質(zhì)量三維論如何持續(xù)推進騰訊視頻播放體驗提升
騰訊視頻移動端播放內(nèi)核技術(shù)負責人李大龍在LiveVideoStackCon2018上的演講中分享了騰訊視頻的質(zhì)量“三維論”思想與體系,及以此推動視頻播放體驗優(yōu)化工作方面的實踐經(jīng)驗與總結(jié)。
擁塞控制(Congestion Control)算法匯總+ 大牛
作為一名擁塞控制算法研究應用的工程人員,自然少不了對各種算法論文,原理的閱讀和研究。作為興趣和總結(jié),本文嘗試羅列自己看過的擁塞控制算法,并繼續(xù)探索相關論文作者的信息,學習作者更多的研究。
MPEG系統(tǒng)層回顧
MPEG因為其視頻和音頻編碼標準被人們所熟知,但是如果沒有系統(tǒng)部分,MPEG就不會是現(xiàn)在的樣子。
Android端的短視頻開發(fā),我們該如何快速實現(xiàn)移動端短視頻功能?
優(yōu)質(zhì)短視頻內(nèi)容的產(chǎn)生依賴于短視頻的采集和特效編輯,這就要求在進行抖音APP開發(fā)時,用到基礎的美顏、混音、濾鏡、變速、圖片視頻混剪、字幕等功能,在這些功能基礎上,進行預處理,結(jié)合OpenGL、AI、AR技術(shù),產(chǎn)生很多有趣的動態(tài)貼紙玩法,使得短視頻內(nèi)容更具創(chuàng)意。
語音相似度打分技術(shù)說明
語音相似度打分模塊主要應用于語音監(jiān)控設備和報警裝置,目前更多適用于工廠設備的實時監(jiān)控,作為視頻監(jiān)控的輔助,具有低成本,準確率高,容易實現(xiàn)等特點。同時語音相似度打分模塊也可以應用在教育領域,輔助學生提升口語能力,模仿標準口音說話,例如在普通話發(fā)音不標準的地區(qū),做到實時監(jiān)測實時校正。
編解碼
通過WebAssembly在移動端解碼H.265
本文詳細介紹了如何通過WebAssembly在移動Web端實現(xiàn)H.265解碼,既享受到了H.265更高的編碼效率,又實現(xiàn)了在多種移動端瀏覽器上兼容。未來,通過WebAssembly還可能實現(xiàn)對AV1等新一代Codec的支持。
WebRTC Android H264編解碼適配
自從Cisco宣布旗下的H264 Codec開源為OpenH264,并且替所有OpenH264的使用者支付了H264的專利費,WebRTC也隨隨對H264進行了支持,在Android平臺,軟編用OpenH264,軟解用FFmpeg,硬編硬解用MediaCodec。
音頻采樣及編解碼——LPCM 、ADPCM、G711、G726、AAC
最近在查看hi3516a音頻資料部分,遇到一些音頻的專業(yè)術(shù)語,如LPCM 、ADPCM、G711、G726等,故查詢了一些資料,對這幾個術(shù)語進行記錄和總結(jié)。
H.264/AVC視頻編解碼技術(shù)詳解:宏塊的幀間預測解碼
在討論幀內(nèi)預測的章節(jié)中我們已經(jīng)討論過部分宏塊類型的分類。我們知道,對于幀間編碼的宏塊,其劃分方式可以分為兩步,其一為宏塊級劃分,其二為子宏塊級劃分。
H.264/AVC視頻編解碼技術(shù)詳解:參考幀列表
解碼不同的幀類型時,參考幀列表不同。當解碼一個P或SP幀時,使用一個參考幀列表RefPicList0;當解碼一個B幀時,使用兩個參考幀列表RefPicList0和RefPicList1。
FFmpeg 編譯支持AV1編解碼器libaom-av1
AI智能
視頻分割在移動端的算法進展綜述
視頻分割是一項廣泛使用的技術(shù),電影電視特效、短視頻直播等可以用該技術(shù)將場景中的前景從背景中分離出來,通過修改或替換背景,可以將任務設置在現(xiàn)實不存在不存在或不易實現(xiàn)的場景、強化信息的沖擊力。
CVPR2019 | 醫(yī)學影像:MIT 利用學習圖像變換進行數(shù)據(jù)增強
近日,由麻省理工學院(MIT)電子工程與計算機科學(ECCS)實驗室多位博士所著的醫(yī)學影像AI論文被CVPR 2019收錄。該團隊為了解決醫(yī)學圖像標注數(shù)據(jù)缺乏的問題,提出了通過學習圖像的變換(transforms)進行數(shù)據(jù)增強的半監(jiān)督分割方法。
全網(wǎng)最大機器學習數(shù)據(jù)集,視覺、NLP、音頻都在這了
在GTC 2019 上,英偉達展示了一款新的交互應用 GauGAN:利用生成對抗網(wǎng)絡(GAN)將分割圖轉(zhuǎn)換為栩栩如生的圖像。這是繼 PGGAN、StyleGAN 之后,英偉達提出的又一強大方法,相關論文已被 CVPR 2019 接收為 oral 論文。
圖像
深度學習的圖像修復
修復指的是恢復圖像損失的部分并且基于背景信息將它們重建的技術(shù)。它指的是在視覺輸入的指定區(qū)域中填充缺失數(shù)據(jù)的過程。在數(shù)字世界中,它指的是應用復雜算法以替代圖像數(shù)據(jù)中缺失或者損壞部分。
總結(jié)
以上是生活随笔為你收集整理的音视频技术开发周刊 92期的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 周小鹏:努力让FPGA支持更多开源库和框
- 下一篇: 通过端到端的数据侦测提升QoS