音视频技术开发周刊 92期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第92期內容,祝您閱讀愉快。
架構
從通信到AI FreeSWITCH與WebRTC
FreeSWITCH是一個開源的軟交換平臺,具有模塊化結構,支持包括WebRTC在內的多種互通互聯。本文來自FreeSWITCH 中文社區創始人杜金房在LiveVideoStack線上交流分享中的演講,詳細介紹了FreeSWITCH的功能特性、架構以及現狀。
如何利用免版稅視頻流技術構建優質視頻體驗?
隨著全行業及消費者對版權技術的越發重視,如何利用免版稅技術在不受專利限制的影響下提供高質量的在線視頻服務,成為當前所面臨的最大難題。Mux流媒體專家Phil Cluff總結了其在探索免版稅視頻流技術過程中所做的一些工作。
SRS-開源流媒體服務器
SRS定位是運營級的互聯網直播服務器集群,追求更好的概念完整性和最簡單實現的代碼。SRS提供了豐富的接入方案將RTMP流接入SRS。
三體云周思進:在紅海中尋找藍海
時隔一年,三體云CEO周思進再次接受了LiveVideoStack的采訪,他說“寒冬”對企業思考商業本質是件好事,5G、AI、IoT這些藍海本質上都是紅海,關鍵在于企業能否把紅海變藍。
WebRTC 之ICE淺談
隨著WebRTC的應用越來越普遍,無論是Native端還是Web端,由于廣泛的適應能力以及對未來網絡的支持,ICE作為一種綜合的解決方案將有著非常廣闊的應用前景。
Web 實時推送技術的總結
隨著 Web 的發展,用戶對于 Web 的實時推送要求也越來越高 ,比如,工業運行監控、Web 在線通訊、即時報價系統、在線游戲等,都需要將后臺發生的變化主動地、實時地傳送到瀏覽器端,而不需要用戶手動地刷新頁面。本文對過去和現在流行的 Web 實時推送技術進行了比較與總結。
傳輸網絡
范醒哲:5G時代是時候全面解決TCP的效率問題了
本文由LiveVideoStack對Cascade Range Networks CTO/聯合創始人范醒哲的郵件采訪整理而成,作為一名研究UDP和TCP十多年的老兵,范醒哲剖析了UDP與TCP的優勢與不足,并預測了5G將帶來的網絡協議與應用變革。
音頻/視頻技術
質量三維論如何持續推進騰訊視頻播放體驗提升
騰訊視頻移動端播放內核技術負責人李大龍在LiveVideoStackCon2018上的演講中分享了騰訊視頻的質量“三維論”思想與體系,及以此推動視頻播放體驗優化工作方面的實踐經驗與總結。
擁塞控制(Congestion Control)算法匯總+ 大牛
作為一名擁塞控制算法研究應用的工程人員,自然少不了對各種算法論文,原理的閱讀和研究。作為興趣和總結,本文嘗試羅列自己看過的擁塞控制算法,并繼續探索相關論文作者的信息,學習作者更多的研究。
MPEG系統層回顧
MPEG因為其視頻和音頻編碼標準被人們所熟知,但是如果沒有系統部分,MPEG就不會是現在的樣子。
Android端的短視頻開發,我們該如何快速實現移動端短視頻功能?
優質短視頻內容的產生依賴于短視頻的采集和特效編輯,這就要求在進行抖音APP開發時,用到基礎的美顏、混音、濾鏡、變速、圖片視頻混剪、字幕等功能,在這些功能基礎上,進行預處理,結合OpenGL、AI、AR技術,產生很多有趣的動態貼紙玩法,使得短視頻內容更具創意。
語音相似度打分技術說明
語音相似度打分模塊主要應用于語音監控設備和報警裝置,目前更多適用于工廠設備的實時監控,作為視頻監控的輔助,具有低成本,準確率高,容易實現等特點。同時語音相似度打分模塊也可以應用在教育領域,輔助學生提升口語能力,模仿標準口音說話,例如在普通話發音不標準的地區,做到實時監測實時校正。
編解碼
通過WebAssembly在移動端解碼H.265
本文詳細介紹了如何通過WebAssembly在移動Web端實現H.265解碼,既享受到了H.265更高的編碼效率,又實現了在多種移動端瀏覽器上兼容。未來,通過WebAssembly還可能實現對AV1等新一代Codec的支持。
WebRTC Android H264編解碼適配
自從Cisco宣布旗下的H264 Codec開源為OpenH264,并且替所有OpenH264的使用者支付了H264的專利費,WebRTC也隨隨對H264進行了支持,在Android平臺,軟編用OpenH264,軟解用FFmpeg,硬編硬解用MediaCodec。
音頻采樣及編解碼——LPCM 、ADPCM、G711、G726、AAC
最近在查看hi3516a音頻資料部分,遇到一些音頻的專業術語,如LPCM 、ADPCM、G711、G726等,故查詢了一些資料,對這幾個術語進行記錄和總結。
H.264/AVC視頻編解碼技術詳解:宏塊的幀間預測解碼
在討論幀內預測的章節中我們已經討論過部分宏塊類型的分類。我們知道,對于幀間編碼的宏塊,其劃分方式可以分為兩步,其一為宏塊級劃分,其二為子宏塊級劃分。
H.264/AVC視頻編解碼技術詳解:參考幀列表
解碼不同的幀類型時,參考幀列表不同。當解碼一個P或SP幀時,使用一個參考幀列表RefPicList0;當解碼一個B幀時,使用兩個參考幀列表RefPicList0和RefPicList1。
FFmpeg 編譯支持AV1編解碼器libaom-av1
AI智能
視頻分割在移動端的算法進展綜述
視頻分割是一項廣泛使用的技術,電影電視特效、短視頻直播等可以用該技術將場景中的前景從背景中分離出來,通過修改或替換背景,可以將任務設置在現實不存在不存在或不易實現的場景、強化信息的沖擊力。
CVPR2019 | 醫學影像:MIT 利用學習圖像變換進行數據增強
近日,由麻省理工學院(MIT)電子工程與計算機科學(ECCS)實驗室多位博士所著的醫學影像AI論文被CVPR 2019收錄。該團隊為了解決醫學圖像標注數據缺乏的問題,提出了通過學習圖像的變換(transforms)進行數據增強的半監督分割方法。
全網最大機器學習數據集,視覺、NLP、音頻都在這了
在GTC 2019 上,英偉達展示了一款新的交互應用 GauGAN:利用生成對抗網絡(GAN)將分割圖轉換為栩栩如生的圖像。這是繼 PGGAN、StyleGAN 之后,英偉達提出的又一強大方法,相關論文已被 CVPR 2019 接收為 oral 論文。
圖像
深度學習的圖像修復
修復指的是恢復圖像損失的部分并且基于背景信息將它們重建的技術。它指的是在視覺輸入的指定區域中填充缺失數據的過程。在數字世界中,它指的是應用復雜算法以替代圖像數據中缺失或者損壞部分。
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 92期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 周小鹏:努力让FPGA支持更多开源库和框
- 下一篇: 通过端到端的数据侦测提升QoS