音视频技术开发周刊 | 194
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
小提示:鏈接跳轉僅支持公眾號相關鏈接
進入全真互聯網——音視頻通信的技術變革
隨著5G和下一代編解碼、傳輸等技術持續演進,音視頻通話技術從低延時到超低延時實時通信快速迭代,越來越多應用與服務遷移至線上,越來越真實無損地還原線下體驗,新的互動方式和場景不斷涌現,從高度數字化到擬真化再到全真互聯網時代。本次LiveVideoStackCon 2021上海站我們邀請到了騰訊云副總裁李郁韜來分享音視頻的變革趨勢、演進以及未來。
邊緣計算不“邊緣”——助攻視頻行業這幾年
隨著邊緣計算行業的不斷發展,其業務也越來越廣泛,越來越成熟。邊緣計算的發展歷程并不是一帆風順,其運用起來也和傳統云計算有很大不同。那么邊緣計算行業所面對的挑戰以及未來的發展是什么樣的呢?有請網心科技的李浩為我們分享他助攻視頻行業的這幾年。
實時音視頻技術的演進與應用
本次分享我們邀請到了來自騰訊云實時音視頻TRTC后臺的研發負責人薛笛,他向我們分享了騰訊云TRTC在架構升級和產品實踐中的經驗。仔細講解了混音引擎最初的制造源、在整個優化過程中發現的問題以及解決方法,為后來做騰訊會議和云呼叫中心打下了一個良好的基礎。
流媒體的安全
本文來自Streaming Video Alliance,在本網絡研討會中,我們將探討許多可用于阻止直播盜版的技術,以及視頻發行商可以用來幫助盡可能減少盜版的一些做法。
談談 WebRTC 的 SDP Unified Plan
今年2月份,webrtc M89 的正式發布,在Release note 提出了一個重要更新,即廢棄webrtc Plan B SDP 語義,推薦使用標準SDP格式:Unified Plan。WebRTC1.0 已經正式成為 W3C 標準,主流瀏覽器基本都支持UnifiedPlan SDP。
WebRTC如何驅動亞秒級廣播和游戲直播流
本次演講來自Demuxed 2020,主講人是來自蘋果公司開發人員Sean dubios,他還是Pion WebRTC的創建者。演講主題是WebRTC如何驅動亞秒級廣播和游戲直播流。
MediaStreamTrack 的可插入流
從現在開始,WebRTC 會有更多的虛擬背景和有趣的面具功能加入。
https://web.dev/mediastreamtrack-insertable-media-processing/
Visionular AV1編碼器針對所有用例進行了優化
得益于AOMedia資助的dav1d項目,Visionular確定了AV1可行的用戶方案,可以在其中利用軟件解碼解決方案,這已成為標準和Visionular解決方案發展的重要基礎。
http://aomedia.org/av1%20adoption/visionular-av1-encoder-optimized/
淺析 XR 關鍵技術
擴展現實(XR)實際是一個概括性術語,囊括了增強現實(AR),虛擬現實(VR),混合現實(MR)以及介于他們之間的所有內容。
AR中面部追蹤的基礎淺析
在AR中實現追蹤并不是一件易事,一方面需要擁有更為強大的傳感器,另一方面還需要設備有足夠的算力。
DeepBlur:一種簡單有效的自然圖像模糊方法
現有的圖像模糊技術要么容易受到人類或深度學習模型的再識別攻擊,要么在保持圖像保真度方面不夠,要么計算量太大,難以實現。為了解決這些問題,我們提出了DeepBlur,這是一種簡單而有效的圖像模糊方法,它通過無條件預先訓練的生成模型的潛在空間進行模糊處理,該模型能夠合成逼真的人臉圖像。
輸入兩張“怪異”圖像,VGG、Inception、ResNet集體翻車,經典圖像分類模型有多脆弱?
如果我們對圖像進行一些非常規操作,比如把豬放在它“不熟悉”的天空環境中,或者把局部目標異常放大,它們還能準確分類嗎?
Telegram 下個月添加群組視頻通話功能
有無使用 WebRTC?是否支持瀏覽器?據悉,群組視頻通話將在下個月出現在Telegram的消息平臺上,并被吹捧為一個功能齊全的實現,包括支持基于Web的視頻會議。
https://techcrunch.com/2021/04/28/telegram-to-add-group-video-calls-next-month/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29
VLC發布3.0.13版本
此次更新包括2處更改,41個添加項和3個刪除項。在多路分配器、編解碼器、使用權、視頻輸出、接口等方面都做了相應的更新或修復調整。
https://code.videolan.org/videolan/vlc-3.0/-/blob/master/NEWS
Safari 14.1 的 Webkit 新功能
WebKit中的Web Speech API支持語音合成已有一段時間了。現在,Safari支持與Siri相同的語音引擎支持的語音識別。這意味著Web開發人員可以享受50多種語言和方言的高質量轉錄。
https://webkit.org/blog/11648/new-webkit-features-in-safari-14-1/
插圖源自Pexels
The cover from?creativeboom.com
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 194的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 广播IP转型报告:远程制作持续崛起
- 下一篇: 打入硅谷的局外人|Decode the