當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

音视频技术开发周刊 | 194

發(fā)布時間：2024/4/11 编程问答 77 豆豆

生活随笔收集整理的這篇文章主要介紹了音视频技术开发周刊 | 194 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

每周一期，縱覽音視頻技術(shù)領(lǐng)域的干貨。

新聞投稿：contribute@livevideostack.com。

小提示：鏈接跳轉(zhuǎn)僅支持公眾號相關(guān)鏈接

進入全真互聯(lián)網(wǎng)——音視頻通信的技術(shù)變革

隨著5G和下一代編解碼、傳輸?shù)燃夹g(shù)持續(xù)演進，音視頻通話技術(shù)從低延時到超低延時實時通信快速迭代，越來越多應(yīng)用與服務(wù)遷移至線上，越來越真實無損地還原線下體驗，新的互動方式和場景不斷涌現(xiàn)，從高度數(shù)字化到擬真化再到全真互聯(lián)網(wǎng)時代。本次LiveVideoStackCon 2021上海站我們邀請到了騰訊云副總裁李郁韜來分享音視頻的變革趨勢、演進以及未來。

邊緣計算不“邊緣”——助攻視頻行業(yè)這幾年

隨著邊緣計算行業(yè)的不斷發(fā)展，其業(yè)務(wù)也越來越廣泛，越來越成熟。邊緣計算的發(fā)展歷程并不是一帆風(fēng)順，其運用起來也和傳統(tǒng)云計算有很大不同。那么邊緣計算行業(yè)所面對的挑戰(zhàn)以及未來的發(fā)展是什么樣的呢？有請網(wǎng)心科技的李浩為我們分享他助攻視頻行業(yè)的這幾年。

實時音視頻技術(shù)的演進與應(yīng)用

本次分享我們邀請到了來自騰訊云實時音視頻TRTC后臺的研發(fā)負(fù)責(zé)人薛笛，他向我們分享了騰訊云TRTC在架構(gòu)升級和產(chǎn)品實踐中的經(jīng)驗。仔細(xì)講解了混音引擎最初的制造源、在整個優(yōu)化過程中發(fā)現(xiàn)的問題以及解決方法，為后來做騰訊會議和云呼叫中心打下了一個良好的基礎(chǔ)。

流媒體的安全

本文來自Streaming Video Alliance，在本網(wǎng)絡(luò)研討會中，我們將探討許多可用于阻止直播盜版的技術(shù)，以及視頻發(fā)行商可以用來幫助盡可能減少盜版的一些做法。

談?wù)?WebRTC 的 SDP Unified Plan

今年2月份，webrtc M89 的正式發(fā)布，在Release note 提出了一個重要更新，即廢棄webrtc Plan B SDP 語義，推薦使用標(biāo)準(zhǔn)SDP格式：Unified Plan。WebRTC1.0 已經(jīng)正式成為 W3C 標(biāo)準(zhǔn)，主流瀏覽器基本都支持UnifiedPlan SDP。

WebRTC如何驅(qū)動亞秒級廣播和游戲直播流

本次演講來自Demuxed 2020,主講人是來自蘋果公司開發(fā)人員Sean dubios，他還是Pion WebRTC的創(chuàng)建者。演講主題是WebRTC如何驅(qū)動亞秒級廣播和游戲直播流。

MediaStreamTrack 的可插入流

從現(xiàn)在開始，WebRTC 會有更多的虛擬背景和有趣的面具功能加入。

https://web.dev/mediastreamtrack-insertable-media-processing/

Visionular AV1編碼器針對所有用例進行了優(yōu)化

得益于AOMedia資助的dav1d項目，Visionular確定了AV1可行的用戶方案，可以在其中利用軟件解碼解決方案，這已成為標(biāo)準(zhǔn)和Visionular解決方案發(fā)展的重要基礎(chǔ)。

http://aomedia.org/av1%20adoption/visionular-av1-encoder-optimized/

淺析 XR 關(guān)鍵技術(shù)

擴展現(xiàn)實（XR）實際是一個概括性術(shù)語，囊括了增強現(xiàn)實（AR），虛擬現(xiàn)實（VR），混合現(xiàn)實（MR）以及介于他們之間的所有內(nèi)容。

AR中面部追蹤的基礎(chǔ)淺析

在AR中實現(xiàn)追蹤并不是一件易事，一方面需要擁有更為強大的傳感器，另一方面還需要設(shè)備有足夠的算力。

DeepBlur：一種簡單有效的自然圖像模糊方法

現(xiàn)有的圖像模糊技術(shù)要么容易受到人類或深度學(xué)習(xí)模型的再識別攻擊，要么在保持圖像保真度方面不夠，要么計算量太大，難以實現(xiàn)。為了解決這些問題，我們提出了DeepBlur，這是一種簡單而有效的圖像模糊方法，它通過無條件預(yù)先訓(xùn)練的生成模型的潛在空間進行模糊處理，該模型能夠合成逼真的人臉圖像。

輸入兩張“怪異”圖像，VGG、Inception、ResNet集體翻車，經(jīng)典圖像分類模型有多脆弱？

如果我們對圖像進行一些非常規(guī)操作，比如把豬放在它“不熟悉”的天空環(huán)境中，或者把局部目標(biāo)異常放大，它們還能準(zhǔn)確分類嗎？

Telegram 下個月添加群組視頻通話功能

有無使用 WebRTC？是否支持瀏覽器？據(jù)悉，群組視頻通話將在下個月出現(xiàn)在Telegram的消息平臺上，并被吹捧為一個功能齊全的實現(xiàn)，包括支持基于Web的視頻會議。

https://techcrunch.com/2021/04/28/telegram-to-add-group-video-calls-next-month/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29

VLC發(fā)布3.0.13版本

此次更新包括2處更改，41個添加項和3個刪除項。在多路分配器、編解碼器、使用權(quán)、視頻輸出、接口等方面都做了相應(yīng)的更新或修復(fù)調(diào)整。

https://code.videolan.org/videolan/vlc-3.0/-/blob/master/NEWS

Safari 14.1 的 Webkit 新功能

WebKit中的Web Speech API支持語音合成已有一段時間了。現(xiàn)在，Safari支持與Siri相同的語音引擎支持的語音識別。這意味著Web開發(fā)人員可以享受50多種語言和方言的高質(zhì)量轉(zhuǎn)錄。

https://webkit.org/blog/11648/new-webkit-features-in-safari-14-1/

插圖源自Pexels

The cover from?creativeboom.com

總結(jié)

以上是生活随笔為你收集整理的音视频技术开发周刊 | 194的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：广播IP转型报告：远程制作持续崛起
下一篇：打入硅谷的局外人｜Decode the

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

音视频技术开发周刊 | 194

總結(jié)