音视频技术开发周刊 88期
『音視頻技術開發周刊』由LiveVideoStack團隊出品,專注在音視頻技術領域,縱覽相關技術領域的干貨和新聞投稿,每周一期。點擊『閱讀原文』,瀏覽第88期內容,祝您閱讀愉快。
架構
思科:2022年視頻將占移動通信流量79%
近日,思科發布了視覺網絡指數(VNI)報告,總結并預測了2017-2022年的全球移動數據流量與增長趨勢。報告顯示,到2022視頻將占所有移動數據流量的79%。此前,思科也曾表示到2022年視頻資源將占所有IP流量的82%。
Intel視頻處理與分析技術棧和架構縱覽
面向WebRTC的英特爾協同通信開發套件設計了一個端到端的全流程實時視頻流分析系統,幫助開發者使用極簡的代碼快速實現符合自身需求的高效實時視頻流分析應用。本文來自英特爾開源技術中心研發經理 翟磊在LiveVideoStackCon 2018中的演講,并由LiveVideoStack整理而成。
AI+AR如何提升花椒直播的體驗?
隨著全民直播時代的到來,用戶對視頻質量和創意需求增多,由此產生了視頻增強等技術的巨大需求。360資深技術專家劉洛麒根據360在視頻領域的開發經驗與技術積累,詳細介紹了人工智能在視頻直播中的技術與相關應用。本文來自其在LiveVideoStackCon 2018大會中的演講,并由LiveVideoStack整理而成。
MPEG標準概覽
從MPEG-A到MPEG-V的標準包括59個規范,這些規范擴展了延續了整個30年的MPEG活動。這些標準占MPEG標準的29%。在這段時間內,MPEG標準解決了更多的相同技術:系統(MPEG-B)、視頻(MPEG-C)、音頻(MPEG-D)...
傳輸網絡
5G Americas白皮書—5G開源現狀
5G系統架構已被定義,但部署初期很可能面臨與3G、4G相似的互操作性的挑戰。盡管如此,5G系統架構為移動運營商提供了比前幾代更大的開放性,運營商也需要利用開源原則才能保持和提升市場競爭力。本文概述了5G架構,重點介紹了其開源原則及應用,并探討了這種組合將如何使移動運營商及其客戶受益。
SRT協議
SRT是基于UDT傳輸協議,是用戶級別的協議,其保留UDT的核心思想和機制,但是做了多項改進,包括控制報文的修改,針對直播流改進了流控,改進了擁塞算法,報文加密算法。本文介紹SRT協議本身。
音頻/視頻技術
基于SRT傳輸協議的直播服務
srt_live_server是基于SRT傳輸協議的直播服務,支持MPEG-TS格式的推流,拉流。
從若琪,今天杭州的天氣為例。讓你全面了解什么是語音交互
本文是面向 Web 開發者所寫,介紹關于“語音交互”的一篇科普性質的文章,希望借助這篇文章,讓開發者了解到什么是語音交互,以及YodaOS(https://github.com/yodaos-project/yodaos)中的技術實現。?
SoundTouch與Rubber Band Library變聲算法對比與ASR結果分析
常用的開源變聲算法有SoundTouch 和Rubber Band Library。其中 SoundTouch是一款用C++編寫的開源的音頻處理庫,可以改變音頻文件或實時音頻流的節拍(Tempo)、音調(Pitch)、回放率(Playback Rates)......
編解碼
H.264 中的 NAL 技術
NAL 全稱 Network Abstract Layer,即網絡抽象層。在 H.264/AVC 視頻編碼標準中,整個系統框架被分為 了兩個層面:視頻編碼層面(VCL)和網絡抽象層面(NAL)。
iOS硬解碼H264視頻流
蘋果在iOS 8.0系統之前若要做音視頻開發需使用第三方軟件進行編解碼(FFmpeg軟解碼H264視頻流可看到這里),學習成本較大,項目開發進度也可能超出預期。在iOS 8.0之后開放了視頻編解碼框架VideoToolbox,在此之后對于音視頻開發變得相對簡單。
壓縮效率比H.265更高,揭秘騰訊無線投屏背后的屏幕編碼技術
本文將給大家揭秘騰訊無線投屏背后的屏幕編碼技術(Tencent Screen Encoder,以下簡稱TSE),對于屏幕內容圖像,TSE相比x265(normal模式),壓縮效率提升55%。
小視頻app開發過程中的兩種編碼標準
對于大多數直播平臺來講,帶寬構成了其成本的絕大部分。而對于短視頻平臺來講,帶寬成本所占的比例可能會更高。在小視頻app開發過程中,經常會遇到各種各樣的問題,再加上4k、6k視頻及5G即將到來,帶寬成本也會隨之增加。為了解決高昂的帶寬成本,節省帶寬成了眾多短視頻平臺的首要任務,而視頻編碼標準的選取也將會間接影響帶寬成本。常用的視頻編碼標準有H.264和H.265兩種。
安卓硬解碼H264播放器的實現
直播功能應用非常廣泛:除開一般的直播App,遠程教育、遠程會議、視頻聊天、甚至是簡易的手機家庭監視器、蔬菜大棚監控都需要使用相關的技術,至于直播功能的子集——游戲語音聊天,AAC編解碼的使用場景就更加廣泛了。
H264視頻--x264編解碼原理詳解
H264編碼原理:首先對每一幀圖像進行宏塊劃分,有不同的劃分方式,然后對相鄰圖像進行分組。在這樣一組幀中,經過編碼后,我們只保留第一帖的完整數據,其它幀都通過參考上一幀計算出來。
AI智能
MWC2019最全AR/VR匯總:HoloLens 2來襲,5G云VR火爆
毫無疑問,今年的MWC依然是5G技術集中展示的天堂,與去年相比今年5G應用演示更豐富,5G終端包括手機、CPE等也越來越多。與此同時,本屆MWC微軟發布了重磅的HoloLens 2混合現實頭顯,同時HTC帶來Vive Focus Plus,雖然AR/VR新品不多,但技術總是在進步。接下來,我們就來匯總一下MWC 2019中AR/VR新產品、新應用。
face.evoLVe:高性能人臉識別開源庫,內附高能模型
目前人臉識別開源項目眾多,但真正能方便快捷拿來就用、性能指標業界領先的開源庫并不多,而最近剛剛開源的face.evoLVe絕對是不容忽視的力量。
機器學習中的編碼器-解碼器結構哲學
機器學習中體現著各種工程和科學上的哲學思想,大的有集成學習,沒有免費午餐,奧卡姆剃刀;小的有最大化類間差異、最小化類內差異。對于很多問題,存在著一類通行的解決思路,其中的一個典型代表就是“編碼器-解碼器”結構。這一看似簡單的結構,背后蘊含的工程思想卻非常值得我們學習和品味。
純Deep Learning干貨 | 快慢網絡用于視頻識別
該技術是由何愷明等人提出的,主要用于視頻識別的SlowFast網絡,提出要分開處理空間結構和時間事件。該網絡模型在視頻動作分類及檢測方面性能很強大,在沒有使用任何預訓練的情況下,在Kinetics數據集上實現了當前最好的性能水平,在AVA動作檢測數據集上也實現了28.3mAP的當前最優異性能表現。
圖像
Android色彩矩陣處理圖像
Android中對于圖片的處理,最常使用到的數據結構是位圖——Bitmap,它包含了一張圖片所有的數據。這個數據都是由點陣和顏色值組成的,所謂點陣就是一個包含像素的矩陣,每一個元素對應著圖片的一個像素。
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的音视频技术开发周刊 88期的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Mozilla发布最大公共语音数据集Co
- 下一篇: Smooth Delivery:如何减少