边缘计算架构如何融合视频编码与存储
生活随笔
收集整理的這篇文章主要介紹了
边缘计算架构如何融合视频编码与存储
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
NETINT是一家在高性能存儲和視頻編碼領域擁有多項世界前沿技術的芯片設計公司,在上海、溫哥華、多倫多三地設有研發中心。NETINT公司的CodensityTM系列和EdgeFusionTM系列芯片和產品為云數據中心和邊緣計算場景提供了顛覆性的超高密度視頻轉碼和存儲解決方案。本文來自NETINT公司的聯合創始人兼COO 劉偉在LiveVideoStackCon2019北京站上的精彩分享。文 / 劉偉整理 / LiveVideoStackNETINT是一家在高性能存儲和視頻編碼領域擁有前沿技術的芯片設計公司,在上海、溫哥華、多倫多三地設有研發中心,并且有將近一百名資深研發工程師。經過了四年的研發NETINT擁有了世界上第一款可計算存儲架構的融合存儲功能和視頻編解碼功能的SoC芯片,這款芯片正式通過了PCIe SIG的認證測試,是世界上第一款支持PCIe 4.0接口的高性能芯片,在這項技術上,NETINT要遠超其它芯片公司。今天主要想和大家分享5G爆發的前提下,邊緣計算場景中對于視頻的各種應用有什么樣的機會和挑戰,通過NETINT自身的案例出發,與大家一起交流和討論如何推進市場的發育和成長。1. 市場趨勢上圖中摘要的內容我相信大家在其他會議上都看過很多次,在整個互聯網流量中,到2022年為止會有82%的流量是基于IP視頻的流量,未來很長一段時間內,與視頻業務相關的內容都會得到急劇的增長,比如直播到2022年預計會有15倍以上的增長,也包括長視頻點播、短視頻以及其他創新型應用,各種各樣不斷新涌現的應用和爆款場景也在推動用戶對視頻內容和質量的上升。
在最開始關注游戲直播時,當時有很多人稱720P為高清,結果很快這個標準就被推升到1080P,目前在Twitch上1080P 60幀每秒的直播到處都是,不僅僅是在手機、平板等移動設備上,將其投在客廳的4K電視上會帶給用戶非常好的體驗,但這也只是開始。Twitch當前也在經歷每幾個月就翻一番的發展速度,同樣的情況也發生在中國,這種需求增長會不斷推動系統架構和業務形態的創新,以求解決上述問題。1.1 基于中心式編解碼的架構缺陷上圖是從視頻源到編解碼處理單元、并通過CDN傳輸的多個顯示設備的一個簡要的直播流程。編解碼器把高分辨率的視頻依據不同用戶需求轉成不同的分辨率大小,同時也會進行H.264和H.265之間不同的變換,并通過CDN發送給不同的用戶顯示設備。編解碼單元在系統中可以有不同的集成位置,對于比較大型的云視頻公司會放在系統內部,CDN在外部只負責傳輸;同時,也有一部分云視頻公司會選擇把所有業務都外包給CDN網絡提供商,由它來負責視頻傳輸和轉換工作?;跀祿行牡奶幚矸绞骄哂幸欢▋瀯莸耐瑫r也存在很大的缺點。首先一個優點是第一次資本采購的支出會比較小,可以充分利用現有空閑的CPU時間進行轉碼和編碼的各種運算。然而這樣的架構會使日常運行的費用非常的高。視頻編解碼,尤其是編碼對CPU的消耗非常的高,對于直播場景來說,頭部內容占比不到10%,其他絕大部分的內容由于熱度不夠,都采用云轉碼來實現會造成很大的資源浪費。另外從視頻源的產生到云中心再到觀看者之前的數據鏈路非常長,容易造成視頻質量變化,這對于客戶的體驗是一個比較大的挑戰。而隨著視頻分辨率的不斷增加和其他創新型應用的出現,云中心的數據處理壓力變得越來越大,當達到服務器峰值的時候可能會出現沒有資源可再分配的情況,為了實現5%的增益可能會付出40%-50%的成本,更為嚴重的是,系統資源成為約束業務進一步增長的瓶頸,這對于競爭日趨激烈的視頻相關產業而言,是大家都無法接受的一個情況。傳統上內容為了照顧到不同的顯示設備和生態會大量采用H.264,隨著更高分辨率的內容出現,對于更新型的內容應用,大家都更多采用VP9和H.265,也有不少公司在籌劃未來的AV1。從4K內容開始,到8K等高端內容出現時,H.264將會成為過去式。新型Codec編碼需求對算力來說也有很大的挑戰,以H.264到H.265變化舉例,1080P 30幀每秒的視頻編碼消耗H.265是H.264的3-4倍,對于場景比較復雜的視頻,編碼難度更高,經常要額外預留50%的算力來防止質量抖動,這些都加劇了中心式編解碼的架構壓力。2. 邊緣計算架構當前越來越多的公司把目光都轉向了邊緣計算架構。5G的高速和其它新穎特性帶來很多系統架構創新的機會。人們一方面在5G環境下想充分利用它的高帶寬,但又不想付出太多的成本的,很多人對邊緣計算架構抱有很大的期待??傮w而言,邊緣計算把內容的產生和處理和消費靠的越近,就越能提升用戶的體驗,提高QoE的值。對于與會大家關心的內容而言,通過邊緣計算進行視頻處理可以達到更實時的效果,大家可以實現一些之前沒辦法做到的事情,進入新穎的低延遲場景。將邊緣云計算打造成云數據中心,并不是孤立的新創立的邊緣節點,而是云的計算力向下沉到邊緣節點的實例。2.1 視頻邊緣計算的典型用例在5G條件下哪一部分將成為下一個爆款應用,這個問題需要結合現有經驗去看未來,雖然不是很準確,但可以斷定下一個爆款應用一定是與視頻相關。與視頻相關可以大概分為Edge CDN for video on demand、User generatedLive Video、AR/VR、Cloud Gaming、Analytics at Edge和Autonomous Car data Edgestorage六個部分。2.2 用例1:邊緣計算上圖是簡化后的一個從云數據中心到區域型數據中心最后到Edge型數據中心的分布,無論數據源在哪里都要推送到數據中心進行編解碼和處理,然后通過區域型數據中心和邊緣數據節點送達到顯示設備上。但對于很多場景下的長尾內容或是特殊事件,很多時候內容本身都有很強的區域性的特點,對于這樣視頻的處理完全沒必要返回數據中心。而利用邊緣計算節點進行就近及時處理,并在本地進行視頻內容的消費,是更優化的方式。還有一種應用是關于視頻監控的。視頻監控在國內發展的非???#xff0c;但在具體實施上其實有很多值得詬病的地方,比如一個小區有一套監控系統,數據基本存儲在本地,從架構上來看其實是一個個的數據孤島,沒辦法對內容進行進一步的分析和處理。現在有越來越多的廠商開始基于云架構的監控,現場只負責采集,所有采集的數據都實時上傳到云進行處理,并可以在不同終端查看監控數據。但這種方法也存在一定的弊端,比如一枚1080P的攝像頭放置在一個較為活躍的場景下,每月產生的數據量會達到300GB,成千上萬攝像頭對成本和帶寬消耗都是非常驚人的。利用邊緣計算模式來處理視頻監控內容是最受關注的發展之一。另外利用在邊緣節點進行計算的低延遲特性,可以促進高互動視頻內容的生產和消費,比如VR/AR就屬于這種性質。有了低延遲和實時芯片級別的處理能力,從內容產生到用戶消費反饋再到新一輪內容的產生,整個過程控制在20ms以內,這個數據已經過了VR眩暈的闕值,在20ms內基本不容易產生眩暈感,VR和AR技術的再一次火爆也就指日可待。2.3 用例2:邊緣CDN在VOD場景中,可以借鑒NETFLIX公開的技術文檔,他們的數據不是全部存儲在云數據中心,然后通過CDN傳輸視頻,而是在全球建立了兩萬多個分布式的區域數據中心,將內容按照區域特征和流行統計,在非繁忙時刻把數據提前下載到區域數據中心進行分發,通過這一方式NETFLIX節省了95%的帶寬?,F在有了邊緣計算,可以將帶寬節省做得更加極致,從區域型數據中心下沉到邊緣節點,存儲的分配會更加智能,帶寬會得到更大程度的減少。2.4 用例3:邊緣編碼和存儲-MEC和Edge端Open Cache對于CDN廠商來說,現在是5G發展的關鍵時間點,大家都在布局新一代的CDN網絡。在這個背景下,電信運營商或CDN廠商不再僅扮演傳統數據通道的角色,在5G條件下,可以將數據下載到邊緣數據中心,建立一個開放式的邊緣計算節點,并通過這個節點將所有算力虛擬化,提供開放的接口給不同的云公司來訂購服務,在同樣的CDN邊緣節點當中,以與視頻相關的角度來看,不僅僅是傳統的catch部分工作,還包含更多的大文件存儲。
另外視頻編解碼能力也會下放到邊緣數據中心,當然AI和其他數據分析的內容也是必不可少的。通過這種方式就可以讓整個邊緣節點(數據中心)算力得到巨大的發展。邊緣計算與云數據中心、區域數據中心相結合的架構,大量的數據發生和處理在本地進行,終端到云的訪問次數將減少80%左右。邊緣計算的優點很多,但并不是所有的企業都能投入這么大的資本去在全球部署節點。有了開放式的邊緣計算節點,客戶就可以從運營商處訂他們所提供的虛擬邊緣節點計算功能,僅需在有需要時,比如在有熱點內容出現時,可以臨時訂購邊緣節點的計算功能,很多廠商都預期這種部署可以在一分鐘內完成。3. 云視頻監控處理正在走向邊緣上圖是之前提到的智慧城市中兩種不同的處理方式,監控不再是之前各個私有的小區型監控,都是在本地采集數據同步到數據中心,而這一步也分為兩種處理方式,一種是把視頻內容直接采集發送到中央數據庫,另一種是通過邊緣節點的方式。對于邊緣計算的處理方式就顯得靈活很多,可以在靠近視頻產生的邊緣節點建立視頻處理分析的能力,在此對視頻內容進行快速的抽幀分析分析、存儲,只把分析出的時間、警報的mate data傳送給中央的數據中心,這樣做絕大部分的數據流都會被節省下來。3.1 視頻監控工作流程具體到服務內部,上圖是NETINT建議的一種方式,由攝像頭所產生的數據輸入到邊緣服務器之后,首先會對數據進行H.264、H.265的解碼,抽幀并發送YUV數據給服務器,在服務器端可以對YUV數據進行基于人工智能的處理分析、圖像增強并提取其它有價值的信息。在此之后SSD可以做很高速的cache,或者把處理過的YUV數據發回編碼器進行二次編碼來優化分辨率,碼率或轉碼成為另外的codec,在邊緣節點進行長期的保存,而不用上傳到云中心。另外在此插入了一個NETINT在北美的實際應用案例: 我們有一個為視頻監控內容進行增值服務的客戶,他們可以拿到全美國的交通視頻監控內容,在拿到實時視頻后,他們對攝像頭產生的視頻內容進行H.265二次高效轉碼,并利用直播的技術將視頻內容實時提供給全美快速響應的團隊。借助NETINT基于自研芯片的高效視頻轉碼能力,客戶實現了非常可觀的社會和經濟效益。3.2 基于ASIC的編碼如果想在邊緣節點實現上述這些功能其實會有很多挑戰,首先邊緣節點的數據機房是無人值守的,其中的工作要做到非常穩定、非常高效、以及盡量低的功耗。這樣的要求只有芯片級別的解決方案可以做到。用戶不可能在每個節點插入很多個GPU,除去昂貴的服務器成本、電費的成本,占用大量的機架空間之外,其工作中產生的熱量也是很難解決的一個工程問題。在此我們也也粗淺比較了一下以NETINT基于自研SoC的編解碼和傳統CPU、GPU、FPGA的不同特點?;赟oC芯片的編解碼功耗最低且效率最高,在質量上也有特定的優勢。更為獨特的是,NETINT這款轉碼產品其實是以SSD的形態出現,可以充分利用現有存儲服務器的資源,非常易于安裝和維護。3.3 可計算存儲:在SSD當中進行視頻處理NETINT有兩款芯片,一款是專注視頻的編解碼芯片,另一款是PCle 4.0 NVMe SSD Controller芯片,NETINT也分別開發出了板卡級的產品。兩者的形態都是SSD硬盤,只要有PCle接口就可以即插即用。在八月初NETINT還發布了最新的EdgeFusion系列產品,能夠將上述兩款芯片的功能結合在一起,在功能更強大的同時形態保持不變。3.4 視頻轉碼和存儲NETINT芯片的架構圖
3.5 關于服務器存儲架構談到服務器存儲架構,NETINT所做的產品是通過標準的NVMe接口,以SSD硬盤的形式出現,可以在現有的標準服務器當中做到即插即用,一個1U的標準服務器不需進行任何定制改造就可以插10張卡,2U的標準服務器可以插24張卡。由于所有的編解碼能力是由NETINT芯片完成,CPU不參與編解碼,也就不再是整個系統的性能瓶頸。只需插入更多的轉碼卡,就能實現編解碼能力的線性增長。3.6 下一代前沿架構除了服務器內部,NETINT也在與前沿客戶討論如何在機架級別做Scaling-out,上圖是一個典型的機架,最上端為Switch,在機架內部還連接有一些計算節點,再往下是基于NVMe-oF的存儲節點,最后是基于NVMe-oF/ Video Codec節點。這些Video Codec的服務器節點包含Fabric Port和PCle Switch,而PCle Switch連接著一定數量的T480模塊,只需在機架上插入一個這樣的Video Codec 節點就就具備了36或24 個4Kp60幀的編解碼能力。而且通過NVMe-oF的高速接口進行連通,對于服務器和應用看到的內容都相當于存在本地,在性能方面沒有任何的瓶頸。這樣的架構在目前來看還比較前沿,需要一定時間的繼續推進以及與客戶的磨合后才能進行推廣。3.7 Codensity軟件集成關于軟件部分,NETINT的軟件可以做到與FFmpeg無縫結合,NETINT所做的工作是提供一個庫,將庫提供給客戶之后只需要重新編譯FFmpeg就可以直接使用,客戶現有基于FFmpeg的工作流完全不用變化,與硬件一樣具有即插即用的特性。3.8 Virtual Machines和Containers支持對于真正的生產環境來說,大家都是通過VM或者容器來做。NETINT的轉碼卡是在SSD存儲的架構上設計的,因此對于VM和容器的支持有著非常好的基礎,并可以支持以下幾種方式。使用Device-passthrough模式,NETINT將T408作為一個整體提供給VM或容器,一個VM或容器可以連接一個或多個卡。另外也可以使用在存儲方面應用比較多的SR-IOV技術來進行虛擬化,這樣就可以做更細粒度的分配,通過SR-IOV可以把SSD和不同的轉碼實例分配不同的的namespace,這樣可以使每一個VM連接不同的instance,能夠在更細粒度上進行虛擬化和應用,對靈活分配算力和運維來說是比較有效的技術。
在最開始關注游戲直播時,當時有很多人稱720P為高清,結果很快這個標準就被推升到1080P,目前在Twitch上1080P 60幀每秒的直播到處都是,不僅僅是在手機、平板等移動設備上,將其投在客廳的4K電視上會帶給用戶非常好的體驗,但這也只是開始。Twitch當前也在經歷每幾個月就翻一番的發展速度,同樣的情況也發生在中國,這種需求增長會不斷推動系統架構和業務形態的創新,以求解決上述問題。1.1 基于中心式編解碼的架構缺陷上圖是從視頻源到編解碼處理單元、并通過CDN傳輸的多個顯示設備的一個簡要的直播流程。編解碼器把高分辨率的視頻依據不同用戶需求轉成不同的分辨率大小,同時也會進行H.264和H.265之間不同的變換,并通過CDN發送給不同的用戶顯示設備。編解碼單元在系統中可以有不同的集成位置,對于比較大型的云視頻公司會放在系統內部,CDN在外部只負責傳輸;同時,也有一部分云視頻公司會選擇把所有業務都外包給CDN網絡提供商,由它來負責視頻傳輸和轉換工作?;跀祿行牡奶幚矸绞骄哂幸欢▋瀯莸耐瑫r也存在很大的缺點。首先一個優點是第一次資本采購的支出會比較小,可以充分利用現有空閑的CPU時間進行轉碼和編碼的各種運算。然而這樣的架構會使日常運行的費用非常的高。視頻編解碼,尤其是編碼對CPU的消耗非常的高,對于直播場景來說,頭部內容占比不到10%,其他絕大部分的內容由于熱度不夠,都采用云轉碼來實現會造成很大的資源浪費。另外從視頻源的產生到云中心再到觀看者之前的數據鏈路非常長,容易造成視頻質量變化,這對于客戶的體驗是一個比較大的挑戰。而隨著視頻分辨率的不斷增加和其他創新型應用的出現,云中心的數據處理壓力變得越來越大,當達到服務器峰值的時候可能會出現沒有資源可再分配的情況,為了實現5%的增益可能會付出40%-50%的成本,更為嚴重的是,系統資源成為約束業務進一步增長的瓶頸,這對于競爭日趨激烈的視頻相關產業而言,是大家都無法接受的一個情況。傳統上內容為了照顧到不同的顯示設備和生態會大量采用H.264,隨著更高分辨率的內容出現,對于更新型的內容應用,大家都更多采用VP9和H.265,也有不少公司在籌劃未來的AV1。從4K內容開始,到8K等高端內容出現時,H.264將會成為過去式。新型Codec編碼需求對算力來說也有很大的挑戰,以H.264到H.265變化舉例,1080P 30幀每秒的視頻編碼消耗H.265是H.264的3-4倍,對于場景比較復雜的視頻,編碼難度更高,經常要額外預留50%的算力來防止質量抖動,這些都加劇了中心式編解碼的架構壓力。2. 邊緣計算架構當前越來越多的公司把目光都轉向了邊緣計算架構。5G的高速和其它新穎特性帶來很多系統架構創新的機會。人們一方面在5G環境下想充分利用它的高帶寬,但又不想付出太多的成本的,很多人對邊緣計算架構抱有很大的期待??傮w而言,邊緣計算把內容的產生和處理和消費靠的越近,就越能提升用戶的體驗,提高QoE的值。對于與會大家關心的內容而言,通過邊緣計算進行視頻處理可以達到更實時的效果,大家可以實現一些之前沒辦法做到的事情,進入新穎的低延遲場景。將邊緣云計算打造成云數據中心,并不是孤立的新創立的邊緣節點,而是云的計算力向下沉到邊緣節點的實例。2.1 視頻邊緣計算的典型用例在5G條件下哪一部分將成為下一個爆款應用,這個問題需要結合現有經驗去看未來,雖然不是很準確,但可以斷定下一個爆款應用一定是與視頻相關。與視頻相關可以大概分為Edge CDN for video on demand、User generatedLive Video、AR/VR、Cloud Gaming、Analytics at Edge和Autonomous Car data Edgestorage六個部分。2.2 用例1:邊緣計算上圖是簡化后的一個從云數據中心到區域型數據中心最后到Edge型數據中心的分布,無論數據源在哪里都要推送到數據中心進行編解碼和處理,然后通過區域型數據中心和邊緣數據節點送達到顯示設備上。但對于很多場景下的長尾內容或是特殊事件,很多時候內容本身都有很強的區域性的特點,對于這樣視頻的處理完全沒必要返回數據中心。而利用邊緣計算節點進行就近及時處理,并在本地進行視頻內容的消費,是更優化的方式。還有一種應用是關于視頻監控的。視頻監控在國內發展的非???#xff0c;但在具體實施上其實有很多值得詬病的地方,比如一個小區有一套監控系統,數據基本存儲在本地,從架構上來看其實是一個個的數據孤島,沒辦法對內容進行進一步的分析和處理。現在有越來越多的廠商開始基于云架構的監控,現場只負責采集,所有采集的數據都實時上傳到云進行處理,并可以在不同終端查看監控數據。但這種方法也存在一定的弊端,比如一枚1080P的攝像頭放置在一個較為活躍的場景下,每月產生的數據量會達到300GB,成千上萬攝像頭對成本和帶寬消耗都是非常驚人的。利用邊緣計算模式來處理視頻監控內容是最受關注的發展之一。另外利用在邊緣節點進行計算的低延遲特性,可以促進高互動視頻內容的生產和消費,比如VR/AR就屬于這種性質。有了低延遲和實時芯片級別的處理能力,從內容產生到用戶消費反饋再到新一輪內容的產生,整個過程控制在20ms以內,這個數據已經過了VR眩暈的闕值,在20ms內基本不容易產生眩暈感,VR和AR技術的再一次火爆也就指日可待。2.3 用例2:邊緣CDN在VOD場景中,可以借鑒NETFLIX公開的技術文檔,他們的數據不是全部存儲在云數據中心,然后通過CDN傳輸視頻,而是在全球建立了兩萬多個分布式的區域數據中心,將內容按照區域特征和流行統計,在非繁忙時刻把數據提前下載到區域數據中心進行分發,通過這一方式NETFLIX節省了95%的帶寬?,F在有了邊緣計算,可以將帶寬節省做得更加極致,從區域型數據中心下沉到邊緣節點,存儲的分配會更加智能,帶寬會得到更大程度的減少。2.4 用例3:邊緣編碼和存儲-MEC和Edge端Open Cache對于CDN廠商來說,現在是5G發展的關鍵時間點,大家都在布局新一代的CDN網絡。在這個背景下,電信運營商或CDN廠商不再僅扮演傳統數據通道的角色,在5G條件下,可以將數據下載到邊緣數據中心,建立一個開放式的邊緣計算節點,并通過這個節點將所有算力虛擬化,提供開放的接口給不同的云公司來訂購服務,在同樣的CDN邊緣節點當中,以與視頻相關的角度來看,不僅僅是傳統的catch部分工作,還包含更多的大文件存儲。
另外視頻編解碼能力也會下放到邊緣數據中心,當然AI和其他數據分析的內容也是必不可少的。通過這種方式就可以讓整個邊緣節點(數據中心)算力得到巨大的發展。邊緣計算與云數據中心、區域數據中心相結合的架構,大量的數據發生和處理在本地進行,終端到云的訪問次數將減少80%左右。邊緣計算的優點很多,但并不是所有的企業都能投入這么大的資本去在全球部署節點。有了開放式的邊緣計算節點,客戶就可以從運營商處訂他們所提供的虛擬邊緣節點計算功能,僅需在有需要時,比如在有熱點內容出現時,可以臨時訂購邊緣節點的計算功能,很多廠商都預期這種部署可以在一分鐘內完成。3. 云視頻監控處理正在走向邊緣上圖是之前提到的智慧城市中兩種不同的處理方式,監控不再是之前各個私有的小區型監控,都是在本地采集數據同步到數據中心,而這一步也分為兩種處理方式,一種是把視頻內容直接采集發送到中央數據庫,另一種是通過邊緣節點的方式。對于邊緣計算的處理方式就顯得靈活很多,可以在靠近視頻產生的邊緣節點建立視頻處理分析的能力,在此對視頻內容進行快速的抽幀分析分析、存儲,只把分析出的時間、警報的mate data傳送給中央的數據中心,這樣做絕大部分的數據流都會被節省下來。3.1 視頻監控工作流程具體到服務內部,上圖是NETINT建議的一種方式,由攝像頭所產生的數據輸入到邊緣服務器之后,首先會對數據進行H.264、H.265的解碼,抽幀并發送YUV數據給服務器,在服務器端可以對YUV數據進行基于人工智能的處理分析、圖像增強并提取其它有價值的信息。在此之后SSD可以做很高速的cache,或者把處理過的YUV數據發回編碼器進行二次編碼來優化分辨率,碼率或轉碼成為另外的codec,在邊緣節點進行長期的保存,而不用上傳到云中心。另外在此插入了一個NETINT在北美的實際應用案例: 我們有一個為視頻監控內容進行增值服務的客戶,他們可以拿到全美國的交通視頻監控內容,在拿到實時視頻后,他們對攝像頭產生的視頻內容進行H.265二次高效轉碼,并利用直播的技術將視頻內容實時提供給全美快速響應的團隊。借助NETINT基于自研芯片的高效視頻轉碼能力,客戶實現了非常可觀的社會和經濟效益。3.2 基于ASIC的編碼如果想在邊緣節點實現上述這些功能其實會有很多挑戰,首先邊緣節點的數據機房是無人值守的,其中的工作要做到非常穩定、非常高效、以及盡量低的功耗。這樣的要求只有芯片級別的解決方案可以做到。用戶不可能在每個節點插入很多個GPU,除去昂貴的服務器成本、電費的成本,占用大量的機架空間之外,其工作中產生的熱量也是很難解決的一個工程問題。在此我們也也粗淺比較了一下以NETINT基于自研SoC的編解碼和傳統CPU、GPU、FPGA的不同特點?;赟oC芯片的編解碼功耗最低且效率最高,在質量上也有特定的優勢。更為獨特的是,NETINT這款轉碼產品其實是以SSD的形態出現,可以充分利用現有存儲服務器的資源,非常易于安裝和維護。3.3 可計算存儲:在SSD當中進行視頻處理NETINT有兩款芯片,一款是專注視頻的編解碼芯片,另一款是PCle 4.0 NVMe SSD Controller芯片,NETINT也分別開發出了板卡級的產品。兩者的形態都是SSD硬盤,只要有PCle接口就可以即插即用。在八月初NETINT還發布了最新的EdgeFusion系列產品,能夠將上述兩款芯片的功能結合在一起,在功能更強大的同時形態保持不變。3.4 視頻轉碼和存儲NETINT芯片的架構圖
3.5 關于服務器存儲架構談到服務器存儲架構,NETINT所做的產品是通過標準的NVMe接口,以SSD硬盤的形式出現,可以在現有的標準服務器當中做到即插即用,一個1U的標準服務器不需進行任何定制改造就可以插10張卡,2U的標準服務器可以插24張卡。由于所有的編解碼能力是由NETINT芯片完成,CPU不參與編解碼,也就不再是整個系統的性能瓶頸。只需插入更多的轉碼卡,就能實現編解碼能力的線性增長。3.6 下一代前沿架構除了服務器內部,NETINT也在與前沿客戶討論如何在機架級別做Scaling-out,上圖是一個典型的機架,最上端為Switch,在機架內部還連接有一些計算節點,再往下是基于NVMe-oF的存儲節點,最后是基于NVMe-oF/ Video Codec節點。這些Video Codec的服務器節點包含Fabric Port和PCle Switch,而PCle Switch連接著一定數量的T480模塊,只需在機架上插入一個這樣的Video Codec 節點就就具備了36或24 個4Kp60幀的編解碼能力。而且通過NVMe-oF的高速接口進行連通,對于服務器和應用看到的內容都相當于存在本地,在性能方面沒有任何的瓶頸。這樣的架構在目前來看還比較前沿,需要一定時間的繼續推進以及與客戶的磨合后才能進行推廣。3.7 Codensity軟件集成關于軟件部分,NETINT的軟件可以做到與FFmpeg無縫結合,NETINT所做的工作是提供一個庫,將庫提供給客戶之后只需要重新編譯FFmpeg就可以直接使用,客戶現有基于FFmpeg的工作流完全不用變化,與硬件一樣具有即插即用的特性。3.8 Virtual Machines和Containers支持對于真正的生產環境來說,大家都是通過VM或者容器來做。NETINT的轉碼卡是在SSD存儲的架構上設計的,因此對于VM和容器的支持有著非常好的基礎,并可以支持以下幾種方式。使用Device-passthrough模式,NETINT將T408作為一個整體提供給VM或容器,一個VM或容器可以連接一個或多個卡。另外也可以使用在存儲方面應用比較多的SR-IOV技術來進行虛擬化,這樣就可以做更細粒度的分配,通過SR-IOV可以把SSD和不同的轉碼實例分配不同的的namespace,這樣可以使每一個VM連接不同的instance,能夠在更細粒度上進行虛擬化和應用,對靈活分配算力和運維來說是比較有效的技術。
LiveVideoStack?秋季招聘
LiveVideoStack正在招募編輯/記者/運營,與全球頂尖多媒體技術專家和LiveVideoStack年輕的伙伴一起,推動多媒體技術生態發展。同時,也歡迎你利用業余時間、遠程參與內容生產。了解崗位信息請在BOSS直聘上搜索“LiveVideoStack”,或通過微信“Tony_Bao_”與主編包研交流。
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
以上是生活随笔為你收集整理的边缘计算架构如何融合视频编码与存储的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MSU公布2019视频压缩评比报告客观部
- 下一篇: 韩嫕:坚持coding