日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

Netflix:为什么建立专门的媒体数据库?

發(fā)布時間:2024/4/11 62 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Netflix:为什么建立专门的媒体数据库? 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本文解釋了Netflix建立專門的媒體數(shù)據(jù)庫的原因,包括精準的用戶推薦,極致的編碼以及更高效的實現(xiàn)創(chuàng)意。


文 / Rohit Puri

譯 / 王月美

原文:https://medium.com/netflix-techblog/the-netflix-media-database-nmdb-9bf8e6d0944d


想象一下,我們正在研究下一代自適應(yīng)視頻流算法。我們的目標是最大限度地縮短全球數(shù)百萬Netflix會員的播放啟動時間。為此,我們需要收集ISO BMFF(基本媒體文件格式)格式化比特流的標題的聚合統(tǒng)計數(shù)據(jù)(包括最小值,最大值,中值,平均值,任意百分數(shù))。Netflix轉(zhuǎn)碼集群為大量內(nèi)容提供服務(wù),并為每個內(nèi)容生成大量的比特流(具有不同的編解碼器+質(zhì)量組合)。在過去,我們需要編寫一次性腳本,以便在我們分析數(shù)據(jù)之前,以艱難的方式從比特流中抓取頭部信息。很顯然這種方法無法擴展——我們腳本中的軟件錯誤會將導(dǎo)致重置整個工作。


此外,當分析我們的媒體數(shù)據(jù)的另一個完全不同的維度時,還需要一個新的“一次性”腳本來處理。對于來自不同域的問題多次重復(fù)這種方法使我們意識到這里存在一種模式,并讓我們建立一個以可擴展的方式來解決這個問題的系統(tǒng)。


這篇博客文章介紹了Netflix媒體數(shù)據(jù)庫(NMDB)——一種基于Netflix微服務(wù)平臺構(gòu)建的高度可查詢的數(shù)據(jù)系統(tǒng)。NMDB用于在Netflix上持久保存有關(guān)各種媒體資產(chǎn)的技術(shù)元數(shù)據(jù),并使用查找和運行時計算的組合近乎實時地提供查詢。NMDB使得開發(fā)人員(如視頻流研究人員)能夠?qū)r間集中在對媒體數(shù)據(jù)洞察的開發(fā)上,并制定出令人驚嘆的數(shù)據(jù)驅(qū)動算法,而不用操心收集和組織數(shù)據(jù)的任務(wù)。


為何選擇媒體數(shù)據(jù)庫?


優(yōu)化的用戶界面,有意義的個性化推薦,高效的流媒體和大量內(nèi)容是定義終端用戶在Netflix體驗效果的主要因素。需要將各種復(fù)雜程度的業(yè)務(wù)工作流程聚集在一起,以實現(xiàn)這種體驗。



與故事相關(guān)的藝術(shù)品圖像和標題概要(見上圖),以及富有洞察力的視頻預(yù)覽在幫助用戶找到相關(guān)的節(jié)目和電影方面有很長的路要走。Netflix不斷擴大的內(nèi)容攝取量規(guī)模,要求開發(fā)能夠幫助我們的創(chuàng)意團隊及時合成高質(zhì)量數(shù)字商品資產(chǎn)的系統(tǒng)。例如,這可以通過向它們提供有意義的原始圖像和從源視頻資產(chǎn)中自動(或通過算法)提取視頻剪輯完成。這可以作為創(chuàng)建引人入勝的數(shù)字媒體資產(chǎn)的起點。


如下所示,內(nèi)容推薦系統(tǒng)經(jīng)濟地表達了針對最終用戶的內(nèi)容偏好和品味。Netflix目錄中內(nèi)容緊湊且有效的特征表示對此功能是至關(guān)重要。例如,可以通過構(gòu)建使用媒體文件(音頻,定時文本,視頻)以及標題元數(shù)據(jù)(類型標簽,概要)作為其輸入的機器學(xué)習(xí)模型。



高效的音頻和視頻編碼方式可以更有效的利用比特流。對視頻時間和空間分析(例如,檢測鏡頭時刻和場景變化)以及識別視頻幀中的顯著的部分和對象有助于為視頻編碼系統(tǒng)生成關(guān)鍵信息。



最后,在Netflix上保持對源內(nèi)容質(zhì)量的高標準對于終端用戶的體驗非常重要。上圖說明了一個這樣的用例。該圖像對應(yīng)于來自西方古典類型的標題的視頻幀。這種情況下,在視頻中可以看到用于制作標題的相機。我們非常希望具有一種自動分析系統(tǒng),該系統(tǒng)將檢測和定位(可能通過矩形邊界框)相機的存在。另一種這樣的情況如下圖所示。在該種情況下,字幕文本被放置在視頻呈現(xiàn)的文本頂部,導(dǎo)致這兩個文本都是不可讀的。而視頻文本檢測算法以及字幕的定時和定位知識可以用于自動解決該問題。



我們需要注意的是,以上說明的看似完全不同的用例實際上與核心組件算法的使用重疊。例如,鏡頭變化數(shù)據(jù)對視頻編碼用例起著至關(guān)重要的作用。不同的鏡頭具有不同的視覺特性并且具有不同的比特預(yù)算。出于同樣的原因,鏡頭變化數(shù)據(jù)也是從源視頻資產(chǎn)中生成各種原始圖像和視頻剪輯的基本要素。通過從每個鏡頭中選擇最優(yōu)秀的候選者,可以獲得高質(zhì)量的原始藝術(shù)品候選者的集合。同樣,可以通過組合每個鏡頭表示來構(gòu)造視頻媒體的有意義的潛在表示。


作為另一個示例,雖然視頻文本檢測數(shù)據(jù)在內(nèi)容質(zhì)量控制中起著非常寶貴的作用,但是對于視頻編碼和藝術(shù)品自動化用例也是有益的—包含大量文本的視頻幀通常不用作良好的藝術(shù)品圖像候選者。


此外,許多這些分析在計算上代價往往非常昂貴——在處理不同的業(yè)務(wù)用例時重復(fù)相同的計算是非常低效的。總之,這些原因共同構(gòu)成了一個數(shù)據(jù)系統(tǒng)的論據(jù),該數(shù)據(jù)系統(tǒng)可以作為與媒體時間軸相關(guān)的任何分析的通用存儲。換句話說,我們需要一個“媒體數(shù)據(jù)庫”。


媒體數(shù)據(jù)庫的特征


媒體數(shù)據(jù)庫容納對應(yīng)于不同模態(tài)媒體的媒體分析數(shù)據(jù)——這些媒體分析數(shù)據(jù)包括音頻,視頻,圖像和文本(例如:字幕)。期望在媒體時間軸上提供任意查詢。例如,音軌的時間線中的什么時間間隔包含音樂,或者包含文本的視頻中的視頻幀列表,或者對應(yīng)于對話的字幕文件中的時間間隔的集合。 鑒于其范圍的廣度,我們認為以下是媒體數(shù)據(jù)庫的重要特征:


1、對結(jié)構(gòu)化數(shù)據(jù)的親和力:具有模式的數(shù)據(jù)適用于基于機器的處理,因此可用于大規(guī)模分析和消費。在我們的案例中,架構(gòu)合規(guī)性允許我們索引數(shù)據(jù),這反過來又可以實現(xiàn)數(shù)據(jù)搜索和挖掘機會。此外,這就把數(shù)據(jù)的創(chuàng)造者從需要高端服務(wù)的消費者中解脫出來了。


2、有效的媒體時間線建模:服務(wù)從周期性的面向樣本的(例如,視頻幀)到基于事件的(例如,定時文本間隔)的各種類型的媒體時間線數(shù)據(jù)的能力是媒體數(shù)據(jù)庫的基本特征。


3、時空查詢能力:媒體數(shù)據(jù)庫本地支持媒體數(shù)據(jù)的時間(例如,音頻軌道中的時間間隔)以及空間(例如,圖像的部分)特征,并且在這些維度上提供高效查詢能力。作為示例,媒體數(shù)據(jù)庫使得檢查連續(xù)的視頻幀序列是否包含視頻幀的特定空間區(qū)域(如左上角)中的文本變得容易。這樣的查詢可以用于檢測視頻和字幕中存在的文本之間的沖突。


4、多租戶:精心設(shè)計的媒體數(shù)據(jù)庫可以用作支持來自多個應(yīng)用的多個分析數(shù)據(jù)的平臺。 因此,它允許存儲任意數(shù)據(jù),只要它是結(jié)構(gòu)化的。另外,如果該數(shù)據(jù)也可以與媒體資源的特定時間間隔相關(guān)聯(lián),則每個租戶可以從我們系統(tǒng)的有效查詢能力中受益。


5、可擴展性:可擴展的基于微服務(wù)的模型至關(guān)重要。這意味著系統(tǒng)必須解決各種負載情況下的可用性和一致性的相關(guān)問題。


NMDB介紹


上面概述的用例激發(fā)了我們構(gòu)建NMDB——一種通用存儲,用于與媒體時間軸相關(guān)的任何分析,可用于在媒體時間軸上大規(guī)模回答時空查詢。Netflix目錄包含大量不同形式的媒體資產(chǎn)——靜態(tài)資產(chǎn)的示例包括圖像,可播放資產(chǎn)的示例包括音頻,文本和視頻。如上所述,無數(shù)業(yè)務(wù)應(yīng)用程序可以從訪問與這些資產(chǎn)相關(guān)的深入語義信息中受益。 NMDB的主要目標是提供這些應(yīng)用程序所需的必要數(shù)據(jù)—我們將NMDB視為構(gòu)成各種Netflix媒體處理系統(tǒng)主干的數(shù)據(jù)系統(tǒng)。


媒體時間軸數(shù)據(jù)的高效建模是NMDB的核心特征。媒體時間軸的規(guī)范表示可以支持大量用例,同時有效地解決用戶查詢模式。這構(gòu)成了本系列下一篇文章的主題。

總結(jié)

以上是生活随笔為你收集整理的Netflix:为什么建立专门的媒体数据库?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。