用好CUDA加速 6款视频软件评测与指南
從2008年下半年開始和GTX280的發布,NVIDIA的GPU從傳統的單一3D渲染角色快速像通用并行處理器+3D渲染角色轉變。近一年來,基于NVIDIA CUDA架構GPU的應用情況已經非常清晰。基于游戲的PhysX帶來真實的物理效果;由PowerDirector、Badaboom、TMPGEnc開始的基于視頻特效和編碼的CUDA加速;最新推出的Arcsoft和vReveal實時的視頻處理;而最近又加入了一款用戶界面很貼近個人用戶的視頻處理軟件Loilo,以及剛剛發布的新版本Nero Move it。
GPU帶來新視覺計算,不僅僅是3D渲染和游戲
???? 從2008年中GTX280的發布,到NVIDIA明確提出CUDA架構的概念的短短半年時間里,CUDA在個人應用領域的軟件至今已經達到上述的7款(還不包括采用CUDA加速的插件,例如CoreAVC的CUDA插件,Foobar下的音效插件等)。基于高級語言的CUDA軟件開發的優勢得到了較好的體現。大家不難發現以上幾款軟件都與視頻相關,這一方面是因為現有PC個人應用恐怕除了3D游戲外,視頻處理是負荷最大的;而另一方面,雖然以上7款軟件與視頻相關,但實際應用上有各自擅長的方面,用途也是不同的。今天我們選取以上軟件中的六款進行評測,并簡單指導大家使用。
| 硬件平臺 | |
| CPU | Intel Core2Extreme Q9300 |
| 主板 | ASUS P5Q Deluxe |
| 顯卡 | NVIDIA GeForce GTX280 |
| NVIDIA GeForce GTS250[報價 參數 圖片] | |
| NVIDIA GeForce 9600GT | |
| 內存 | Kingston HyperX DDR2 800 2GBX2 |
| 硬盤 | Seagate 7200.10 320G |
| 電源 | TT 80 Plus 750W |
| 軟件環境 | |
| 操作系統 | Windows Vista 32bit |
| 驅動程序 | Intel inf9.0 |
| NVIDIA Forceware185.68 | |
| 測試軟件 | Cyberlink PowerDirector |
| Loilo | |
| TMPGEnc | |
| ArcSoft SimHD | |
| Badaboom | |
| vReveal MotionDSP | |
| 測試軟件 | 應用方向 |
| Cyberlink PowerDirector | 視頻特效與編碼 |
| Loilo | 視頻特效,編碼,高清播放,3D界面 |
| TMPGEnc | 剪輯加速 |
| ArcSoft SimHD | 標清轉高清:倍線 |
| Badaboom | 視頻編碼 |
| vReveal MotionDSP | 視頻效果增強(尤其是低質量視頻) |
??? 從上表我們簡單概括了本次測試的六款軟件主要應用的方向,我們逐個為大家介紹軟件的相關應用以及CUDA帶來的加速效果。本次測試在硬件選擇上,使用了3款定位不同的NVIDIA顯卡,而Q9300 CPU也是目前Intel 2000元價位上的高端四核心CPU,具有SSE4指令集同樣是專門為視頻優化的好手,在上述很多軟件中被使用到。
Loilo,按CUDA應用軟件發布時間來看是僅早于本月才發布的Nero Move It的一款被稱為操作界面非常人性化的軟件。在軟件上我們也看到了4項專為CUDA和NVIDIA優化的標語,它們分別是視頻編碼的CUDA加速,視頻特效的CUDA加速,軟件界面的CUDA加速與高清播放的PurevideoHD加速。
Loilo 靈活的操作界面
Loilo靈活的操作界面來自于NVIDIA的加速,它允許用戶將所有的素材如圖片和視頻,隨意拖放在軟件界面的任何地方,而不是被束縛在規規矩矩的窗口內,這讓整個桌面的效率大大提高。同時,在窗口上方大家很容易為視頻在Timeline中添加各種特效,由于Purevideo和CUDA的配合,可以實現對高清視頻增加特效時的實時瀏覽。
各種輸出選擇
GPU輸出時的設置
CPU輸出時的設置
??? 最后我們來看編碼上CUDA的加速,當我們需要輸出成H264編碼的MP4文件時,可以選擇GPU加速輸出編可以生成相關文件,并用GPU加速。但由于軟件目前不夠完善,GPU輸出可選用參數并不是我們常見的參數,又由于與CPU輸出參數可調整方向有很大不同,所以我們沒有辦法進行性能上的測試.
?Cyberlink PowerDirector7是在2008年許多測試中常見的軟件,它不但較早就對CUDA提供了支持而且在Core i7 CPU測試中也表現突出,是對Core i7優化的最好的一款軟件,我們似乎可以理解這是Cyberlink所有軟件中最為上進的一款,畢竟PowerDVD已經沒什么新意?言歸正傳,PowerDirector7根據官方提供的說明,它可以利用CUDA對視頻特效與編碼進行加速。
畫面中各種特效,支持CUDA加速的會有NVIDIA LOGO標識
在特效測試時,選擇輸出為MPEG2,編碼部分由CPU運算完成
單獨測試H264編碼的設置
由于官方給出兩個CUDA加速功能,所以我們分別測試。第一項測試支持CUDA加速的特效,我們對選則好的視頻使用了4個相關特效,并輸出為MPEG2格式的文件;第二項,僅對視頻進行轉碼測試,輸出為H264編碼的MP4文件
??? PowerDirctor7是一款即便用CUDA加速也會100%使用CPU的軟件,它在特效濾鏡CUDA加速方面表現的并不好,而在MPEG2輸出時SSE4也可以對特效濾鏡進行加速,但我們還是可以看到即便使用GeForce9600GT打開CUDA加速也要比Q9300的效率高不少。而在純編碼輸出方面,同樣CPU仍滿負荷工作,但可以看到CUDA的效率還是很高的。
如果沒有記錯,TMPGEnc是第一時間站出來為CUDA捧場的知名軟件之一,雖然最終它沒有坐到“沙發”讓Badaboom搶了先,但其影響力仍是非常不小,而推出的時間也較早,但由于TMPGEnc一直以高效的編碼能力聞名,對CUDA支持上僅僅支持視頻編輯與簡單的特效,讓很多忠實用戶有些遺憾。
打開CUDA加速
?
左側是視頻濾鏡與簡單編輯選項
我們在TMPGEnc選擇源文件的一頁,可以看到濾鏡選項,點擊進入就看到了上面的界面。其中的濾鏡比較常規,可以對視頻速度,畫面比例,顏色等進行一些調整,而這些功能支持CUDA,倒也算是利用率很高的一些應用了。下面我們來看看測試成績。
GeForce GTX280測試
GeForce 9600GT測試
GeForce GTS250[報價 參數 圖片]測試
?TMPGEnc測試從上面三個圖中信息可以看到,當使用高端的GTX280時,此時CPU占用整個處理工作的0.7%,即所有工作幾乎都有GPU完成。但是使用GTS250[報價 參數 圖片]時,CPU開始輔助工作,達到了28.5%的工作量,9600GT時這個數值為39.6%,這種CPU與GPU結合的算法在這些CUDA加速軟件中還是比較少見的。不過從中可以看出,更多的流處理器可以分擔CPU的工作量,效率也可以提高許多。
??? 從測試成績和我們監控測試狀態來看,TMPGEnc中的Filter并沒有對多核心CPU優化,4核心的Q9300很難發揮優勢,不過以TMPGEnc以往的作風來看并不像是故意不對CPU優化,也許這套工作的確很難做到優化,而GPU并行計算的能力正好在這里發揮。
vReveal具備CSI式(引自Crime Scene Investigation,《犯罪現場調查》)的超高分辨率專利技術,該技術的原型是執法和情報部門所采用的法庭專用應用程序。通過支持NVIDIA的GPU(圖形處理器)所具備的大規模并行處理能力,vReveal可以即刻清除視頻中抖動、灰暗、噪音和模糊的部分。
這是官方展示的一組效果對比,經過處理后右側書名文字非常清晰
(點此查看大圖)
在軟件界面中不難看出,左側有6個改善畫面的方案。有降噪,提升分辨率,銳化,自動對比度,擴展畫面以及手動亮度調節。每一項進入高級模式還可以進行具體細節調節。
(點此查看大圖)
??? 上文已經對vReal進行了不少的介紹,在這里我們再看一個例子。上圖的視頻左右兩側分別為處理前后的對比畫面,是實時的視頻畫面。我們用vReal對視頻加入了降噪和自動對比度的濾鏡,第二張圖片是我們關閉CUDA加速后CPU占用率情況。而使用CUDA加速時,CPU是完全沒有負荷的
目前我們一般可以通過兩個渠道獲得Arcsoft的SimHD功能,Arcsoft公司的TotalMedia Theater是一款較為常用類似于PowerDVD的多媒體播放軟件,目前最新的版本為3.0系列,在普通版本上用戶可以購買SimHD For CUDA的插件來實現這個功能。而我們在早期測試時,NVIDIA曾提供過內嵌了SimHD的TMT播放器2.1版本,該版本不支持顯卡的反交錯,所以對畫質有影響,推薦大家只有3.0版本的TotalMedia Theater。
SimHD插件實現的是我們通常所說的“倍線”功能,這在幾年前的DVD機上可以見到,由于當時還沒有高清視頻大量的節目源,通過插值算法與邊緣銳化,將普通的標清分辨率DVD影片實現1920X1080分辨率的插值輸出,有不錯的效果。現在使用SimHD插件通過CUDA加速可以輕松在電腦上對DVD進行倍線提升清晰度的功能。
??? 另外,其實類似的倍線技術是Intel在去年中首先在Cyberlink的一款軟件上率先演示的,當時使用E8000系列雙核心CPU,負荷幾乎占滿80%以上,對于CPU來說這個運算量實在有些大,而我們測試中使用GeForce9600GT也沒有察覺GPU達到最大負荷。
關于SimHD的測試,我們還是用大量的來自于HQV Benchmark軟件中的截圖來給大家提供一些參考。為了更好的展示SimHD的效果,TMT軟件內置了對比模式,從下面圖可以看到兩個對比畫面,一個是原始畫面,一個是進行過倍線處理的畫面,大家可以看出差別嗎?
效果如何?相信大家已經有了答案。不過要說一下最后兩張圖,這是測試運動中物體與靜止物體同一畫面時畫質的測試。如上圖所示,如果顯卡沒有反交錯處理,那么靜止物體就會形成波紋,在前一頁我們也看到NVIDIA指出Cyberlink的TTHD功能會導致該項測試失敗。其實從我們來看也許并不一定,因為只要顯卡支持反交錯,打開此功能即可消除,而這與倍線功能似乎并不那么密切相關。在TMT的2.1版本,同樣不支持反交錯。
| Badaboom界面 |
??? Badaboom,一款大家非常熟悉的軟件,我們似乎都沒有必要再這里詳細介紹它了。軟件使用很簡單,右側有許多預置的規格,當然你也可以任意自定義想要的視頻輸出規格。但該軟件輸出規格僅支持H264編碼的MP4文件,最大支持Main Profile下 Level4.1碼率25Mbps的文件且支持CABAC編碼規格,整體來說除了不支持High Profile下 4.1-5.1更高Level外,它已經非常完美了。
| 編碼參數,H264 Level |
本次測試與我們去年測試稍有不同,去年我們即便是給IPOD Touch/IPHONE壓縮也選用了5000Kbps的高碼率,如果你真的是這些產品的用戶便會發現,平時壓縮你只需要最多700kbps碼率的視頻,在iTunes Store上買到的視頻也最多不過如此,更高的碼率對于這個機器來說只是浪費。所以本次測試選用了兩個規格碼率,一個是500kbps的IPHONE分辨率的視頻,另一個是該軟件支持最高規格1080p Main Profile Level 4.1 CABAC的編碼,成績如下。
??? 由于此軟件不能支持CPU編碼所以我們先來看一下GPU編碼結果,對于一部片長300秒的視頻進行編碼如果是給移動設備使用,編碼時間只有1分鐘左右,如果使用高端顯卡將在半分鐘完成,這個成績非常不錯。如果大家有興趣查看Badaboom與CPU對比,請訪問《CUDA挑戰SSE4? CPU/GPU視頻編碼詳解》里面有4款顯卡與2款主流CPU的對比。
由于Nero Movie IT還沒有最終確定發布,所以本次測試不包含這款軟件。不過最后,我們還是總結一下本次測試的幾款基于CUDA應用GPU加速的視頻處理軟件,以及CUDA在個人應用上的優勢。
如果大家對CUDA一直有所關注,那么對GPU加速或者使用CUDA會比CPU快數倍甚至數十倍的觀點自然不會懷疑,而即便大家對CUDA沒有了解,那么通過我們這次測試也可以明顯看到用GPU進行加速,速度比CPU快是不容置疑的。
綜合幾款軟件來看,Badaboom和PowerDirector7的編碼加速(還包括Loilo中設置不完整的編碼加速)是目前應用最為成熟的一方面,而Badaboom應該是最為易用也設置最完整的,它們目前都只支持H264一種編碼輸出,從Intel SSE4多年來優化看要做到多種格式全兼容實在不太可能也沒太大必要,即便是效率極高的TMPGEnc也不支持H264 SSE4加速,CUDA目前做到的已經相當不錯。
MotionDSP的vReveal與SimHD,屬于實時對視頻進行復雜處理的軟件,它們的效果非常明顯,可以對視頻有不錯的優化,而從目前應用來看vReveal支持的輸入格式很豐富,而且對特別差和較差的視頻改善很明顯,非常值得大家嘗試。而SimHD就如我們當年玩倍線DVD播放機一樣,首先僅支持DVD Video光盤的SimHD效果輸出,其次DVD畫質本身也決定了輸出效果,應用范圍相對較小,但整體效果仍令人滿意。
最后,是TMPGEnc、PowerDirector7和Loilo中的視頻濾鏡,GPU提速效果也是非常明顯的。對于家里擁有DV的用戶,不要錯過這幾款軟件與NVIDIA顯卡,另外鑒于很多濾鏡對SSE4的優化CPU配置也不要太低,CPU和GPU對視頻處理效率都有很重要的作用。
總體而言,MotionDSP和SimHD的應用我們認為是這幾款中最為突出的(這兩項類似在CPU上的應用Intel更早時候就演示過,被定位于4核應用案例),相信大家很快會看到CPU加速的相關軟件推出,這種操作對CPU消耗實在太大,對于目前主流CPU平臺而言,這種應用是否具有實用價值都是一個疑問,而只要普通的GeForce9600GT GPU就可以輕松應付。而隨著DC/DV甚至手機拍攝視頻越來越多,vReveal這類軟件會大大快速改善視頻的效果,效率與傳統CPU將是非常之高。對于這些軟件,擁有GeForce的用戶不妨嘗試一下吧。
來自 “ ITPUB博客 ” ,鏈接:http://blog.itpub.net/22785983/viewspace-619758/,如需轉載,請注明出處,否則將追究法律責任。
轉載于:http://blog.itpub.net/22785983/viewspace-619758/
總結
以上是生活随笔為你收集整理的用好CUDA加速 6款视频软件评测与指南的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: a86电脑配什么cpu(A86插座)
- 下一篇: 病毒性疣体会传染吗女性