MSM8260,OMAP4430,TEGRA2,EXYNOS 4210详细分析
新技術(shù)研習(xí)社已經(jīng)許久沒(méi)有在愛(ài)活露臉,所以在今天我們開始前,小編先要考考大家:現(xiàn)今市面上究竟有多少款雙核心手機(jī)?答不出來(lái)吧?其實(shí),小編自己也不清楚?@_@?(汗)。因?yàn)槲覀兊氖謾C(jī)市場(chǎng)實(shí)在是太雜了。拋開黑莓惠普這些國(guó)內(nèi)見得少的牌子不說(shuō),單是Android一家,同一個(gè)時(shí)期內(nèi)就有數(shù)十家廠商上百款產(chǎn)品充斥市面,頗有當(dāng)年大煉鋼鐵趕英超美的氣勢(shì)。大家都號(hào)稱自己是雙核心手機(jī),這就帶來(lái)了一個(gè)問(wèn)題:究竟選哪個(gè)好呢?或者換個(gè)說(shuō)法,都是“雙核心”,它們之間難道就真的沒(méi)有區(qū)別嗎?
關(guān)于這個(gè)問(wèn)題,大家在昨天的小米手機(jī)分析文章后面已經(jīng)進(jìn)行了熱情洋溢的討論。不少群眾對(duì)小米手機(jī)那顆1.5GHz的雙核心處理器是否具備世界第一性能表示好奇。為了幫助大家更好的理解市面上雙核處理器的異同,以便作出自己的選擇,我們撰寫了下面的這些文字。本文將從多個(gè)角度帶領(lǐng)大家對(duì)目前市場(chǎng)中的雙核產(chǎn)品做一次較為全面的了解。
? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?
參賽選手亮相首先,讓我們來(lái)看看市面上有哪些雙核心手機(jī)處理器。提到雙核,可能大家首先想到的就是nVIDIA的Tegra 2。作為業(yè)界新人,nVIDIA必須要有一些別人不具備的優(yōu)勢(shì),才能站穩(wěn)腳跟,而nVIDIA選擇的優(yōu)勢(shì)就是速度。Tegra 2是一款早在2010年1月就發(fā)布的雙核手機(jī)處理器,為nVIDIA賺足了眼球,甚至儼然成了雙核的代名詞。
Tegra 2是nVIDIA在ARM SoC領(lǐng)域的第二款作品,由于第一款Tegra表現(xiàn)并不好,nVIDIA很早就開始設(shè)計(jì)Tegra 2,最終成為了移動(dòng)消費(fèi)領(lǐng)域第一款量產(chǎn)型雙核ARM處理器,也正是靠這點(diǎn),諸多廠家為了能趕在蘋果之前推出雙核產(chǎn)品,紛紛下單采購(gòu)。因此大家便看到了今年年初MWC2011上雙核設(shè)備的密集發(fā)布。這些雙核機(jī)型成功從蘋果手里搶走了“業(yè)界首款雙核”的名頭,直接導(dǎo)致蘋果不得不在iPad2發(fā)布會(huì)上退而將A5稱為第一款量產(chǎn)的雙核處理器——盡管大家都知道,當(dāng)iPad2發(fā)布的時(shí)候,搭載Tegra 2的手機(jī)和平板已經(jīng)開賣多時(shí)了。Tegra 2的CPU部分采用的是雙核ARM Cortex A9 MP,圖形芯片(GPU)則是NV自有的GeForce ULP。它由TSMC以40nm工藝制造,預(yù)設(shè)工作頻率為1GHz。相對(duì)于單核時(shí)代的Cortex A8而言,Cortex A9是ARM公司性能更強(qiáng)、功能更多,并且支持多核心配置的新核心。關(guān)于它的特性,在后面的文章中會(huì)詳細(xì)解釋,這里就先不詳述了。在Tegra 2上,nVIDIA為每一個(gè)核心配備了32KB+32KB的一級(jí)緩存,以及累計(jì)1MB的二級(jí)緩存,但是在內(nèi)存子系統(tǒng)上最高只支持到DDR2 667或LPDDR2 600,而且僅支持單通道內(nèi)存。當(dāng)然,隨著現(xiàn)代手機(jī)對(duì)于多媒體功能,例如視頻回放的需求,Tegra 2也引入了諸多格式最大1080p分辨率的硬件視頻解碼能力。在nVIDIA宣布雙核Tegra 2后僅僅一個(gè)月,另一家老牌半導(dǎo)體公司德州儀器也宣布了自己的OMAP4雙核心平臺(tái),包含了OMAP4430、OMAP4460與2011年初發(fā)布的OMAP4470三個(gè)型號(hào)。與Tegra 2相同,OMAP4也搭載了Cortex A9 MP架構(gòu)的雙核心,緩存資料不詳,而GPU采用的則是PowerVR SGX540(不包括OMAP4470在內(nèi),下面的介紹僅指4430/4460)。可能有些讀者能看出,這顆GPU與單核時(shí)代的三星蜂鳥處理器是一樣的,為此,德州儀器將這顆GPU的頻率提升了50%,達(dá)到了300MHz,希望借此提升性能以拉開與單核處理器的差距。
OMAP4系列均采用45nm工藝制造,OMAP4430設(shè)計(jì)頻率為1GHz,OMAP4460則設(shè)置為1.5GHz,因此可以認(rèn)為前者是針對(duì)手機(jī)平臺(tái)設(shè)計(jì)的,而后者是針對(duì)平板機(jī)設(shè)計(jì)的。值得一提的是,與Tegra 2不同的是,OMAP4支持雙通道內(nèi)存,內(nèi)部具備兩個(gè)完全一樣的內(nèi)存控制器,這點(diǎn)在后面的文章中也可以看到。至于內(nèi)存規(guī)格,OMAP4430最高至支持LPDDR2 1066,在頻率上也要比Tegra 2高了幾乎一倍。另一家單核時(shí)代的主流供應(yīng)商高通,則在?2010年6月宣布了自家的雙核產(chǎn)品規(guī)劃,其中主頻高達(dá)1.2GHz的MSM8x60是最吸引眼球的。這是第一款針對(duì)手機(jī),且設(shè)計(jì)頻率達(dá)到1.2GHz的雙核處理器,但與之前兩家不同的是,高通在自家雙核處理器上并沒(méi)有采用類似于Cortex A9 MP的核心,而繼續(xù)采用了與其單核處理器類似的Scorpion內(nèi)核。
MSM8x60的內(nèi)存支持能力與OMAP4430處于同一水平既LPDDR2 1066,但是對(duì)于是否支持雙通道內(nèi)存我們不得而知。GPU依然是高通自有的Adreno系列,當(dāng)然型號(hào)升級(jí)到了更高級(jí)的Adreno220,高通號(hào)稱可以提供前一代兩倍的性能。雖然高通不止一次提到自己將用28nm工藝生產(chǎn)ARM處理器,但MSM8x60采用的還是45nm工藝,一級(jí)緩存與Cortex A9一樣,但二級(jí)緩存卻只有512KB,比標(biāo)準(zhǔn)的Cortex A9 MP少了一半。多媒體支持級(jí)別與主流雙核一樣,也是1080p級(jí)別的視頻回放。與這些廠家的積極表現(xiàn)不同,作為三巨頭之一三星在雙核方案上似乎顯得有些低調(diào),一直到2010年9月才發(fā)布自家的雙核平臺(tái),即大家熟知的代號(hào)獵戶座的雙核心處理器,量產(chǎn)型號(hào)為Exynos 4210。作為一款最晚發(fā)布的產(chǎn)品,獵戶座在規(guī)格上也是最高的,不僅CPU配備了設(shè)計(jì)頻率同樣高達(dá)1.2GHz的雙核Cortex A9 MP,?GPU也使用了ARM自行設(shè)計(jì)的Mali400多核心GPU,而且不僅整合的是最高端的4核心設(shè)計(jì),還大幅提高了工作頻率——三星官方宣稱獵戶座的3D填充率高達(dá)32億像素每秒,這個(gè)數(shù)字要遠(yuǎn)遠(yuǎn)超過(guò)競(jìng)爭(zhēng)。
視頻解碼是三星的傳統(tǒng)優(yōu)勢(shì),在獵戶座身上這個(gè)優(yōu)勢(shì)依然得到了保持,對(duì)各種格式的硬件編解碼都達(dá)到了1080p級(jí)別。至于內(nèi)存,獵戶座提供了獨(dú)一無(wú)二的DDR3支持,這點(diǎn)是其它競(jìng)爭(zhēng)對(duì)手所不具備的,而對(duì)于DDR2的支持也達(dá)到了最頂級(jí)的LPDDR2 1066,并且同樣支持雙通道。為了方便對(duì)比,讓我們來(lái)列一個(gè)表格:
好,這些就是即將上陣的選手了。下面我們會(huì)依次考量它們?cè)谥T多方面的表現(xiàn),看看究竟哪個(gè)雙核名副其實(shí),哪個(gè)雙核浪得虛名。
較量項(xiàng)目一:處理器核心架構(gòu)作為執(zhí)行計(jì)算任務(wù)的最終單位,處理器核心本身的架構(gòu)無(wú)疑是非常重要的一部分。從ARM11到Cortex A8,同樣頻率下性能的提升可以達(dá)到2~5倍,這無(wú)疑就是核心的優(yōu)勢(shì)。在這四款雙核處理器中,Tegra 2、OMAP4430、Exynos 4210均采用了Cortex A9 MP內(nèi)核,而MSM8x60采用的則是Scorpion MP核心,它們之間有什么差距?要解釋這個(gè)問(wèn)題,我們先要回頭看看Cortex A8和Cortex A9的區(qū)別。
在單核時(shí)代,Cortex A8架構(gòu)是絕對(duì)的主流。作為ARM官方設(shè)計(jì)的產(chǎn)品,雖然Cortex A8和Cortex A9都基于ARM v7指令集架構(gòu),但是它們之間依然有很多的不同點(diǎn),其中最重要,也是用戶最能感覺(jué)到的,是一項(xiàng)叫做亂序執(zhí)行的功能。雖然Cortex A8和Cortex A9都支持同時(shí)執(zhí)行兩條指令,但是只有Cortex A9支持亂序執(zhí)行能力,這個(gè)功能究竟是什么意思?我們知道,計(jì)算機(jī)程序,都是由一條一條的指令組成的。這些指令有很多種功能,有的是把數(shù)據(jù)從一個(gè)地方復(fù)制到另一個(gè)地方,有的是做數(shù)學(xué)運(yùn)算,有的負(fù)責(zé)判斷某一個(gè)條件,有的負(fù)責(zé)從一處跳轉(zhuǎn)到另一處。編譯器會(huì)把所程序員寫出的程序編譯成一條一條順序的指令,就像電器的使用指南一樣,讓處理器遵照它去做。為了方便理解,我們假設(shè)一個(gè)程序的內(nèi)容是做一份考試卷,執(zhí)行的過(guò)程是先做完選擇題,再做完問(wèn)答題;做選擇題的條件是要有鉛筆去涂答題卡,而做問(wèn)答題的條件則是要有鋼筆去寫答題紙。?
如果你忘了帶鉛筆,那么為了完成考卷,就必須要等到鄰座的做完了選擇題,你找他借來(lái)鉛筆,才能繼續(xù)自己的考卷,這樣就耽誤了時(shí)間。對(duì)于一顆標(biāo)準(zhǔn)處理器而言,很多時(shí)候都會(huì)遇到這類“沒(méi)有帶鉛筆”的情況,比如需要訪問(wèn)的數(shù)據(jù)在內(nèi)存里,這就需要處理器通知內(nèi)存管理器,讓內(nèi)存管理器去把數(shù)據(jù)調(diào)入處理器,才能繼續(xù)執(zhí)行這一條指令。由于處理器內(nèi)部的時(shí)鐘延遲是納秒級(jí)別,而內(nèi)存的運(yùn)行頻率則有數(shù)十納秒的延遲,兩者之間差了許多倍,因此處理器一般需要消耗很長(zhǎng)的等待時(shí)間,才能繼續(xù)開始工作,最終的結(jié)果就是性能下降。這時(shí)候,亂序執(zhí)行就派上用場(chǎng)了。一個(gè)程序的指令都是有嚴(yán)格的邏輯順序的,但是所謂的亂序執(zhí)行,就可以打破這種原本的指令順序,在邏輯允許的范圍內(nèi)以一種新的順序去執(zhí)行程序。如果繼續(xù)用考試的例子,那就是這樣:
雖然編譯器生成的考試指南告訴你,要先做完選擇題,再去做問(wèn)答題,但懂得變通的人會(huì)在沒(méi)有鉛筆的時(shí)候先去做問(wèn)答題,這樣就節(jié)省了大量的時(shí)間。支持亂序執(zhí)行的處理器也懂得這樣去“變通”,在遇到需要等待的指令時(shí),如果后面的指令并不需要等待這條指令的結(jié)果,那么就可以先跳過(guò)這條指令,去執(zhí)行后面的指令,大大節(jié)約等待時(shí)間,提升程序性能。當(dāng)然,亂序執(zhí)行并不是沒(méi)有條件的,它要求被亂序的指令之間不存在嚴(yán)格的相關(guān)性。例如假設(shè)問(wèn)答題里需要選擇題的結(jié)果,那么你就不能跳過(guò)選擇題去做問(wèn)答題,只能老老實(shí)實(shí)去等鄰座的鉛筆了。
那么回頭來(lái)看看Scorpion核心。這個(gè)核心是高通在單核時(shí)代設(shè)計(jì)出來(lái)的,雖然也是基于ARM v7指令集架構(gòu),但在具體設(shè)計(jì)上屬于高通自己的實(shí)現(xiàn),與Cortex A8相比有很多區(qū)別,其中最重要的就是高通為Scorpion核心引入了部分的亂序執(zhí)行能力。所謂部分的,就是說(shuō)在某些特定指令序列下,Scorpion可以實(shí)現(xiàn)亂序的效果,Cortex A8則不行。在單核時(shí)代正是由于這點(diǎn),高通的處理器核心在很多測(cè)試中的表現(xiàn)都要稍好于Cortex A8,但是當(dāng)雙核時(shí)代來(lái)臨后,大家都升級(jí)到了支持完整的亂序執(zhí)行的Cortex A9核心,而高通則依然沿用老舊的Scorpion核心,當(dāng)年的優(yōu)勢(shì)就成為了現(xiàn)在的劣勢(shì)。不僅如此,在純執(zhí)行能力上,Scorpion面對(duì)Cortex A9也處于劣勢(shì)。根據(jù)高通提供的數(shù)據(jù),同樣在1000MHz的頻率下,Cortex A8的執(zhí)行能力為2000DMIPS(可以簡(jiǎn)單認(rèn)為是每1周期執(zhí)行兩條指令),Scorpion比它要高一些,為2100DMIPS,但是Cortex A9則高達(dá)2500DMIPS,領(lǐng)先Scorpion接近20%。雖然高通試圖通過(guò)超頻20%的方式彌補(bǔ)這個(gè)差距,但是在單線程性能上,還是被競(jìng)爭(zhēng)對(duì)手甩開了不小的距離,畢竟亂序執(zhí)行的能力在很多應(yīng)用中可以獲得的性能提升遠(yuǎn)遠(yuǎn)不是這200MHz的頻率可以彌補(bǔ)的,而且更高的頻率也會(huì)抵消Scorpion核心在省電上的特點(diǎn)。這點(diǎn)在后面的測(cè)試?yán)镆部梢钥闯鰜?lái)。
英特爾給出的CPU性能參考當(dāng)然,Scorpion核心也不是沒(méi)有自己的優(yōu)勢(shì)。作為高通自行設(shè)計(jì)的核心實(shí)現(xiàn),它在一些方面有著超出ARM官方Cortex A系列的地方,例如它的二級(jí)緩存是直接連在兩顆CPU上,而不是通過(guò)AXI總線共享的,在帶寬和延遲上有著自己的優(yōu)勢(shì)。但是整體而言,Scorpion作為上一代核心,在新一代Cortex A9雙核的面前還是顯得比較孱弱的。最后,我們給這些處理器的核心架構(gòu)作個(gè)評(píng)分(考慮到默認(rèn)頻率):
Tegra 2?★★★★
OMAP4430?★★★★
MSM8x60?★★★
Exynos4210?★★★★★
較量項(xiàng)目二:處理器核心的協(xié)同作戰(zhàn)能力可能多處理器架構(gòu)這個(gè)詞對(duì)于不少讀者而言都是很陌生的,很多人可能從來(lái)都沒(méi)注意到過(guò)這方面的東西。所謂多處理器架構(gòu),就是說(shuō)多顆處理器以何種模式共同運(yùn)行,以怎樣的方式合作執(zhí)行程序。在PC領(lǐng)域,這個(gè)概念并不重要,因?yàn)榇蠹铱吹降亩嗵幚砥?#xff08;多核心處理器也可以看作制作在一個(gè)芯片上的多處理器),在邏輯架構(gòu)上都是一樣的,那就是同步多處理器,英文為Synchronous Multi-Processors,縮寫為SMP(不是對(duì)稱多處理器的那個(gè)SMP)。但是在多處理器體系剛剛出現(xiàn)的階段,曾經(jīng)也有過(guò)很多不同的邏輯架構(gòu),而在目前的手機(jī)市場(chǎng)上就恰恰存在著不采用SMP架構(gòu)的多處理器,那就是高通的MSM8x60。與SMP不同,高通所采用的架構(gòu)名為ASMP,即異步多處理器架構(gòu)。所謂同步和異步,差距并不是簡(jiǎn)單的兩個(gè)字,在具體實(shí)現(xiàn)上的區(qū)別非常大。但是在此我們并不需要了解它們之間學(xué)術(shù)上的區(qū)別,我們只從最粗略的角度來(lái)看一下這兩種架構(gòu)的工作方式。
所謂同步多處理器,顧名思義就是同步的,即多枚處理器運(yùn)行在同樣的時(shí)鐘頻率,共享同樣的緩存數(shù)據(jù),協(xié)同工作。簡(jiǎn)單來(lái)說(shuō),同步多處理器系統(tǒng)在工作的時(shí)候,每當(dāng)一個(gè)任務(wù)完成后,空閑的處理器會(huì)立刻尋找下一個(gè)新的任務(wù),對(duì)于外部而言,這兩顆處理器是一個(gè)整體,共同完成同一個(gè)工作。而異步多處理器則更接近于若干個(gè)獨(dú)立工作的處理器,它們之間可以運(yùn)行在不同的頻率下,每個(gè)處理器維護(hù)自己私有的緩存數(shù)據(jù),最重要的是,它們之間會(huì)利用一種仲裁機(jī)制,以輪流工作的方式執(zhí)行任務(wù)。它們更像是一些互不干擾的獨(dú)立處理器,各自完成各自的事情,輪流執(zhí)行不同的工作。看到這兒,相信大家也看出來(lái)了,同步和異步最大的區(qū)別就在于輪流工作這四個(gè)字。具體而言,就是在同一時(shí)間,只有一顆處理器可以接受任務(wù),另一顆不論是否繁忙,都不能接受新任務(wù)。可能光靠文字說(shuō)明還不是那么生動(dòng),下面我們就來(lái)看幾張圖,了解一下相對(duì)于同步多處理器“誰(shuí)空閑誰(shuí)接單“的工作模式而言,這種輪流工作到底是怎樣進(jìn)行的,又會(huì)導(dǎo)致怎樣的結(jié)果。圖中每一橫行代表一個(gè)時(shí)鐘周期,我們用紅色的方塊代表正在讀取任務(wù),綠色的方塊代表正在執(zhí)行任務(wù),方塊中的數(shù)字代表不同的任務(wù),而空白代表著空閑狀態(tài)。在第一張圖里,我們假設(shè)任何任務(wù)只需要一個(gè)周期就可以執(zhí)行完畢。
可以看到,在每一個(gè)周期內(nèi),異步多處理器架構(gòu)最多只能有一個(gè)核心接受任務(wù),而如果兩個(gè)處理器都空閑,就會(huì)有一個(gè)消極怠工。如圖所示,執(zhí)行四條指令,異步多處理器用了5個(gè)周期,同步多處理器用了4個(gè)周期,異步多處理器慢了25%。那么如果指令執(zhí)行時(shí)間是兩個(gè)周期呢??
當(dāng)指令執(zhí)行長(zhǎng)度為2周期時(shí),新問(wèn)題就出現(xiàn)了。由于ASMP架構(gòu)中,處理器1只能在奇數(shù)周期接受任務(wù),處理器2只能在偶數(shù)周期接受任務(wù),雖然ASMP中的處理器1在第3個(gè)周期的時(shí)候結(jié)束了當(dāng)前的任務(wù),但隨之而來(lái)的第4個(gè)周期卻只有處理器2可以接受任務(wù)。因?yàn)樘幚砥?/span>2此時(shí)正忙于上一個(gè)任務(wù),因此對(duì)于外部程序而言,在第4個(gè)周期上處理器會(huì)處于不可用狀態(tài),等到第5個(gè)周期到來(lái)以后才能繼續(xù)接受新任務(wù)。因此SMP架構(gòu)只需要6個(gè)周期就能完成的任務(wù),ASMP卻消耗了8個(gè)周期,慢了33%。這就是為什么ASMP目前采用的越來(lái)越少的緣故。雖然ASMP存在著設(shè)計(jì)簡(jiǎn)單、結(jié)構(gòu)清晰、耗電較低的優(yōu)勢(shì),但是由于性能不足,在PC領(lǐng)域從來(lái)都沒(méi)有成為過(guò)主流。而在移動(dòng)領(lǐng)域,高通認(rèn)為手機(jī)對(duì)于耗電的要求要大于性能,又希望可以在雙核時(shí)代繼續(xù)沿用單核時(shí)代的核心架構(gòu)而不需要徹底重新研發(fā),因此采用了ASMP架構(gòu)。但是事實(shí)證明,高通在這點(diǎn)上可能有些耍小聰明之嫌,因?yàn)榧热幌M(fèi)者決定購(gòu)買雙核,那么就一定是沖著性能去的,并且對(duì)功耗也已經(jīng)做好了心理準(zhǔn)備。?
最近比較火熱的小米手機(jī)就選用了高通MSM 8260芯片,不過(guò)它自稱的“最快”還要打上一個(gè)問(wèn)號(hào)根據(jù)高通的官方數(shù)據(jù),其1.2GHz的MSM8x60芯片組在滿負(fù)荷工作的時(shí)候,僅處理器部分就要消耗大約1.2瓦特的功率,這相對(duì)于單核時(shí)代不到500毫瓦的功耗而言,也已經(jīng)是非常高的數(shù)值了,這證明了不管怎么去省電,雙核都依然是雙核,既然如此,去追求雙核應(yīng)有的性能顯然應(yīng)該比如何去節(jié)省那么一點(diǎn)點(diǎn)的電更加重要。換一個(gè)方面說(shuō),性能足夠強(qiáng)的話,系統(tǒng)可以以更短的時(shí)間完成任務(wù),進(jìn)而更多地進(jìn)入低功耗的狀態(tài)。高通通過(guò)ASMP也許節(jié)約了一定的耗電,但是其最大33%的性能損失會(huì)導(dǎo)致系統(tǒng)多出33%的時(shí)間處于高功耗狀態(tài),消耗的功率可能抵消甚至反超節(jié)約的,讓高通的如意算盤打空。回到話題上來(lái),可能有些讀者會(huì)認(rèn)為,單獨(dú)來(lái)看,可能ASMP和SMP的差距也并不是那么巨大,在之前圖中的極限狀況下也就相差33%而已,在實(shí)際運(yùn)行中的差距很難達(dá)到這個(gè)數(shù)字。但是不要忘記,之前的文章中我們討論過(guò)亂序執(zhí)行的重要性,那么如果我們將指令等待也引入到之前的圖中,那么會(huì)發(fā)生什么情況呢?在此,我們用灰色的方塊代表需要等待的指令,而等待時(shí)間為兩個(gè)周期。
可以看到,一旦引入指令等待,將亂序執(zhí)行與多核架構(gòu)結(jié)合起來(lái)以后,不支持亂序執(zhí)行的ASMP架構(gòu)(Scorpion@MSM8x60)需要10個(gè)周期才能完成的工作,支持亂序執(zhí)行的SMP架構(gòu)(Cortex A9 MP@其它主流雙核方案)只需要6個(gè)周期,相對(duì)于支持亂序執(zhí)行的SMP而言,不支持亂序執(zhí)行的ASMP架構(gòu)慢了66%。這就是MSM8x60面對(duì)其它雙核Cortex A9的情況。雖然由于實(shí)際運(yùn)行中指令的執(zhí)行長(zhǎng)度可能會(huì)更長(zhǎng),以至于減小輪流工作的影響,但由于Scorpion核心對(duì)亂序執(zhí)行的支持并不完善,因此漫長(zhǎng)的指令等待依然可能會(huì)導(dǎo)致高通的處理器浪費(fèi)大量的時(shí)間,最終性能變慢。這點(diǎn),我們也會(huì)在后續(xù)的測(cè)試中加以體現(xiàn)。同樣,讓我們也來(lái)針對(duì)多處理器架構(gòu),給四款雙核一個(gè)評(píng)分:
Tegra 2?★★★★★
OMAP4430?★★★★★
MSM8x60?★★★★
Exynos4210?★★★★★
較量項(xiàng)目三:通訊總線現(xiàn)代手機(jī)所采用的主芯片早已不能簡(jiǎn)單稱之為處理器,而是一套復(fù)雜得多的系統(tǒng),包含了處理器、顯示加速芯片、內(nèi)存控制器、視頻解碼核心、標(biāo)準(zhǔn)總線控制器等等,有些甚至還包含了數(shù)字信號(hào)處理器,它們被合起來(lái)稱之為片上系統(tǒng)(SoC)。實(shí)際上一顆ARM SoC中,CPU所占據(jù)的硅片面積可能都不到總面積的二十分之一,而其中很大的一部分面積,都被各種各樣的互聯(lián)結(jié)構(gòu)占用了。其實(shí)這也很好理解,片上系統(tǒng)就上一個(gè)大城市,如果交通不暢,整個(gè)城市的運(yùn)行就會(huì)陷入癱瘓。在片上系統(tǒng)里有各種各樣的總線,內(nèi)部的、外部的,私有的、公用的。在這其中有一條最為重要的外部總線,連接著幾乎所有的內(nèi)部設(shè)備,那就是AXI。總線在片上系統(tǒng)中有多重要,可以看下面的這張圖:?
可以看到,幾乎所有的內(nèi)部設(shè)備,都通過(guò)多層次、多區(qū)域的AXI互聯(lián)接口進(jìn)行溝通,更重要的是,內(nèi)存控制器也是通過(guò)AXI連接到處理器,這就意味著不論你的內(nèi)存顆粒或者內(nèi)存控制器可以提供多大的帶寬,處理器能夠獲得的帶寬都直接且僅取決于總線帶寬。因此這個(gè)總線的寬度,決定了整個(gè)系統(tǒng)內(nèi)部最大的內(nèi)存帶寬,同時(shí)也在某些情況下決定了諸如3D GPU這些對(duì)內(nèi)存帶寬需求巨大的模塊的性能。正如城市的發(fā)展需要高速交通一樣,隨著片上系統(tǒng)的復(fù)雜化,內(nèi)部互聯(lián)的帶寬也要求越來(lái)越大。
由于總線方面的信息不屬于一般用戶所理解的范疇,因此廠家往往也不會(huì)對(duì)此做出詳細(xì)的說(shuō)明,所以每一款芯片究竟總線寬度多少也是不容易查證的。這點(diǎn)上nVIDIA相對(duì)而言做的最好,因?yàn)樗麄冊(cè)?jīng)直接把AXI總線位寬標(biāo)在了網(wǎng)頁(yè)上:32bit,類型為AMBA-3(這個(gè)參數(shù)在現(xiàn)在的網(wǎng)頁(yè)上已經(jīng)找不到了,原因未知)。這個(gè)數(shù)字是相當(dāng)“驚悚”的,因?yàn)槿绻偩€寬度真的是32bit,那么意味著Tegra 2的內(nèi)部總線位寬只是ARM11級(jí)別的。因此nVIDIA在Tegra 2的內(nèi)部,很可能采用了與標(biāo)準(zhǔn)ARM不同的總線配置方式,但是不論如何,Tegra 2的總線帶寬都是難以置信的小,即便AXI頻率達(dá)到300甚至400MHz,帶寬最多也只能達(dá)到Cortex A8的水平。根據(jù)測(cè)試,Tegra 2的內(nèi)存復(fù)制成績(jī)大約只能達(dá)到1GB/s左右,這也基本符合其帶寬的表現(xiàn)。再來(lái)看看德州儀器的OMAP4430。與Tegra 2上的諸多猜測(cè)不同,德州儀器提供了OMAP4430的完整技術(shù)手冊(cè),因此各方面的資料非常容易獲取。在OMAP4430中,互連結(jié)構(gòu)分為若干級(jí)別和層次,但是就最主要的而言,是L3互聯(lián)。德州儀器并沒(méi)有采用ARM的AMBA AXI總線,而是在芯片內(nèi)部的主互聯(lián)上采用了Arteris公司的產(chǎn)品:
從圖中可以看出,OMAP4430的L3互聯(lián)寬度為128bit,是Tegra 2的四倍,因此即便工作頻率為200MHz,總帶寬也可以輕易達(dá)到3.2GB/s,遠(yuǎn)遠(yuǎn)超過(guò)Cortex A8和Tegra 2。說(shuō)實(shí)話,這才是雙核Cortex A9 MP應(yīng)有的水準(zhǔn)。當(dāng)然,由于各家SoC的內(nèi)部體系都不太一樣,在此也不能100%確定Tegra 2的實(shí)際情況。這點(diǎn)我們也會(huì)在后面的測(cè)試中繼續(xù)研究。值得注意的是,OMAP4430的兩個(gè)內(nèi)存控制器在搭配LPDDR2 1066的時(shí)候可以提供的最大總帶寬可以超過(guò)8GB/s,但由于總線帶寬緣故,實(shí)際效果可能并不會(huì)有對(duì)應(yīng)的提升,這也是ARM體系中一個(gè)比較頭疼的問(wèn)題之一。言歸正傳,下面繼續(xù)來(lái)看看MSM8x60。一直以來(lái),高通對(duì)于自家芯片的技術(shù)資料都守口如瓶。這維護(hù)了高通的知識(shí)產(chǎn)權(quán),但是卻苦了筆者這樣的人,因?yàn)楦緹o(wú)從查證芯片的詳細(xì)參數(shù),因此只能靠猜測(cè)了。一方面,MSM8x60基本上就是“雙核版”的MSM8x55,另一方面在后續(xù)測(cè)試中也可以看出MSM8x60在內(nèi)存方面的性能并不是很突出,因此在此筆者猜測(cè)MSM8x60的內(nèi)部互聯(lián)可能和單核時(shí)代一樣,即64bit、200MHz,總帶寬1.6GB/s。各位讀者如果有詳細(xì)的信息,也不妨告知。最后我們來(lái)看看Exynos 4210。三星和高通在這個(gè)方面有一定的相似性,也不肯公開提供芯片的技術(shù)手冊(cè)。但是我們?cè)谌亲约旱?/span>Exynos 4210宣傳資料中還是可以發(fā)現(xiàn)一些端倪的。
在圖中可以明顯看出Exynos 4210同樣支持雙通道內(nèi)存(DRAMC0與DRAMC1),而在之前的關(guān)鍵技術(shù)列表中,三星赫然寫出了內(nèi)存帶寬6.4GB/s的數(shù)字。由于Exynos 4210是一顆幾乎全以ARM公司產(chǎn)品打造的芯片,因此這個(gè)數(shù)字就意味著Exynos 4210的內(nèi)部總線寬度可能是驚人的256bit,只有這樣才可以在200MHz的頻率下達(dá)到6.4GB/s的內(nèi)存帶寬。這個(gè)數(shù)字已經(jīng)遠(yuǎn)遠(yuǎn)的甩開了單核Cortex A8、Tegra 2和MSM8x60,甚至比OMAP4430還要高出一倍,在雙核時(shí)代的SoC中顯然是傲視群雄的。
關(guān)于總線的研究就到此為止了,依然按照慣例,最后給一個(gè)分?jǐn)?shù):
Tegra 2?★
OMAP4430?★★★
MSM8x60?★★
Exynos4210?★★★★★
較量項(xiàng)目四:多媒體作為一臺(tái)現(xiàn)代手機(jī),多媒體功能是不可或缺的。早在15年前PC處理器巨頭Intel就高瞻遠(yuǎn)矚,為大家?guī)?lái)了一款叫Pentium MMX的產(chǎn)品,其最大的特色就是引入了名為多媒體擴(kuò)展(Multi Media eXtension,MMX)的擴(kuò)展指令集。何謂多媒體擴(kuò)展指令集?由于原理復(fù)雜堅(jiān)澀,小編就簡(jiǎn)單的打個(gè)比方:廠商們分析平時(shí)處理器干哪些事情最慢、又最經(jīng)常用到,然后把這些最消耗時(shí)間的事情固化成電路,做成一個(gè)額外的部分,和處理器集成到一起。使用的時(shí)候,只通過(guò)一條指令,就能夠訪問(wèn)和計(jì)算多組數(shù)據(jù),把最消耗時(shí)間的事情盡快做完。在計(jì)算機(jī)詞匯里,這種指令集叫做SIMD(Single Instruction Multiple Data,單指令多數(shù)據(jù))指令集。
回到手機(jī)上,在ARM的世界里,由于日益增長(zhǎng)的多媒體計(jì)需求,也出現(xiàn)了屬于ARM自己的多媒體擴(kuò)展指令集,它的名字叫做NEON。它可以幫助處理器加速任何格式視頻的編解碼,幫助顯示芯片加速矢量數(shù)據(jù)的解析和打包,也可以讓系統(tǒng)可以更快的處理幾百萬(wàn)像素的圖片。它所能帶來(lái)的性能提升根據(jù)應(yīng)用的不同,可以從比較明顯的50%,到難以置信的8000%。長(zhǎng)期以來(lái)NEON指令集都是各種高端ARM SoC的標(biāo)配,從ARM11到Cortex A8,基本上所有高端SoC都包含了對(duì)應(yīng)版本的NEON指令集。而在Cortex A9時(shí)代,它更是像是理所應(yīng)當(dāng)一樣,作為一個(gè)基本而不可或缺的功能,出現(xiàn)在各大廠商最高端SoC的藍(lán)圖中。
在德州儀器的OMAP4430和三星的Exynos 4210中,每一個(gè)Cortex A9核心都擁有自己專屬的NEON協(xié)處理器,擁有專用的32個(gè)64位寄存器,以多通道操作的方式,加速系統(tǒng)的多媒體計(jì)算性能。而在MSM8x60中,高通甚至把它的NEON協(xié)處理器的位寬增加到了128bit,兩倍于標(biāo)準(zhǔn)的ARM實(shí)現(xiàn),讓NEON協(xié)處理器可以一次性處理兩倍的數(shù)據(jù),帶來(lái)更大的加速效果。那么Tegra 2呢?令人感到意外的是,不知道出于何種原因或者考慮,Tegra 2沒(méi)有搭配NEON協(xié)處理器。這對(duì)于一顆定位于頂級(jí)的雙核SoC而言是十分不可理解的,因?yàn)?/span>NEON可以為幾乎所有的多媒體過(guò)程提供明顯的加速特性,而nVIDIA卻選擇了放棄。可能有讀者會(huì)說(shuō),Tegra 2有強(qiáng)大的顯示芯片,不需要NEON的加速,但是不要忘記,顯示芯片是不能完全獨(dú)立處理所有的3D運(yùn)算過(guò)程的,其中諸如數(shù)據(jù)解包和組合這種操作還是需要CPU來(lái)完成,由于沒(méi)有NEON,處理器必須要花費(fèi)幾倍于對(duì)手的時(shí)間才能“喂飽”顯示核心,最終的結(jié)果就是性能無(wú)法發(fā)揮。
而在視頻解碼方面,Tegra 2也會(huì)因?yàn)椴痪邆?/span>NEON協(xié)處理器而受到很大的影響。因?yàn)槲覀冎?#xff0c;Tegra 2雖然號(hào)稱可以支持諸多格式的1080p全高清解碼,但是它對(duì)視頻的編碼格式有著非常嚴(yán)格的要求,例如Tegra 2的視頻解碼核心只能硬件解碼Main Profile的H.264視頻,而對(duì)于其它的就只能靠處理器來(lái)進(jìn)行軟件解壓。這時(shí)沒(méi)有NEON協(xié)處理器的幫助,視頻解壓就很難高效的進(jìn)行,最終導(dǎo)致Tegra 2的多媒體特性縮水。也許nVIDIA是認(rèn)為NEON協(xié)處理器的授權(quán)價(jià)格過(guò)于昂貴,或者可能因?yàn)橐?guī)模太大而提升制造成本,而最終選擇了放棄,但作為消費(fèi)者而言,不具備NEON指令集的Tegra 2無(wú)疑會(huì)在多媒體方面的競(jìng)爭(zhēng)中被對(duì)手遠(yuǎn)遠(yuǎn)甩開。好了,關(guān)于多媒體的比拼也要告一段落了,最后我們照例為每個(gè)處理器給出評(píng)分。
Tegra 2?★
OMAP4430?★★★★
MSM8x60?★★★★★
Exynos4210?★★★★
(實(shí)際視頻性能測(cè)試中GS2要比SS好不少,具體原因不知)
較量項(xiàng)目五:3D加速說(shuō)到3D加速,這個(gè)概念哪怕放在區(qū)區(qū)5年前,對(duì)于手機(jī)而言都幾乎是可有可無(wú)的。但是這幾年隨著iOS的崛起,與Android的飛速發(fā)展,3D加速一夜之間變成了高端手機(jī)必備的特性,甚至成為了整個(gè)手機(jī)用戶體驗(yàn)的決定性因素。?
而在新一代雙核Cortex A9 MP SoC中,圖形處理器(GPU)的競(jìng)爭(zhēng)徹底進(jìn)入了白熱化階段。從結(jié)構(gòu)而言,四家的CPU好歹是一個(gè)藍(lán)本(大家所采用的都是ARM v7架構(gòu)),但四家的GPU卻選擇了四種完全不同的方案,這的確從另一方面印證了GPU的重要性與競(jìng)爭(zhēng)的激烈性。nVIDIA作為PC領(lǐng)域圖形技術(shù)的領(lǐng)導(dǎo)者,在這方面是有著先天的巨大優(yōu)勢(shì)。Tegra 2所采用的GPU是nVIDIA自行研發(fā)的GeForce Ultra Low Power,縮寫為GeForce ULP。它擁有四個(gè)頂點(diǎn)處理器,四個(gè)像素處理器,支持OpenGL ES 1.1/2.0、OpenVG等主流標(biāo)準(zhǔn)。在Tegra 2發(fā)布的時(shí)候,這枚GeForce ULP就是nVIDIA的宣傳重點(diǎn),因此消費(fèi)者對(duì)于它的性能也有著極大的期待。
而作為曾經(jīng)參與桌面競(jìng)爭(zhēng)、當(dāng)下專注嵌入式GPU的Imagination公司,自然不愿意讓出嵌入式獨(dú)立GPU市場(chǎng)的性能領(lǐng)導(dǎo)地位。在OMAP4430上,我們看到的就是這家公司設(shè)計(jì)的PowerVR SGX540。這是一顆大家很熟悉的GPU,因?yàn)樵缭趩魏?/span>Cortex A8時(shí)代,三星就在代號(hào)蜂鳥的處理器中采用了這顆GPU,它強(qiáng)大的性能也讓采用蜂鳥處理器的機(jī)型在單核時(shí)代傲視群雄。與GeForce ULP不同的是,PowerVR SGX540內(nèi)并沒(méi)有單獨(dú)的頂點(diǎn)處理器或者像素處理器,而是包含了四組通用處理器。這種類似于桌面顯示核心統(tǒng)一渲染器的設(shè)計(jì)結(jié)構(gòu)可以讓PowerVR GPU用最少的硬件獲取最大的性能,從而節(jié)約成本和功耗。值得一提的是,也正是由于通用處理器的設(shè)計(jì),PowerVR SGX540成為了當(dāng)前唯一一顆支持OpenCL通用運(yùn)算標(biāo)準(zhǔn)的GPU。??
而在高通MSM8x60上,GPU則不出意外的是高通自行設(shè)計(jì)的Adreno。這是高通從前ATi公司收購(gòu)而來(lái)并自行發(fā)展的圖形架構(gòu),經(jīng)過(guò)四代的發(fā)展,來(lái)到了最新的Adreno 220。相對(duì)于單核時(shí)代主流的Adreno 205,這顆GPU可以達(dá)到前者兩倍的性能,從而得以參與到雙核時(shí)代的GPU爭(zhēng)奪戰(zhàn)之中。當(dāng)然,由于高通的“優(yōu)良傳統(tǒng)”,Adreno系列的架構(gòu)一直不得而知,詳細(xì)參數(shù)也很難查明,但是考慮到這是從ATi收購(gòu)而來(lái)的架構(gòu),因此筆者猜測(cè)應(yīng)該也是基于分離的頂點(diǎn)處理器和像素處理器,只是各自的數(shù)量依然不甚明確。而四大雙核里最后登場(chǎng)的Exynos 4210,它在GPU上的選擇也是最為有趣的,因?yàn)樗钶d的是由ARM官方設(shè)計(jì)的Mali400圖形核心。這是一顆相對(duì)而言比較陌生的顯示核心,因?yàn)檫@還是它第一次在頂級(jí)SoC中露面。?
從架構(gòu)上而言,Mali400也基于分離的頂點(diǎn)處理器與像素處理器,從邏輯角度而言要比PowerVR SGX540落后一些,也不支持OpenCL通用運(yùn)算標(biāo)準(zhǔn)。但是這樣的結(jié)構(gòu)在目前的應(yīng)用需求下,性能也未必會(huì)顯得落后。標(biāo)準(zhǔn)的Mali400 GPU包含一組頂點(diǎn)處理器,而像素處理器則可以在一組到四組之間自由搭配,取決于你愿意支付多少授權(quán)費(fèi)和制造成本。由于Exynos 4210是三星最頂級(jí)的ARM SoC,因此三星也當(dāng)仁不讓的選擇了完整的四像素渲染器配置,即Mali400MP4。稍微岔開一下話題,雖然ARM宣稱Mali400的這種設(shè)計(jì)是“多核心”架構(gòu),但筆者認(rèn)為Mali400的“MP”與蘋果A5處理器所采用的PowerVR SGX543MP2的多核是不一樣的,后者才是真正的多核心,而前者只能稱之為像素處理器可變而已。那么這四顆GPU的基礎(chǔ)性能參數(shù)是怎樣的呢?我們來(lái)看下面這張表格:
可以看到,在規(guī)格指標(biāo)方面,Exynos 4210是遙遙領(lǐng)先的,而Tegra 2緊隨其后。至于具體的性能表現(xiàn),我們?cè)诤竺娴臏y(cè)試中將簡(jiǎn)單介紹。值得注意的是,上表中的參數(shù)未必是最終的實(shí)際性能,理論參數(shù)一般都會(huì)受到實(shí)際應(yīng)用環(huán)境的強(qiáng)烈影響。
不過(guò)不管怎樣,我們還是要打個(gè)分的,暫時(shí)按照物理參數(shù)吧。
Tegra 2?★★★★
OMAP4430?★★★
MSM8x60?★★
Exynos4210?★★★★★
這里開始是實(shí)際機(jī)型性能測(cè)試
誰(shuí)是純爺們?四款雙核大混戰(zhàn)經(jīng)過(guò)上述炫目的技術(shù)分析,相信大家都累了。下面就讓我們從一些性能測(cè)試中一窺這幾顆處理器在實(shí)際產(chǎn)品中的表現(xiàn)吧。首先介紹一下采用了這四顆芯片的實(shí)際產(chǎn)品。需要注意的是,下面的測(cè)試并不是每一個(gè)產(chǎn)品都可能會(huì)有數(shù)據(jù),也許某些測(cè)試只會(huì)有一部分的產(chǎn)品參與,而由于各個(gè)手機(jī)的分辨率不同,所以在3D測(cè)試?yán)镆残枰右钥紤],不能只看原始數(shù)據(jù)。有些測(cè)試因?yàn)樘?#xff0c;進(jìn)入雙核時(shí)代后大家的性能都受限于垂直同步而導(dǎo)致沒(méi)有足夠的差異性,例如Neocore,因此這里就不列成績(jī)了。作為對(duì)比,我們額外引入單核的Nexus S,方便大家查看性能區(qū)別。
下面的測(cè)試對(duì)比就將在這五款機(jī)器中展開。首先讓我們來(lái)看看Smartphone Benchmark 2011的結(jié)果。成績(jī)來(lái)源為獨(dú)立第三方手機(jī)性能測(cè)試網(wǎng)站Smartphone Benchmarks的官網(wǎng)首頁(yè),選擇分?jǐn)?shù)的標(biāo)準(zhǔn)為能確認(rèn)的原始頻率下最高的得分,采集時(shí)間為2011年7月15日,下同。
游戲,即GPU方面,可以看到Mali400MP4、SGX540、GeForce ULP得分相近。而生產(chǎn)力,即CPU方面,則是Exynos 4210一枝獨(dú)秀。當(dāng)然這也有一部分原因在于它的默認(rèn)頻率為1.2GHz。但是可以看到的是MSM8x60不論是GPU還是CPU,都被遠(yuǎn)遠(yuǎn)的甩在了后面,甚至還不如單核的S5PC110,其原因不外乎老舊的處理器核心與異步多核心架構(gòu)。然后我們來(lái)看看NenaMark 2.0。成績(jī)來(lái)源依然是官網(wǎng),所有型號(hào)的成績(jī)?nèi)∑骄?#xff1a;?
在這個(gè)測(cè)試中,Exynos 4210的成績(jī)遙遙領(lǐng)先與所有對(duì)手,而Tegra 2也許是因?yàn)檩^低的內(nèi)存帶寬,導(dǎo)致成績(jī)反而不如MSM8x60,甚至和上一代的單核也相去不多。當(dāng)然,Galaxy S II的分辨率只有800x480,這里需要再一次強(qiáng)調(diào)。下面再來(lái)看看另一款測(cè)試,名叫Electopia。這是一款游戲內(nèi)建的測(cè)試,成績(jī)?yōu)檎搲占?#xff1a;
注:由于沒(méi)有Atrix 4G的成績(jī),因此此處用同為Tegra 2的Optimus 2X代替,分辨率800x480。OMAP4430成績(jī)依然欠奉。同樣,Exynos 4210依然遙遙領(lǐng)先,而在這項(xiàng)測(cè)試中Tegra 2依然墊底,甚至不如上一代S5PC110,而且落后MSM8x60的比例比之前更大。
最后我們?cè)賮?lái)看看GLBenchmark的測(cè)試。這是一款以3D為主的測(cè)試軟件,我們選取其中的Egypt場(chǎng)景作為對(duì)比,接著再來(lái)看看處理器性能。成績(jī)來(lái)源為官網(wǎng)。由于此測(cè)試歷史久遠(yuǎn),參測(cè)機(jī)型固件版本眾多,導(dǎo)致平均值參考意義不大,因此各自機(jī)型取最大值。?
注:Atrix 4G沒(méi)能通過(guò)FSAA測(cè)試。再一次,Exynos 4210取得了壓倒性的優(yōu)勢(shì),性能幾乎是第二名的兩倍。而MSM8x60的Adreno 220甚至還比不過(guò)上一代的PowerVR SGX540,不論是單核的S5PC110還是雙核的OMAP4430。和上一個(gè)測(cè)試一樣,Tegra 2再次墊底,原因可能也是因?yàn)閹挷蛔恪O旅嬖賮?lái)看看四款雙核的處理器性能:
在這次測(cè)試中我們又一次看到了Cortex A9對(duì)Scorpion的壓倒性優(yōu)勢(shì)。由于高通依然沿用了上一代的架構(gòu),因此不論是整數(shù)性能還是浮點(diǎn)性能都遠(yuǎn)不如Cortex A9。可惜的是OMAP4430沒(méi)有測(cè)試成績(jī),不過(guò)應(yīng)該和其余兩款Cortex A9 MP相去不大。最后再讓我們來(lái)看一個(gè)不算測(cè)試的測(cè)試:AndroZip解壓。成績(jī)來(lái)源為網(wǎng)站測(cè)試,內(nèi)容為1.2MB的壓縮包解壓,成績(jī)?yōu)楹臅r(shí),參與機(jī)型只有Galaxy S II與Sensation。?
可以看到,同樣的頻率下,MSM8x60所花費(fèi)的時(shí)間為Exynos 4210的300%多,這樣的差距足以說(shuō)明在某些應(yīng)用下,架構(gòu)的區(qū)別可以帶來(lái)多大的差距。由于時(shí)間原因,諸如視頻等多媒體方面的測(cè)試,這里就沒(méi)法提供了,具體的情況如果各位有興趣,可以關(guān)注愛(ài)活網(wǎng)進(jìn)行的后續(xù)測(cè)試。看完了上面的測(cè)試,各位對(duì)這四大雙核應(yīng)該也能有一個(gè)概念了。總體而言,三星沒(méi)有食言,Exynos 4210不論在任何方面,都是雙核中最強(qiáng)的,領(lǐng)先第二名的程度都非常明顯。而OMAP4430則靠著各方面穩(wěn)定而平均的表現(xiàn),成為了雙核時(shí)代另外一個(gè)理想的選擇。高通的MSM8x60在3D測(cè)試中體現(xiàn)出了一定的實(shí)力,但由于架構(gòu)和核心原因,在牽涉到CPU性能的測(cè)試中均潰敗給了所有對(duì)手,實(shí)際表現(xiàn)和單核并沒(méi)有太大差別,筆者認(rèn)為追求雙核性能的用戶選擇高通平臺(tái)并不合適。至于Tegra 2,作為世界上第一款雙核心ARM A9處理器,我們只能說(shuō)它光榮的完成了雙核心的鋪路石作用。由于NV太過(guò)節(jié)省成本,Tegra 2的內(nèi)存帶寬和多媒體指令集都未能完善,導(dǎo)致實(shí)際使用中的體驗(yàn)下降,最終得分和高通MSM8x60一起墊底。作為回顧,我們看看四款處理器都得到了多少顆星:
它們也很重要:功耗和成本看完上述評(píng)測(cè),也許很多人會(huì)覺(jué)得,為什么Tegra 2如此之差??nVIDIA果然還是這方面的菜鳥啊!如果這樣想你就錯(cuò)了,因?yàn)樵谶@些芯片的背后,還有一些重要的參數(shù)和取舍,之前的文章里我們并沒(méi)有提到,那就是成本。眾所周知,芯片是從硅晶圓上切割出來(lái)的,一塊300毫米的晶圓價(jià)格高達(dá)數(shù)十萬(wàn)美元。所以,就像切蛋糕一樣,芯片面積越小,能切出來(lái)的芯片越多,成本自然也就越低了。
但是芯片的面積又取決于晶體管的數(shù)量,而晶體管的數(shù)量往往正比于性能,因此這是個(gè)取舍的過(guò)程。那么這四款雙核的核心面積又是多大,筆者也查詢了一些資料。值得注意的是高通的SoC因?yàn)閮?nèi)置基帶處理器,相對(duì)于其他的SoC而言多出了幾個(gè)模塊,在考慮尺寸的時(shí)候需要注意一下。網(wǎng)上查到的資料畢竟是粗略的,因此在此也不能保證絕對(duì)的準(zhǔn)確性,請(qǐng)各位讀者原諒。?
作為對(duì)比,我們加入了Apple A5的數(shù)據(jù)。可以看到的是,雖然大家在參數(shù)上看差不多,但是面積方面相差卻非常巨大,最小的Tegra 2核心面積甚至不到最大的Apple A5的一半,這意味著一片晶圓可以切割出的Tegra 2數(shù)量是A5的兩倍以上,前者的成本也要大大低于后者。這都是廠商在設(shè)計(jì)芯片時(shí)的選擇問(wèn)題,到底時(shí)傾向于成本,還是傾向于性能,nVIDIA的選擇顯然時(shí)前者,而事實(shí)上也是如此。對(duì)比蘋果A5處理器我們會(huì)發(fā)現(xiàn),單單是PowerVR SGX543MP2這一顆GPU,占據(jù)的芯片面積就幾乎和整顆Tegra 2一樣大。從這個(gè)角度而言,Tegra 2是成功的,因?yàn)樗?/span>GPU只用了對(duì)手不到八分之一的面積,就實(shí)現(xiàn)了幾乎一半的性能,性能成本比無(wú)疑非常可觀。?
Tegra 2的OEM報(bào)價(jià)只需要15~25美元,而作為對(duì)比,上一代三星單核蜂鳥處理器的報(bào)價(jià)就已經(jīng)達(dá)到了20美元,而雙核時(shí)代的獵戶座必然要貴很多,因?yàn)楂C戶座的核心面積也超過(guò)了Tegra 2的兩倍。與價(jià)格相同,芯片面積越多、晶體管規(guī)模越大,滿載時(shí)的功耗就也更大,因此Tegra 2在滿載時(shí)的功耗有可能會(huì)比其他產(chǎn)品小。但問(wèn)題是Tegra 2為了降低成本而去掉的特性太多、砍掉的性能太狠,很多時(shí)候反而得不償失。喪失了成本與性能的平衡點(diǎn),這也許才是nVIDIA犯下的最大的錯(cuò)誤。
而三星則試圖追求最大的內(nèi)部互聯(lián)帶寬,我們也看到了,Exynos 4210可能是唯一一顆采用了256bit內(nèi)部總線的SoC,而這個(gè)總線無(wú)疑也會(huì)占據(jù)相當(dāng)大的硅片面積。而OMAP4430在各方面都較為平庸,因此芯片面積也居于中等水平。可以說(shuō),廠家的側(cè)重各有不同,導(dǎo)致最終產(chǎn)品之間的巨大差異,在這方面,德州儀器做的無(wú)疑是最好的,不論是成本、功耗還是性能都是一個(gè)很適中的檔次,而Exynos 4210與Apple A5則走在了性能的極端,實(shí)際上可以說(shuō)忽略了成本與功耗的表現(xiàn)。而最悲劇的依然是Tegra 2,nVIDI文明用語(yǔ)面追求低成本,導(dǎo)致性能方面慘不忍睹,這可能是nVIDIA在Tegra 2上需要學(xué)到的最大的教訓(xùn)。
寫在最后:被透支的未來(lái)好了,我們的文章至此也要結(jié)束了,如果你仔細(xì)閱讀了我們的內(nèi)容,相信你對(duì)市面上的各種雙核心手機(jī)已經(jīng)心中有數(shù)。雙核大戰(zhàn),四大巨頭,看起來(lái)很熱鬧,不是嗎?但是在這片繁榮的背后,筆者看到的是我們被透支的未來(lái)。2007年,手機(jī)硬件升級(jí)大戰(zhàn)第一把火由蘋果燃起,緊隨其后的Android的發(fā)展,把拼硬件之風(fēng)成功發(fā)揚(yáng)光大。而到了2011年,以nVIDIA為代表的PC企業(yè)的介入,更是把拼硬件的速度與力度提到了史無(wú)前例的地步,一代手機(jī)的生命周期往往只有12個(gè)月。
性能在翻倍,功能在增加,隨之而來(lái)的卻是越來(lái)越高的功耗,越來(lái)越大的發(fā)熱,一天比一天重的電池,和一天比一天短的續(xù)航。根據(jù)高通提供的數(shù)據(jù),工作在1.2GHz的MSM8x60,僅CPU部分的功耗竟高達(dá)1.2瓦,再加上顯示核心,功耗更是不可想象。其實(shí),哪怕我們把時(shí)間推回到短短5年前的ARM11時(shí)代,續(xù)航、功耗,都不是用戶需要去關(guān)心的問(wèn)題,但自從進(jìn)入雙核時(shí)代,高端手機(jī)的續(xù)航時(shí)間就已經(jīng)開始以半天甚至小時(shí)作為單位,而滿載時(shí)外殼高達(dá)50度的巨大發(fā)熱,也在不斷考驗(yàn)著用戶的忍耐極限。每個(gè)人都應(yīng)該問(wèn)自己,這真是我們需要的手機(jī)嗎?相信有很多人會(huì)說(shuō)不是。但廠家可不會(huì)理會(huì)這點(diǎn)。因?yàn)橛布?jí)是一場(chǎng)軍備競(jìng)賽,誰(shuí)也不愿意落在后面。于是,我們?cè)?/span>NV的路線圖上看到了2011年底推出的四核心芯片,看到了28納米將首先用于制造ARM芯片。再過(guò)半年多,新一代的Cortex A15又將扛起新一輪拼硬件的大旗,而頻率會(huì)直沖2GHz。在這樣恐怖的速度背后,我們還有多少資本可以支撐現(xiàn)在的發(fā)展速度?半導(dǎo)體工藝是有物理極限的,業(yè)界迄今為止都對(duì)線寬10納米以下的超大規(guī)模集成電路束手無(wú)策,移動(dòng)計(jì)算市場(chǎng)這輛由廠家和消費(fèi)者共同催動(dòng)的火車,已經(jīng)能看到近在咫尺的懸崖。
幾年后,當(dāng)人們手里拿著的都是裝著散熱器、風(fēng)扇呼呼響的“手機(jī)”,終于意識(shí)到這樣不行的時(shí)候,卻發(fā)現(xiàn)已經(jīng)無(wú)路可退;當(dāng)人們終于開始懷念聊天看書發(fā)短信,充電一次管一周的手機(jī)時(shí),卻發(fā)現(xiàn)這樣做的企業(yè)已經(jīng)倒在了硬件大戰(zhàn)滾滾洪流之中,這才是移動(dòng)產(chǎn)業(yè)的悲劇。其實(shí)在這里寫下這些文字,筆者的心中也充滿著矛盾。消費(fèi)者不可能放棄對(duì)更快更好的追求,也不可能因?yàn)檫@種“與我無(wú)關(guān)”的事情而不再購(gòu)買最新的手機(jī),但如果每個(gè)人都可以認(rèn)識(shí)到自己到底需要什么,都只會(huì)選擇足夠需求的設(shè)備,我們的未來(lái)就可能會(huì)更長(zhǎng)遠(yuǎn)、更健康、更舒適。
從網(wǎng)上1.5G 8260GS2的視頻來(lái)看,1.5G 的8260和1.2g的獵戶流暢度差不多
總結(jié)
以上是生活随笔為你收集整理的MSM8260,OMAP4430,TEGRA2,EXYNOS 4210详细分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: matlab ignoreanalyti
- 下一篇: 丁磊在浙大的演讲