组装自己的tesla超级计算机
原文鏈接:blog.csdn.net/xqj198404/article/details/20016279
NVIDIA鏈接:http://www.nvidia.cn/object/tesla_build_your_own_cn.html
組裝屬于您自己的Tesla個(gè)人超級(jí)計(jì)算機(jī)
如何打造屬于你自己的Tesla個(gè)人超級(jí)計(jì)算機(jī)系統(tǒng)
本指南將幫助你組裝一臺(tái)Tesla個(gè)人超級(jí)計(jì)算機(jī)。如果你具備組裝系統(tǒng)和工作站的經(jīng)驗(yàn),那么你可能希望打造一個(gè)屬于自己的系統(tǒng)。不過(guò),最簡(jiǎn)單的方法還是從這些經(jīng)銷商那里購(gòu)買一臺(tái)現(xiàn)貨供應(yīng)的Tesla個(gè)人超級(jí)計(jì)算機(jī)。
和打造任何其他系統(tǒng)一樣,你需要自己承擔(dān)其中的風(fēng)險(xiǎn)和責(zé)任。在打造這樣一個(gè)系統(tǒng)時(shí),有諸多部件供您選擇。NVIDIA?(英偉達(dá)?)提供了一般性的指南,但無(wú)法對(duì)部件的每一種配置及組合進(jìn)行測(cè)試。
我們也遇到了許多用戶的提問(wèn),他們想要知道在打造個(gè)人超級(jí)計(jì)算機(jī)這方面,為什么Tesla產(chǎn)品優(yōu)于消費(fèi)級(jí)產(chǎn)品。點(diǎn)此了解更多細(xì)節(jié)。
主要部件的最低配置這些最低技術(shù)規(guī)格是針對(duì)這些意欲打造“Tesla Personal Supercomputer”系統(tǒng)的用戶而制訂的。 如果是打造工作站的話,你可以將Tesla GPU的配備數(shù)量縮減一些。
- 3x Tesla C1060
- 四核CPU: 2.33 GHz (Intel或AMD)
- 系統(tǒng)存儲(chǔ)器12 GB (每片Tesla C1060搭載4GB內(nèi)存)
- Linux 64-bit或者Windows XP 64-bit
- 系統(tǒng)噪音 < 45 dBA
- 電源:1200 W
這是打造一臺(tái)四路Tesla C1060個(gè)人超級(jí)計(jì)算機(jī)所需的一份推薦組件清單。這些組件中,像內(nèi)存、CPU、電源、機(jī)箱等許多組件都可以由合適的同類產(chǎn)品替代。我們不對(duì)任何個(gè)人超級(jí)計(jì)算機(jī)組件進(jìn)行認(rèn)證,認(rèn)證工作由系統(tǒng)集成商來(lái)完成。
搭載4片 Tesla C1060計(jì)算處理器的配置| 主板 | Tyan S7025 |
| PCI-e帶寬 | x4 PCI-e x16 Gen2 插槽 |
| Tesla GPUs | 4x Tesla C1060 |
| 顯卡 | 板載顯卡 (當(dāng)一條PCI-e插槽上搭載NVIDIA GPU時(shí)可支持Linux,Windows操作系統(tǒng) |
| CPU | 雙插口 Intel Xeon Nehalem |
| 內(nèi)存 | 24 GB (6x 4GB) DDR3 DIMM (主板搭載高達(dá)64 GB) |
| 電源 | Coolmax CUQ-1350B 1350W |
| 機(jī)箱 | Lian Li PC-P80 |
| 硬盤驅(qū)動(dòng)器 | 640 GB |
| DVD 光驅(qū) | 刻錄DVD |
| CPU風(fēng)扇,散熱片 | 適用于Intel Xeon |
預(yù)置SuperMicro SuperServer 7046GT-TRF
4 GPU 系統(tǒng),dual-socket Nehalem,高達(dá)96 GB存儲(chǔ)
| PCI-e帶寬 | x4 PCI-e x16 Gen2 插槽 | x4 PCI-e x8 Gen2 插槽 |
| ? | 搭載3片 Tesla計(jì)算處理器的配置 + 1塊Quadro FX雙槽寬度顯卡 | 搭載3片 Tesla計(jì)算處理器的配置 + 1塊Quadro FX單槽寬度顯卡 |
| 主板 | ASUS P6T7 WS SuperComputer | AsRock X58 SuperComputera |
| Tesla GPUs | 3x Tesla C1060 | 3x Tesla C1060s |
| Display GPU | 1x Quadro FX 或 NVS | 1x Quadro NVS 或 FX (單槽) |
| CPU | Intel Xeon E55xx / Core i7 | Intel Core i7 |
| 最小顯存容量 | 24 GB DDR3 | 24 GB DDR3 |
| 電源 | 1200W | 1200W |
主板
Tesla C1060計(jì)算處理器是一塊具有雙倍寬度PCI-e x16插槽的第二代載板。它同樣適用于第一代PCI-e x16插槽,不過(guò)會(huì)導(dǎo)致CPU和GPU之間的系統(tǒng)帶寬變窄,從而影響到應(yīng)用性能(取決于應(yīng)用)。
因此,你需要使用具有3或4條PCI-e x16插槽的主板,并且是彼此隔開的雙插槽。
CPUs
CPU的選擇取決于你所使用的主板。我們推薦使用不小于2.33 GHz的四核CPU,如:
- Intel Xeon 或 Core i7 quad-core
- AMD Phenom 或 Opteron quad-core
因?yàn)槊恳粔KTesla C2050均擁有4GB顯存,所以我們建議至少為每一塊Tesla C2050配備3GB,最好是4GB的系統(tǒng)內(nèi)存。 因此,一臺(tái)配備了3塊Tesla C2050的系統(tǒng),至少要配備12 GB系統(tǒng)內(nèi)存。一臺(tái)4塊Tesla C2050的系統(tǒng)則至少要配備16GB系統(tǒng)內(nèi)存。
電源
可以選擇的電源有許多種。 要選擇一部額定功率至少1350瓦的高品質(zhì)電源。 例如可以選擇Coolmax CUQ-1350B 1350W電源。 雖然我們建議每一塊Tesla C2050都使用一根6針和一根8針輔助電源連接器,但是一些電源例如Coolmax CUQ-1350B用兩根6針電源連接器即可提供足夠的電力。 選擇電源時(shí),了解技術(shù)規(guī)格是非常重要的。
硬盤驅(qū)動(dòng)器、DVD及其他部件
由你自己決定硬盤及DVD驅(qū)動(dòng)器的選擇。一般而言,最好是選用至少160GB的硬盤驅(qū)動(dòng)器。
電腦機(jī)箱
電腦機(jī)箱的選擇很重要,這是因?yàn)楫?dāng)你插入4塊Tesla C1060板,它需要一個(gè)具有8個(gè)插槽的機(jī)箱(比常見的ATX機(jī)箱大)。
具有8個(gè)插槽且能現(xiàn)貨供應(yīng)的機(jī)箱有
- ABS Canyon 695
- Ashinne ASR405
- Chenbro RM41300G
- Lian-Li PC-P80
- ThermalTake ArmorPlus
也可以選用具有7個(gè)插槽的機(jī)箱,切割出第8個(gè)插槽讓其適用于4塊雙倍寬度的GPU板!這些都由你自己決定!
系統(tǒng)散熱有些系統(tǒng)機(jī)箱(如Lian-Li)自己配有系統(tǒng)風(fēng)扇。一般而言,我們建議至少安裝一個(gè)機(jī)箱風(fēng)扇,以吹散Tesla板邊的空氣(例如,對(duì)準(zhǔn)主板吹氣)。其關(guān)鍵在于使機(jī)箱內(nèi)的環(huán)境溫度低于45C。
操作系統(tǒng)
建議采用Linux 64位元或 Window XP 64位元,使高容量?jī)?nèi)存、高效能系統(tǒng)能進(jìn)行最佳運(yùn)作。如果你更青睞Win7,那么我們建議使用TCC驅(qū)動(dòng)程序以實(shí)現(xiàn)最高CUDA性能。 TCC驅(qū)動(dòng)程序是Tesla系列產(chǎn)品專用的驅(qū)動(dòng)程序。 用戶可在 nvidia.cn網(wǎng)站上的一般驅(qū)動(dòng)程序下載頁(yè)中找到最新的TCC驅(qū)動(dòng)程序,如果想要下載舊版的TCC驅(qū)動(dòng)程序,敬請(qǐng)?jiān)L問(wèn): http://www.nvidia.cn/object/tesla-win7-64bit-259.03-whql-driver-cn.html。請(qǐng)確保已經(jīng)看過(guò)了驅(qū)動(dòng)程序版本亮點(diǎn),已經(jīng)了解TCC驅(qū)動(dòng)程序不支持的內(nèi)容。
對(duì)系統(tǒng)進(jìn)行校驗(yàn)
在你組裝完系統(tǒng)并安裝好操作系統(tǒng)之后,請(qǐng)從 CUDA Zone下載CUDA 驅(qū)動(dòng)程序、CUDA工具箱,還可以選擇下載CUDA SDK示例。
在下載CUDA 驅(qū)動(dòng)程序、CUDA工具箱、CUDA SDK示例之后,運(yùn)行CUDA SDK中的下列命令。
- deviceQuery
- 由此可得到系統(tǒng)中Tesla GPU的數(shù)目
- bandwidthTest --memory=pinned --device=N
- 分別在N=0, 1, 2, 3 時(shí)為每一片 C1060運(yùn)行一次
- 由此可得到距離CPU及每一個(gè)GPU的PCI-E帶寬
- 第二代PCI-E x16帶寬的峰值為5-6 GBytes/秒。第一代 PCI-E x16和第二代PCI-E x8的帶寬峰值大約為該值的一半
- nbody --benchmark --n=131072 --device=N
- 同時(shí)運(yùn)行示例的數(shù)目同系統(tǒng)中Tesla GPU的數(shù)目一致
- 對(duì)于搭載4片Tesla C1060的系統(tǒng),同時(shí)運(yùn)行4個(gè)示例 N=0,1,2,3
- 執(zhí)行這一命令將在所有的Tesla GPU上運(yùn)行nbody程序
反饋所遇到的問(wèn)題
NVIDIA?(英偉達(dá)?)不會(huì)為組裝Tesla個(gè)人超級(jí)計(jì)算機(jī)的個(gè)人直接提供支持。我們建議大家利用 CUDA 論壇向其他CUDA 開發(fā)人員咨詢他們?cè)诖蛟爝@些系統(tǒng)方面的經(jīng)驗(yàn)。
總結(jié)
以上是生活随笔為你收集整理的组装自己的tesla超级计算机的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: defer的用法
- 下一篇: ios安装app提示【未受信任的企业级开