教您如何打造屬於自己的Tesla個人超級電腦系統
此指南將協助您打造Tesla個人超級電腦。如果您過去曾經建置過系統/工作站,你可能會想要建構自己的系統。不過,最省事的方法還是向這些經銷商購買現成的Tesla個人超級電腦。
就像是建造任何系統一般,您得自負風險和責任。當您建造此一系統時,可供選擇的元件很多。針對此,NVIDIA提供一般性的指導原則,但是並無法針對元件的每種組態及組合進行測試。
針對個人超級電腦的打造,為何Tesla產品會優於消費等級產品?這也是我們常常會被問到的問題。請點擊此處瞭解更多詳細資訊。
主要元件的最低規格需求
這些最基本的規格是針對想要讓自己的系統躍為「Tesla個人超級電腦」的用戶所訂定的。您也可以選擇打造一個工作站,則在系統中可採用較少量的Tesla GPU。
- 3x Tesla C1060
- 四核心中央處理器: 2.33 GHz (Intel or AMD)
- 12GB的系統記憶體 (每一Tesla C1060配備4GB系統記憶體)
- Linux 64位元或Windows XP 64位元
- 系統噪音 < 45 dBA
- 1200 W 電源供應
完整的4片Tesla C1060系統的組態
此為建製一台4x Tesla C1060個人超級運算電腦所需的元件建議列表。部分元件,例如記憶體、中央處理器、電源供應器、機殼可由適當的同級元件取代。我們並不針對個人超級運算電腦進行認證,此工作由系統製造業者負責。
4片Tesla C1060的組態
| Tyan S7025 |
| 4x PCI-e x16第二代插槽 |
| 4x Tesla C1060 |
| 板上繪圖卡(PCI-e插槽之一置入NVIDIA GPU可運作Linux, Windows) |
| 雙槽 Intel Xeon Nehalem |
| 24 GB (6x 4GB) DDR3 DIMMs (主機板佔高達64 GB) |
| Coolmax CUQ-1350B 1350W |
| Lian Li PC-P80 |
| 640 GB |
| DVD燒錄機 |
| 適用於Intel Xeon |
預建的SuperMicro SuperServer 7046GT-TRF
擁有4顆GPU的系統、雙槽Nehalem、高達96 GB的記憶體
3片Tesla組態+1 Quadro FX800
主機板
Tesla C1060運算處理器為一寬度加倍的PCI-e x16第二代機板,其也適用於第一代PCI-e x16插槽,但是這會造成CPU和GPU之間的系統頻寬變窄,可能會影響應用的效能表現(視不同應用而有差別)
所以,你使用的主機板必需具有3或4個PCI-e x16插槽,且為互相隔開的雙插槽。
中央處理器
根據你所使用的主機板選擇中央處理器。建議至少採用2.33 GH007A雙核心中央處理器,例如:
- Intel Xeon 或 Core i7 雙核心
- AMD Phenom 或Opteron 雙核心
系統記憶體
由於每一個Tesla皆具備4GB的GPU記憶體,所以我們建議每一個Tesla C2050需配備至少3GB,更佳為4GB的系統記憶體。因此,一台擁有 3個 Tesla C2050的系統需配備至少12 GB的系統記憶體,而具有4個 Tesla C2050的系統則需配備至少16 GB的系統記憶體。
電源供應
電源供應器的選擇很多,需選擇額定功率至少為1350瓦的優質電源供應器,其中一個例子為Coolmax CUQ-1350B 1350W電源供應器。雖然我們建議一個Tesla C2050需配備一個6接腳和一個8接腳的電源線,但是某些電源供應器,例如Coolmax CUQ-1350B能以兩個6接腳連接器提供足夠的負載。選擇電源供應器時,徹底瞭解規格是非常重要的。
硬碟機, DVD及其他元件
硬碟和DVD光碟機由您選擇。一般而言,最好是配備至少160GB的硬碟機。
電腦機箱 / 底座
機箱 / 底座的選擇非常重要,若要插入4片Tesla C1060板子,則需要具有4個插槽的機箱(其大於一般的ATX機箱)
市面上具有8個以上插槽的機箱
- ABS Canyon 695
- Ashinne ASR405
- Chenbro RM41300G
- Lian-Li PC-P80
- ThermalTake ArmorPlus
也可以使用擁有7個插槽的底座,切割出的第8個插槽則用於插入四片雙寬度GPU板。請自行嘗試,風險自負。
系統散熱
某些系統機箱(例如Lian-Li)自身便具有系統風扇。一般而言,我們建議機箱需至少配備一個風扇,如此才能吹散Tesla板周圍的熱空氣(例如直接對著主機板吹)。關鍵在於需保持機箱內部的溫度低於攝氏45度。
作業系統
建議採用Linux 64位元或 Window XP 64位元,使高容量記憶體、高效能系統能進行最佳運作。若您比較傾向採用Win7,則我們建議使用TCC驅動程式以達到CUDA的最高效能。TCC驅動程式僅適用於Tesla產品系列。您可在
nvidia.com.tw的一般驅動程式下載頁面中找到最新的TCC驅動程式;若要下載舊版的TCC驅動程式,則請連至:
http://www.nvidia.com.tw/object/tesla-win7-64bit-259.03-whql-driver-tw.html請確定已詳細閱讀版本重點,瞭解TCC未提供支援的部分。
驗證系統
在你組裝好系統並安裝作業系統後,請自
CUDA 專區下載CUDA驅動程式、CUDA工具套件以及可自由選擇的CUDA SDK範例。
在你下載CUDA驅動程式、CUDA工具套件以及CUDA SDK範例後,請運作以下來自CUDA SDK的指令。
- deviceQuery
- bandwidthTest --memory=pinned --device=N
- 針對系統中的四片C1060,分別在N=0, 1, 2, 3各運作一次。
- 此將報告CPU和每一GPU之間往返的PCI-E頻寬
- PCI-E x16第二代的頻寬峰值介於5和6 GBytes/sec。PCI-E x16第一代和PCI-E x8第二代為上述峰值的一半。
- nbody --benchmark --n=131072 --device=N
- 同步運作範例,範例數目與系統中的Tesla GPU的數目相同
- 亦即,針對4片Tesla C1060,需同步運作4個範例N=0,1,2,3
- 此將在所有的Tesla GPU運作nbody程式
請使用
DGEMM 預燒測試以測試安裝的穩定性。
問題的報告
針對個人建置自有的Tesla個人超級電腦,NVIDIA並不提供直接的協助。我們建議您可至CUDA論壇發問,向其他曾自行組建這些系統的CUDA開發人員尋求協助。
進一步瞭解Tesla C1060
寄出您的Tesla個人超級電腦的圖片,我們將在PSC照相館中展出。,我們將在PSC照相館中展出。