Tesla

NVIDIA® Tesla® P100
現代數據中心的無限運算能力
現代數據中心的無限運算能力

歷來最先進的數據中心 GPU

用於無人駕駛車輛的人工智慧。預測氣候變化。治療癌症的全新藥物。世界上有些極度重要的問題必須現在就解決,但需要耗費龐大的運算資源才可能實現。現今數據中心仰賴許多互連設備運算節點,使得驅動重要高效能運算 (HPC)超大規模工作負載的所需效能受到限制。

NVIDIA® Tesla® P100 是歷來最先進的 GPU 加速器,專為數據中心所設計。採用全新的 NVIDIA Pascal™ GPU 架構以提供地表最快的運算節點,效能更勝數百個較緩慢的設備運算節點。數量更少的飆速節點能促成更高的效能,讓數據中心不僅可大幅增加輸送量,還可節省成本。

有了超過 400 種 HPC 加速應用程式 (包括前 10 大 HPC 應用程式中的 9 項應用程式) 及所有深度學習架構,現在每一位 HPC 客戶都可以將加速器部署於數據中心。

 

Tesla P100 可透過 NVLink 提升數據中心應用程式高達 50 倍的效能

NVIDIA Tesla P100 performance versus Tesla K80
 

TESLA P100 加速器的功能與優點

Tesla P100 從硬體到軟體均重新設計,在每個設計環節都加入創新元素。每項劃世代技術都展現效能的大躍進,促成全球最快運算節點的誕生。

 
Pascal 架構帶來顯著的效能提升

Pascal 架構帶來顯著的效能提升

全新的架構讓 Tesla P100 能為 HPC 和超大規模的工作負載提供最高的絕對效能。Pascal 具有高達每秒 21 兆次半精度 (FP16) 浮點運算的效能,相當適合在深度學習技術開發新機會的應用中。Pascal 同時也提供分別超過 5 跟 10 兆次 雙精度 (FP64) 和單精度 (FP32) 運算效能,能用於 HPC 的應用需求

 
NVIDIA NVLink 釋放大型應用程式效能

NVIDIA NVLink 釋放大型應用程式效能

效能時常會因為互連而受到限制,但革命性的 NVIDIA NVLink™ 高速雙向互連機制卻比現今最佳技術快上 5 倍,能運用多 GPU 擴充應用程式運算。
注意: PCIe 專用的 Tesla P100 目前不支援此技術。

HBM2 堆疊記憶體帶來前所未有的效率

HBM2 堆疊記憶體帶來前所未有的效率

Tesla P100 透過 HBM 2 技術新增推疊記憶體,以TSMC CoWoS (Chip-on-Wafer-on-Substrate) 緊密整合同個封裝晶片上的運算和資料元件,使得記憶體效能可比前代 Maxwell 高上 3 倍,讓包含大量資料的應用程式在解決時間方面出現跨世代的進步。


 
頁面移轉引擎使程式設計更為簡便

虛擬記憶體分頁移轉引擎使程式設計更簡便

「虛擬記憶體分頁移轉引擎」(Page Migration Engine) 讓開發人員更能專注於調整程式效能的代碼,減少在管理資料移動所花費的時間。應用程式支援虛擬記憶體分頁,擴充程度可超越 GPU 的實體記憶體大小,最高支援到 2TB。

 
CoWoS 是台灣積體電路製造股份有限公司的註冊商標
Tesla P100

專為巨大規模 HPC 所設計的 NVIDIA Tesla P100

Tesla P100 搭載 NVIDIA NVLink™ 技術,可利用飆速節點大幅縮短巨大規模應用程式的解決時間。伺服器節點可透過 NVLink,以 5 倍的 PCIe 頻寬互連高達 8 個 Tesla P100 GPU。節點旨在協助解決 HPC 和深度學習中近乎無限的運算需求這項全球最關鍵的挑戰。

 

專為各種工作負載 HPC 所設計的 NVIDIA Tesla P100

透過 PCIe 專用的 Tesla P100,處理各種工作負載的 HPC 數據中心便可大幅提升效能並節省成本。例如,由 4 個與 PCIe 互連的 Tesla P100 所提供技術支援的單一 GPU 加速節點,可取代高達 32 個設備 CPU 節點,提升多種應用程式的效能。若以數量較少卻效能強大的節點完成所有工作,客戶就可節省數據中心高達 70% 的整體成本。

專為各種工作負載 HPC 所設計的 NVIDIA Tesla P100
 

NVIDIA TESLA P100 加速器的效能規格

 
  P100 for PCIe-Based
Servers
P100 for NVLink-Optimized Servers
Double-Precision Performance 4.7 TeraFLOPS 5.3 TeraFLOPS
Single-Precision Performance 9.3 TeraFLOPS 10.6 TeraFLOPS
Half-Precision Performance 18.7 TeraFLOPS 21.2 TeraFLOPS
NVIDIA NVLink™ Interconnect Bandwidth - 160 GB/s
PCIe x16 Interconnect Bandwidth 32 GB/s 32 GB/s
CoWoS HBM2 Stacked Memory Capacity 16 GB or 12 GB 16 GB
CoWoS HBM2 Stacked Memory Bandwidth 732 GB/s or 549 GB/s 732 GB/s
Enhanced Programmability with Page Migration Engine Check Check
ECC Protection for Reliability Check Check
Server-Optimized for Data Center Deployment Check Check

TESLA P100 產品文件

Pdf
NVIDIA Pascal 圖文說明 (PDF – 1.03MB)
Pdf
NVIDIA Pascal 架構白皮書
(PDF – Registration Required)
 
 

立即取得 NVIDIA Tesla P100

Tesla P100 現已上市,只在專為深度學習打造的 NVIDIA® DGX-1™ 深度學習系統。

深入瞭解