Tesla

提供強大功能,將使用者體驗提升至全新境界
為深度學習推論工作負載增加輸送量,與反應靈敏的體驗
為深度學習推論工作負載增加輸送量,與反應靈敏的體驗

AI 加速深度學習推論

在人工智慧 (AI) 新時代,GPU 深度學習,讓人工智慧執行複雜工作時,能發揮超人類的準確度,改善我們的日常生活體驗。互動式語音、電腦視覺與預測分析,只是 GPU 所訓練的一部分深度學習模型,且這些領域皆展現了超乎預期的非凡成果。經過改良的準確度,也讓經過訓練的網路複雜度爆炸性成長。由於現代用來進行推論的網路部署在 CPU 上,人工智慧服務無法提供使用者參與所需的反應靈敏度。

NVIDIA® Tesla® P40 與 P4 加速器提供您最佳解決方案,為深度學習推論工作負載提供最高的輸送量,與反應靈敏的體驗。這些加速器採用 NVIDIA Pascal 架構 推論效能相較於 CPU,速度增加 60 倍以上,即便是在最複雜的深度學習模型中,都能帶來即時的靈敏反應。

 

NVIDIA TESLA 推論加速器

Deep Learning Inference Latency

Deep Learning Inference Throughput

 
最大化深度學習推論輸送量

最大化深度學習推論輸送量

Tesla P40 專為提供最高的深度學習推論輸送量而打造。因為每部 GPU 擁有 47 TOPS (47 兆次浮點運算) 的推論效能,配備 8 個 Tesla P40 的單一伺服器就能夠取代 100 個 CPU 伺服器。

Pdf
Tesla P40 產品型錄 (PDF – 166KB)
 

為水平擴充伺服器提供超高效率的深度學習

Tesla P4 專為加速任何向外延展伺服器而設計,與 CPU 相比,能源效率提高 40 倍。

Pdf
Tesla P4 產品型錄 (PDF – 164KB)
Tesla P4
 

DEEP LEARNING ACCELERATOR FEATURES AND BENEFITS

這些功能強大的 GPU,能使人工智慧應用程式預測更快速,促成美妙的使用者體驗。

 
輸送量提升 100 倍,能夠跟上爆炸性成長的資料

輸送量提升 100 倍,能夠跟上爆炸性成長的資料

感測器紀錄、影像、影片與錄音等形式的資料,每天產生的資料量若用 CPU 處理,完全不具經濟效益。採用 Pascal 架構的 GPU 讓資料中心能夠大幅提升輸送量,不只能夠提升深度學習部署工作負載,更有助於從資料海嘯中找出各類情資。一部配備 8 組 Tesla P40 的伺服器可完成的深度學習工作負載,超過 100 部只配備 CPU 的伺服器,因此能以更低的購買成本,獲得更高的輸送量。

 
為全新人工智慧影片服務提供專屬的解碼引擎

為全新人工智慧影片服務提供專屬的解碼引擎

因為配備能同時使用 CUDA® 核心進行推論的 NVIDIA 硬體加速解碼引擎,Tesla P4 與 P40 最高可即時分析 39 部 HD 影片串流。透過將深度學習整合至影片工作流程,客戶現在可以為使用者提供更上一層樓的智慧與創新影片服務。

低耗能的水平擴充伺服器帶來前所未有的效率

低耗能的水平擴充伺服器帶來前所未有的效率

效率超高的 Tesla P4 GPU 能夠加速密度最佳化的水平擴充伺服器,且尺寸很小,設計上能源足跡也只有 50/75 W。與 CPU 相比,進行同樣的深度學習推論工作負載,能源效率卻大幅提升了 40 倍。這讓需要處理超大規模資料的客戶,能夠在現存的基礎架構中進行調整,並為需求呈倍數成長的人工智慧應用程式提供服務。



 
使用 NVIDIA TensorRT™ 與 DeepStream SDK 讓部署更快速

使用 NVIDIA TensorRT™ 與 DeepStream SDK 讓部署更快速

TensorRT 是為了最佳化深度學習模型,以進行生產部署所打造的程式庫。此程式庫使用經過訓練的神經網路,通常是 32 位元或 16 位元的資料,並將這些網路最佳化,以便使用在精準度較低的 INT8 作業上。 NVIDIA DeepStream SDK 利用 Pascal GPU 的功能,能夠同時解碼與分析影片串流。

 

PERFORMANCE SPECIFICATION FOR NVIDIA TESLA P40 AND P4 ACCELERATORS

 
  超高效率水平擴充伺服器專屬的 Tesla P4 最高推論輸送量伺服器專屬的 Tesla P40
單精度效能 5.5 兆次浮點運算 12 兆次浮點運算
整數運算 (INT8) 22 TOPS (22 兆次浮點運算)* 47 TOPS (47 兆次浮點運算)*
GPU 記憶體 8 GB 24 GB
記憶體頻寬 192 GB/秒 346 GB/秒
系統介面 PCI Express 短卡尺寸 雙插槽、PCI Express 標準版尺寸
電源 50 W/75 W 250 W
硬體加速影片引擎 1x 解碼引擎、2x 編碼引擎 1x 解碼引擎、2x 編碼引擎

*啟用加速時脈時的每秒兆次浮點運算

NVIDIA TESLA P40 與 P4 產品文件

Pdf
Tesla P40 產品型錄 (PDF – 166KB)
Pdf
Tesla P4 產品型錄 (PDF – 164KB)
 
 

立即取得 NVIDIA Tesla P40 與 P4

Tesla P40 與 P4 現已提供深度學習推論功能。

經銷據點