Tesla推出搭載 NVIDIA A100 GPU、用於訓練自駕車的頂尖超級電腦

特斯拉 (Tesla) 於 CVPR 2021 大會中，宣布自家用於訓練自動輔助駕駛與自動駕駛功能的深度神經網路超級電腦。該叢集使用 720 個節點，每個節點搭載 8 個 NVIDIA A100 Tensor 核心 GPU (共 5,760 個 GPUs)，以 1.8 exaflops 的運算效能表現引領業界。

Karpathy 表示：「這是一台令人難以置信的超級電腦。我相信針對其每秒浮點運算，這將是全球排名第五的超級電腦。」

NVIDIA A100 GPU 提供各種規模的加速能力，以支援全球運算效能最高的資料中心。採用 NVIDIA Ampere 架構的 A100 GPU，其效能表現較前一代提升 20 倍，且可以分割多達七個 GPU 執行個體，並依照不斷變化的需求進行調整。GPU 叢集是特斯拉垂直整合自動駕駛的其中一部分，其透過超過百萬輛在路上行駛的汽車來完善和建立新功能，並持續改進。

特斯拉的開發週期始於汽車。以「影子模式 (shadow mode)」運行的深度神經網路，在不實際控制車輛的情況下，會在汽車的行駛過程中悄悄進行感知並做出預測。此時這些預測內容與錯誤或誤判的情況會被記錄下來，接著，特斯拉的工程師使用這些執行個體，建立一個複雜且多元場景的訓練資料集，讓深度神經網路 (DNN) 更加完善。

特斯拉收集了約一百萬個以 36 FPS 錄製的十秒鐘畫面，累計出高達 1.5PB 的資料量。接著，深度神經網路在資料中心反覆執行這些場景，直到未出現任何錯誤。最後，再將訓練完的深度學習神經網路送回車輛，並再次展開這個過程。Karpathy 表示：「這種以大量資料來訓練深度神經網路的方式，需要使用『龐大的運算量』，這也是為什麼特斯拉使用高效能的 A100 GPU 來建立和部署當前的超級電腦。」