近日,NVIDIA Blackwell GPU的實測數據終于浮出水面,其強悍性能引發了業界的廣泛關注。此前,這款GPU的強大能力僅限于官方宣傳,但現在,我們有了來自MLCommons MLPerf v4.1的權威性能測試結果,為我們揭示了Blackwell的真實實力。
在與前兩代服務器HGX B200和HGX H200的對比中,Blackwell GPU展現出了顯著的優勢。尤其是在AI訓練推理性能方面,其表現尤為突出。在GPT-3預訓練項目中,相較于上一代Hopper,Blackwell的性能實現了翻倍的增長。
更為驚人的是,在Llama 2 700億參數微調項目中,Blackwell的性能提升了高達2.2倍。這一成就得益于其先進的硬件配備,包括ConnectX-7 SuperNICs網卡、Quantum-2 InfiniBand交換機,以及第五代NVLink互連總線。這些技術保障了節點間的通信效率,使得AI訓練負載能夠得到平衡分配,進而提升了整體效率。
舉例來說,在處理GPT-3 1750億參數性能的任務時,Hopper需要多達256顆GPU,而Blackwell則僅需64顆,這一對比充分展現了Blackwell的高效與強大。
此次實測數據的公布,不僅印證了NVIDIA Blackwell GPU的卓越性能,更為AI領域的發展注入了新的活力。無疑,Blackwell將成為未來AI訓練和推理的重要推動力。