NVIDIA分享BlackwellGPU计算统计数据FP64比Hopper高30%

导读 NVIDIA分享了其下一代BlackwellGPU架构的更多性能统计数据,该架构已席卷业界。该公司分享了多项指标,包括使用Grace驱动的Superchip模块时...
2024-05-14 15:16:12

NVIDIA分享了其下一代BlackwellGPU架构的更多性能统计数据,该架构已席卷业界。该公司分享了多项指标,包括使用Grace驱动的Superchip模块时与即将推出的Hopper芯片和竞争对手的x86CPU相比的科学、人工智能和模拟结果。

NVIDIABlackwellGPU带来的巨大性能提升不仅限于人工智能、科学和模拟领域也得到了巨大提升

在一篇新的博客文章中,NVIDIA分享了BlackwellGPU将如何为研究领域提高更多性能,其中包括量子计算、药物发现、聚变能源、基于物理的模拟、科学计算等。当该架构最初在GTC2024上宣布时,该公司展示了一些大数据,但我们尚未正确了解该架构本身。当我们等待的时候,公司有更多的数据供我们使用。

从细节开始,NVIDIABlackwellGPU架构的最大目标之一是降低成本和能源需求。NVIDIA表示,Blackwell平台可以以降低200倍的成本和减少300倍的能源来模拟天气模式,而运行涵盖整个地球的数字孪生模拟则可以将成本降低65倍,能源减少58倍。

NVIDIA还展示了其BlackwellGPU的双精度FP64(浮点)功能,其额定TFLOP比Hopper高出30%。单个HopperH100GPU提供约34TFLOP的FP64计算性能,单个BlackwellB100GPU提供约45TFLOP的计算性能。Blackwell主要采用GB200Superchip,其中包括两个GPU和GraceCPU,因此FP64计算能力约为90TFLOP。AMDMI300X和MI300AInstinct加速器采用单芯片,在单芯片上提供81.7和61.3TFLOP的FP64功能。

虽然NVIDIA的BlackwellGPU在传统的密集浮点性能方面有所退步,但这并不会削弱其计算能力。该公司首先展示了CadenceSpectreX仿真中的仿真性能,与ASIC和传统CPU相比,该仿真在BlackwellGB200上的运行速度提高了13倍,CFD(计算流体动力学)提高了22倍。该芯片也比A100和GraceHopper(GH200)系统快很多。

NVIDIA迅速转变态度,再次为我们带来AI性能,其BlackwellGB200GPU平台再次占据主导地位,其GPT(1.8万亿参数)比H100提高了30倍。GB200NVL72平台可将吞吐量提高30倍,同时实现能源效率提高25倍和TCO(总运营成本)降低25倍。即使将GB200NVL72系统与72x86CPU进行比较,Blackwell系统的增益也将达到18倍,数据库连接查询的增益也将比GH200NVL72系统的增益提高3.27倍。

免责声明:本文由用户上传,如有侵权请联系删除!