近日,NVIDIA正式宣布推出其Blackwell GPU架构的升级版本——Blackwell Ultra,具体型号包括B300和GB300。这一新一代产品预计于今年晚些时候上市,并将首次支持PCIe 6.0技术,显著提升数据传输带宽,同时带来高达50%的性能提升。然而,性能的跃进也伴随着功耗的大幅增加,Blackwell Ultra的最大功耗达到了1400W,引发行业对能效平衡的关注。

Blackwell Ultra采用台积电4NP制程工艺制造,集成了2080亿个晶体管。其核心架构通过两个Die经由NV-HBI高速互连界面连接,带宽高达10TB/s。该GPU配备了总计160个SM单元,每个SM包含128个CUDA核心,以及640个第五代Tensor核心,所有单元共享一致性的二级缓存。在互联技术方面,GPU间通过第五代NVLink实现1.8TB/s的带宽,而GPU与CPU之间的NVLink-C2C通道带宽为900GB/s,这些特性与前代产品保持一致。

此次升级的一大技术亮点是首次引入PCIe 6.0支持。这一新标准使得可用带宽直接翻倍,大幅加速了数据在GPU与其他系统组件之间的传输效率。同时,Blackwell Ultra搭载的HBM3E内存容量从192GB增加至288GB,内存带宽达到8TB/s,进一步强化了其在高带宽应用场景中的表现。

性能方面,Blackwell Ultra在NVFP4 dense稠密计算任务上的性能达到15PFlops,较前代提升50%。其sparse稀疏计算性能保持在20PFlops,显示出在AI推理和训练中的持续优势。特别值得注意的是,在特殊功能单元(SFU)EX2架构下,注意力加速能力从5TF/s大幅提升至10.7TF/s,增长超过一倍,这对于Transformer类模型的处理尤为关键。不过,在FP8、FP16和TF16等常用数据格式方面,性能表现基本维持不变,说明升级重点集中于特定计算场景的优化。

尽管性能显著增强,Blackwell Ultra的功耗水平也达到了新的高度,标定最大功耗为1400W。这一数值反映出高性能计算硬件在追求算力提升过程中面临的散热与能效挑战。行业分析认为,此类高功耗产品将进一步推动液冷等先进散热技术在数据中心的普及。

根据NVIDIA的规划,Blackwell Ultra将主要应用于GB300 NV72服务器平台。该平台采用液冷机架设计,每个计算节点整合两颗B300 GPU与一颗Grace CPU,旨在为人工智能和高性能计算领域提供更强大的计算支持。这一部署形态显示出NVIDIA在整合CPU与GPU资源、优化整体系统性能方面的持续努力。

Blackwell Ultra的发布不仅是NVIDIA产品线的一次重要迭代,也反映了AI与HPC行业对算力需求不断增长的现状。其性能提升和新技术引入有望推动大规模模型训练、科学计算和实时推理应用的发展,但功耗的大幅上升也提醒行业需更加关注能效管理和可持续发展。

在Blackwell Ultra之后,NVIDIA还计划推出名为“Rubin”的全新GPU架构,显示出其在加速计算领域的长期技术布局。未来,随着PCIe 6.0等新标准的逐步落地,以及液冷等散热解决方案的成熟,高性能计算硬件的发展将更加注重性能、功耗和成本之间的多维平衡。

本文来源于极客网,原文链接: https://www.fromgeek.com/latest/701594.html

分类: 暂无分类 标签: 暂无标签

评论