在 GTC 2022 上,Nvidia 首席执行官 Jensen Huang 终于分享了有关公司 Arm 努力的更多细节,因为他推出了公司新的 144 核 Grace CPU Superchip,这是该公司第一款专为数据中心设计的仅 CPU 的 Arm 芯片。基于 Neoverse 的系统支持 Arm v9,并作为两个 CPU 与 Nvidia 新品牌的 NVLink-C2C 互连技术融合在一起。Nvidia 声称 Grace CPU Superchip 在 SPEC 基准测试中提供的性能比其自己的 DGX A100 服务器中的两个上一代 64 核 AMD EPYC 处理器高出 1.5 倍,并且是当今领先服务器芯片的两倍。总体而言,Nvidia 声称 Grace CPU Superchip 将于 2023 年初出货,将成为市场上最快的处理器,适用于超大规模计算、数据分析和科学计算等广泛的应用。
鉴于我们对 Arm 路线图的了解,Hopper CPU 超级芯片基于 N2 Perseus 平台,这是第一个支持 Arm v9 的平台。该平台采用 5nm 设计,支持所有最新的连接技术,如 PCIe Gen 5.0、DDR5、HBM3、CCIX 2.0 和 CXL 2.0,比 V1 平台提供高达 40% 的性能。
此外,Nvidia 还分享了有关 Grace Hopper Superchip 的新细节,这是其之前发布的 CPU+GPU 芯片. Nvidia 还宣布了其新的 NVLink 芯片到芯片 (C2C) 接口,这是一种支持内存一致性的芯片到芯片和芯片到芯片互连。NVLink-C2C 可提供高达 25 倍的能效,比 Nvidia 目前使用的 PCIe 5.0 PHY 的面积效率高 90 倍,支持高达 900 GB/s 或更高的吞吐量。该接口支持 CXL 和 Arm 的 AMBA CHI 等行业标准协议,并支持从基于 PCB 的互连到硅中介层和晶圆级实现的各种连接。令人惊讶的是,Nvidia 现在允许其他供应商将该设计用于他们自己的小芯片。此外,Nvidia 宣布将支持新的 UCIe 规范。让我们深入了解细节。
在我们了解新的 Grace CPU 超级芯片之前,您需要快速回顾一下它的第一次实例化。Nvidia 去年首次宣布了最初称为Grace CPU的产品,但该公司没有分享太多细粒度的细节。Nvidia 现在已将第一次尝试的名称更改为 Grace Hopper Superchip。
Grace Hopper Superchip 在一个载板上有两个不同的芯片,一个 CPU 和一个 GPU。我们现在知道 CPU 有 72 个内核,使用基于 Neoverse 的设计,支持 Arm v9,并与 Hopper GPU 配对。这两个单元通过 900 GBps NVLink-C2C 连接进行通信,提供 CPU 和 GPU 之间的内存一致性,从而允许两个单元同时访问 LPDDR5X ECC 内存池,据称带宽比标准系统提高了 30 倍。
Nvidia 最初没有公布设计中使用的 LPDDR5X 数量,但在这里我们可以看到该公司现在声称拥有“600GB 内存 GPU”,其中肯定包括 LPDDR5X 内存池。我们知道 LPDDR5X 每个封装的最高容量为 64GB,这意味着 CPU 配备了高达 512GB 的 LPDDR5X。同时,Hopper GPU 通常具有 80GB 的 HBM3 容量,使我们接近 Nvidia 的 600GB 数字。让 GPU 访问该数量的内存容量可能会对某些工作负载产生变革性影响,尤其是对于经过适当优化的应用程序。