第一生活网

Intel Ponte Vecchio 的性能似乎比 Nvidia 的 A100 高 2.5 倍

郎灵心
导读 英特尔在 Hot Chips 34 上详细介绍了该公司的 Ponte Vecchio Xe-HPC GPU。在提供的基准测试中,该芯片制造商声称 Ponte Vecchio

英特尔在 Hot Chips 34 上详细介绍了该公司的 Ponte Vecchio Xe-HPC GPU。在提供的基准测试中,该芯片制造商声称 Ponte Vecchio 的性能比Nvidia A100高出 2.5 倍。但是,按照惯例,对供应商提供的基准测试稍加注意。

在英特尔选定的几项基准测试中,Ponte Vecchio 的表现明显优于 A100。英特尔的强国也在 miniBUDE 中领先 2 倍,在 ExaSMR 中领先 1.5 倍。这是一个有趣的比较,因为 Ponte Vecchio 还没有推出,而 A100 (Ampere) 自 2020 年以来一直在市场上。别忘了,据报道 AMD 的Instinct MI250X (Aldebaran) 比 A100 快三倍。所以英特尔应该担心 AMD 和 Nvidia 的下一代 HPC 产品。

如果英特尔的数据准确无误,Ponte Vecchio 可能会成为 Nvidia 下一代H100(Hopper)的潜在竞争对手。根据我们目前掌握的规格,H100 的速度至少应该是 A100 的两倍,而 AMD 的Instinct MI300更具威胁性,它将Zen 4 CPU 和 CDNA 3 GPU 小芯片融合到一个产品中。AMD 被称为世界上第一个数据中心 APU,声称与 Instinct MI250X 相比,Instinct MI300 的 AI 训练性能提升了 8 倍。

Ponte Vecchio 将提供三种版本:OAM、带有 Xe 链路的 x4 子系统,以及在双插槽Sapphire Rapids平台上带有 Xe 链路的 x4 子系统。不幸的是,蓝宝石急流遭受了如此多的延误,以至于它不再有趣了。除非遇到进一步的挫折,否则 Sapphire Rapids 的一些产品最终可能会在 10 月首次亮相。尽管如此,大批量芯片可能要到 2023 年 2 月才能到货。

在其 OAM 外形尺寸中,Ponte Vecchio 拥有对四个 GPU 和八个 GPU 平台的支持。两栈式 Ponte Vecchio 配置可输出 52 TFLOP 的 FP32 和 FP64 性能。作为比较,单个 H100 SXM5 模块在 FP32 的 60 TFLOP 和 FP64 的 30 TFLOP 性能上达到峰值。

Ponte Vecchio 具有 64MB 的寄存器文件,可输出高达 419 TBps 的带宽。L1 和 L2 缓存分别为 64MB 和 408MB。Ponte Vecchio 上的大型 L2 缓存有利于特定工作负载,例如 2D-FFT 案例和 DNN 案例。在演示文稿中,英特尔的结果显示,在这两种情况下,性能都从 80MB 大幅提升到 408MB。