Intel最强AI加速器可以卖给中国!但挥刀砍掉一半
Intel日前发布了新一代AI加速器Gaudi 3,本来美国政府是不会允许卖给中国的,但是没想到Intel已经同步准备好了中国特供版本! Gaudi 3采用台积电5nm工艺,配备了8个矩阵引擎、64个张量核心、96MB SRAM缓存、1024-bit 128GB HBM2E内存(带宽3.7TB/s),还有16个PCIe 5.0通道、24个2000GbE网络、JPEG/VP9/H.264/H.265解码器,提供OAM兼容夹层卡、通用基板、PCIe扩展卡三种形态。 Intel声称,它相比上代拥有2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络功耗为600W带宽、1.5倍的内存带宽,而对比NVIDIA H100 LLM推理性能领先50%、训练时间快40%。 Gaudi 3的首发版本编号HL-325L,OAM形态,已经出货,功耗900W,风冷散热。 它的中国特供版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,但既然功耗少了一半,算力差不多也会被腰斩。 10月份还会有个液冷版本HL-335,支持双路并联,但不能卖给中国,也没有特供版。 PCIe扩展卡形态将在9月份出货,风冷,满血版编号HL-338,,中国特供版编号HL-388,功耗又被限制在450W。 通用基板形态的编号为HLB-325,但具体规格和出货时间暂时不详。 说起来,NVIDIA是最早做中国特供版AI加速器的,也就是H800、A800,后来也被禁售了,最近又拿出了H20、L20、L2、RTX 4090D,都能卖。 AMD也设计了特供版Instinct MI309、MI388X,但都被美政府以算力还是太强为由给打回,而年底将要升级到MI350。
Intel日前发布了新一代AI加速器Gaudi 3,本来美国政府是不会允许卖给中国的,但是没想到Intel已经同步准备好了中国特供版本!
Gaudi 3采用台积电5nm工艺,配备了8个矩阵引擎、64个张量核心、96MB SRAM缓存、1024-bit 128GB HBM2E内存(带宽3.7TB/s),还有16个PCIe 5.0通道、24个2000GbE网络、JPEG/VP9/H.264/H.265解码器,提供OAM兼容夹层卡、通用基板、PCIe扩展卡三种形态。
Intel声称,它相比上代拥有2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的网络功耗为600W带宽、1.5倍的内存带宽,而对比NVIDIA H100 LLM推理性能领先50%、训练时间快40%。
Gaudi 3的首发版本编号HL-325L,OAM形态,已经出货,功耗900W,风冷散热。
它的中国特供版将在6月份推出,编号HL-328,功耗减半至450W,HMB内存、缓存、解码器等完全保留,但既然功耗少了一半,算力差不多也会被腰斩。
10月份还会有个液冷版本HL-335,支持双路并联,但不能卖给中国,也没有特供版。
PCIe扩展卡形态将在9月份出货,风冷,满血版编号HL-338,,中国特供版编号HL-388,功耗又被限制在450W。
通用基板形态的编号为HLB-325,但具体规格和出货时间暂时不详。
说起来,NVIDIA是最早做中国特供版AI加速器的,也就是H800、A800,后来也被禁售了,最近又拿出了H20、L20、L2、RTX 4090D,都能卖。
AMD也设计了特供版Instinct MI309、MI388X,但都被美政府以算力还是太强为由给打回,而年底将要升级到MI350。