IT之家12月7日消息,AMD今天凌晨2点举办“AdvancingAI”活动中,正式宣布了旗舰AIGPU加速器MI300X,其性能比英伟达的H100高出60%。
AMD公司在演讲过程中,对比英伟达的H100加速卡,分享了MI300X的性能参数情况,IT之家附上数值如下:
AMD提到,在训练性能方面,MI300X与竞争对手(H100)不相上下,并提供具有竞争力的价格/性能,同时在推理工作负载方面表现更为出色。
MI300XAI加速卡软件堆栈升至ROCm6.0,改善支持生成式AI和大型语言模型。
新的软件堆栈支持最新的计算格式,如FP16、Bf16和FP8(包括Sparsity)。
AMDInstinctMI300X是最受关注的芯片,因为它针对的是AI领域的NVIDIA的Hopper和英特尔的Gaudi加速器。
该芯片完全基于CDNA3架构设计,混合使用5nm和6nmIP,AMD组合这些IP,让其晶体管数量达到1530亿个。
设计方面,主中介层采用无源芯片布局,该芯片使用第4代InfinityFabric解决方案容纳互连层。中介层总共包括28个芯片,其中包括8个HBM3封装、16个HBM封装之间的虚拟芯片和4个有源芯片,每个有源芯片都有2个计算芯片。
每个基于CDNA3GPU架构的GCD总共有40个计算单元,相当于2560个内核。总共有八个计算芯片(GCD),因此总共有320个计算和20,480个核心单元。在良率方面,AMD将缩减这些内核的一小部分,我们将看到总共304个计算单元(每个GPU小芯片38个CU),总共有19,456个流处理器。
内存方面,MI300X采用HBM3内存,容量最高192GB,比前代MI250X(128GB)高50%。该内存将提供高达5.3TB/s的带宽和896GB/s的InfinityFabric带宽。
AMD为MI300X配备了8个HBM3堆栈,每个堆栈为12-Hi,同时集成了16GbIC,每个IC为2GB容量或每个堆栈24GB。
相比之下,NVIDIA即将推出的H200AI加速器提供141GB容量,而英特尔的Gaudi3将提供144GB容量。
在功耗方面,AMDInstinctMI300X的额定功率为750W,比InstinctMI250X的500W增加了50%,比NVIDIAH200增加了50W。
其中一种配置是技嘉的G593-ZX1/ZX2系列服务器,提供多达8个MI300XGPU加速器和两个AMDEPYC9004CPU。这些系统将配备多达8个3000W电源,总功率为18000W。