AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

日期:12-07
AMD芯片AI

IT之家12月7日消息,AMD今天凌晨2点举办“AdvancingAI”活动中,正式宣布了旗舰AIGPU加速器MI300X,其性能比英伟达的H100高出60%。

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD公司在演讲过程中,对比英伟达的H100加速卡,分享了MI300X的性能参数情况,IT之家附上数值如下:

AMD提到,在训练性能方面,MI300X与竞争对手(H100)不相上下,并提供具有竞争力的价格/性能,同时在推理工作负载方面表现更为出色。

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

MI300XAI加速卡软件堆栈升至ROCm6.0,改善支持生成式AI和大型语言模型。

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

新的软件堆栈支持最新的计算格式,如FP16、Bf16和FP8(包括Sparsity)。

AMDInstinctMI300X是最受关注的芯片,因为它针对的是AI领域的NVIDIA的Hopper和英特尔的Gaudi加速器。

该芯片完全基于CDNA3架构设计,混合使用5nm和6nmIP,AMD组合这些IP,让其晶体管数量达到1530亿个。

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

设计方面,主中介层采用无源芯片布局,该芯片使用第4代InfinityFabric解决方案容纳互连层。中介层总共包括28个芯片,其中包括8个HBM3封装、16个HBM封装之间的虚拟芯片和4个有源芯片,每个有源芯片都有2个计算芯片。

每个基于CDNA3GPU架构的GCD总共有40个计算单元,相当于2560个内核。总共有八个计算芯片(GCD),因此总共有320个计算和20,480个核心单元。在良率方面,AMD将缩减这些内核的一小部分,我们将看到总共304个计算单元(每个GPU小芯片38个CU),总共有19,456个流处理器。

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

内存方面,MI300X采用HBM3内存,容量最高192GB,比前代MI250X(128GB)高50%。该内存将提供高达5.3TB/s的带宽和896GB/s的InfinityFabric带宽。

AMD为MI300X配备了8个HBM3堆栈,每个堆栈为12-Hi,同时集成了16GbIC,每个IC为2GB容量或每个堆栈24GB。

相比之下,NVIDIA即将推出的H200AI加速器提供141GB容量,而英特尔的Gaudi3将提供144GB容量。

在功耗方面,AMDInstinctMI300X的额定功率为750W,比InstinctMI250X的500W增加了50%,比NVIDIAH200增加了50W。

其中一种配置是技嘉的G593-ZX1/ZX2系列服务器,提供多达8个MI300XGPU加速器和两个AMDEPYC9004CPU。这些系统将配备多达8个3000W电源,总功率为18000W。

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

AMD 王牌加速卡 MI300X 出世:训练 AI 模型比英伟达 H100 最高快 60%

消息称苹果 iPhone SE 4 将使用 iPhone 14 同款电池,以降低成本 AMD “Advancing AI” 活动正式开启
相关阅读: