去年11月份,AMD发布了顶级加速计算卡Instinct MI100,首次采用针对HPC高性能计算,AI人工智能全新设计的CDNA架构,和游戏向的RDNA架构截然不同。现在,第二代的MI200也首次浮出了水面。

MI100采用台积电7nm工艺制造,集成120个计算单元,7680个流处理器,并专门加入Matrix Core(矩阵核心)用于加速HPC,AI运算,还整合了4096-bit 32GB HBM2显存,支持PCIe 4.0 x16和八卡并行,整卡功耗300W。

它的FP64双精度浮点性能首次突破10TFlops(也就是每秒1亿亿次),混合精度和FP16半精度的AI性能提升接近7倍。

根据最新消息,MI200将会采用下一代CNDA架构,并首次引入MCM多芯片封装,看这样子翻番到1.5万个流处理器问题不大。

本次曝光的MI200将用于HPE Cray EX超级计算机,执行加速计算,产品名被描述为“MCM Special FIO Accelerator”,其中FIO代表“Factory Installation Option”(厂商安装选项),此外还有OAM形态,代表开源加速卡。

不过,MI200的具体规格目前一无所知,除了猜测流处理器可能因为MCM封装而翻一番,还有望加入FullRate640ps指令集,支持全速率FP64浮点计算。

MI200预计今年晚些时候发布,未来将搭配代号“Trento”(特伦托)的霄龙处理器,共同用于AMD为美国国防部打造的百亿亿次超级计算机“Frontier”。

Trento并未出现在AMD霄龙演进路线图上,其实是即将发布的第三代“Milan”(米兰)的定制版,专为超算优化,可能会提前支持PCIe 5.0。