Os aceleradores AMD Instinct™ MI250X são projetados para turbinar cargas de trabalho HPC e potencializar descobertas na era da exascale.
Produto Lacrado de Fábrica
O acelerador de computação Instinct MI250X da AMD é, sem dúvida, um dos produtos mais impressionantes que a empresa lançou nos últimos anos.
Esta placa alimentará o primeiro supercomputador exascale do setor, chamado Frontier, bem como implantações menores de computação de alto desempenho (HPC).
Nossa matemática aproximada diz que cada um dos dois chips de GPU mede ~790 mm^2, colocando-os entre as maiores GPUs feitas.
Todos os três supercomputadores exascale americanos anunciados até o momento usarão a arquitetura de supercomputador Cray Shasta da HPE.
Dois deles (Frontier e El Capitan) serão alimentados pelos processadores EPYC da AMD e aceleradores Instinct, enquanto o terceiro será baseado nas CPUs escaláveis Xeon da Intel e nas GPUs de computação Ponte Vecchio (Aurora).
A AMD está definida para alimentar o primeiro sistema exascale do mundo (pelo menos no que diz respeito aos números oficiais) que deve ser implantado nas próximas semanas ou meses.
A GPU de computação Instinct MI250X da AMD, codinome Aldebaran, consiste em dois chips de computação gráfica (GCDs) que cada um contém 29,1 bilhões de transistores e é equipada com 64 GB de memória HBM2e conectada usando uma interface de 4096 bits (128 GB HBM2e em uma interface de 8192 bits no total).
Com 14.080 processadores de fluxo e desempenho de 96 FP64 TFLOPS, o Instinct MI250X é o acelerador HPC de mais alto desempenho lançado até o momento.
A peça vem em um fator de forma de módulo acelerador aberto (OAM) e mede 102 mm x 165 mm, o que é bem grande.
Cada GCD tem seu próprio conjunto de chips de suporte, incluindo controladores de energia, módulos reguladores de tensão e firmware.
Para colocar esses tamanhos de matriz em contexto, o A100 da Nvidia tem 826 mm^2. Tendo em mente quantos processadores de fluxo FP64 cada Aldebaran embala (7040 SPs) e o fato de que esses SPs precisam ser alimentados com muitos dados, entendemos que o design é muito intensivo em SRAM, razão pela qual o tamanho do chip é enorme (já que a SRAM mal escala atualmente).
Processadores complexos tendem a consumir muita energia, e o fator de forma OAM é exatamente o que o médico receitou para esses aceleradores, pois pode fornecer até 700 W de energia.
O Instinct MI250X da AMD consome até 550 W fornecidos por um módulo regulador de tensão de 26 fases.