Os conjuntos de treinamento de IA/ML em larga escala e os dados de HPC de hoje precisam de três elementos para acelerar as cargas de trabalho:
Aceleração rápida em vários tipos de dados
Grande memória
Largura de banda para lidar com dados enormes e largura de banda de E/S extrema.
Você obtém todos os três com a plataforma AMD InstinctTM MI300X com GPUs baseadas na arquitetura AMD CDNATM de 3ª geração:
42 petaFLOPs de pico teórico FP8 com desempenho de precisão de escassez para treinamento generativo de IA e ML
1,3 petaFLOPs de pico teórico FP32 de precisão para os códigos HPC mais desafiadores.
Plataforma de placa de base universal (UBB 2.0) baseada no padrão do setor hospeda 8 aceleradores AMD InstinctTM MI300X
1,5 TB de memória HBM3 para ajudar a processar os modelos de IA e cargas de trabalho de HPC mais exigentes.
Oito conexões de E/S de host x16 PCIe® Gen 5, você não precisa se preocupar com gargalos de dados.
O resultado final é uma plataforma baseada em padrões abertos que incorporam a tecnologia comprovada AMD InstinctTM, que deve impulsionar alguns dos supercomputadores mais rápidos do mundo, e uma plataforma de software aberta que está pronta para oferecer suporte a você.
GPU discreta de ponta para IA e HPC
A GPU discreta AMD InstinctTM MI300X é baseada na arquitetura AMD CDNATM 3 de última geração, oferecendo eficiência e desempenho de liderança para os aplicativos de IA e HPC mais exigentes.
Ela foi projetada com 304 unidades de computação de alto rendimento, funções específicas de IA, incluindo novo suporte a tipo de dados, decodificação de fotos e vídeos, além de 192 GB sem precedentes de memória HBM3 em um acelerador de GPU.
O uso de tecnologia de empilhamento de matrizes e chiplets de última geração em um pacote multichip impulsiona IA generativa, aprendizado de máquina e inferência, ao mesmo tempo em que estende a liderança da AMD na aceleração de HPC.
O MI300X oferece desempenho excepcional para nossa geração anterior que já está alimentando o supercomputador mais rápido da classe exaFLOP1, oferecendo 13,7x o desempenho de pico de carga de trabalho de IA/ML usando FP8 com escassez em comparação com os aceleradores AMD MI250X* anteriores usando FP16MI300-16 e uma vantagem de pico de 3,4x para cargas de trabalho de HPC em cálculos FP32.MI300-11.
Baseado na arquitetura Infinity de 4ª geração
O acelerador AMD Instinct MI300X é baseado na arquitetura Infinity de 4ª geração e a arquitetura AMD CDNATM 3 oferece alto rendimento com base na tecnologia AMD Matrix Core aprimorada geracionalmente e unidades de computação simplificadas. A GPU AMD Instinct MI300X também oferece suporte a PCIe® Gen 5 com tecnologia AMD Infinity FabricTM, ajudando a melhorar o desempenho de E/S, a eficiência e o dimensionamento dentro e entre cada dispositivo OAM na placa-mãe universal.