> Controle de congestionamento baseado em telemetria
> Descarregamentos de estruturas de comunicação
Acelere as cargas de trabalho de IA com 800G InfiniBand.
Os switches NVIDIA Quantum-X800 InfiniBand oferecem 800 gigabits por segundo (Gb/s) de taxa de transferência, com latência ultrabaixa e NVIDIA In-Network Computing avançada, essencial para lidar com IA generativa em escala de trilhões de parâmetros.
Esses switches incorporam recursos avançados, incluindo acesso remoto direto à memória (RDMA), o Protocolo de Agregação e Redução Hierárquica Escalável (SHARP)TM NVIDIA® de quarta geração, roteamento adaptável, controle de congestionamento baseado em telemetria e tecnologias de autocorreção.
Esses aprimoramentos elevam o desempenho geral do aplicativo em data centers de computação de alto desempenho (HPC) e IA.
Principais benefícios
> Maior escala para IA: os switches NVIDIA Quantum-X800 permitem velocidades 2X mais rápidas e escalabilidade 5X maior para malhas de computação de IA. Uma topologia de árvore gorda Quantum-X800 de duas camadas pode suportar mais de 10.000 conexões de host de 800 Gb/s.
> Computação em rede de última geração: os switches Quantum-X800 suportam SHARP para descarregamento eficiente de operações de computação para a rede, aumentando o desempenho em até 9X. A quarta geração do SHARP adiciona suporte para precisão FP8 e novas operações coletivas, como ReduceScatter e ScatterGather.
> Maior largura de banda efetiva e isolamento de desempenho: os switches Quantum-X800 suportam roteamento adaptativo aprimorado e controle de congestionamento baseado em telemetria. Isso permite largura de banda efetiva quase perfeita, bem como isolamento de desempenho para ambientes multilocatários e multitarefas.
> Operações de software aprimoradas: os switches Quantum-X800 incluem o NVIDIA Networking OS Software (NVOS) para gerenciamento abrangente de chassis e configuração de sistema. O NVOS suporta várias interfaces, incluindo uma interface de linha de comando (CLI), APIs REST, Simple Network Management Protocol (SNMP) e telemetria gRPC Network Management Interface (gNMI).
“Os switches NVIDIA Quantum-X800 InfiniBand são essenciais para atingir IA generativa em escala de trilhões de parâmetros.”
Switches NVIDIA Quantum-X800
O switch NVIDIA Quantum-X800 Q3400-RA 4U, o primeiro a alavancar a tecnologia de serializador/desserializador (SerDes) de 200 Gb/s por faixa, melhora significativamente o desempenho e a largura de banda da rede.
Ele apresenta 144 portas a 800 Gb/s distribuídas em 72 gaiolas octais de pequeno formato plugáveis (OSFP).
O alto radix do switch suporta uma topologia fat-tree de dois níveis capaz de conectar até 10.368 placas de interface de rede (NICs) com latência mínima e localidade de trabalho ideal, bem como outras topologias que fornecem conectividade a dezenas de milhares de GPUs. O Q3400 é resfriado a ar.
Os data centers que usam resfriamento líquido também podem optar pelo sistema resfriado a líquido, Q3400-LD.
Para plataformas de menor escala ou integração com infraestruturas existentes, o switch de configuração refrigerado a ar NVIDIA Quantum-X800 Q3200 2U é ideal.
Este sistema abriga dois switches independentes em um único gabinete, cada um fornecendo 36 portas a 800 Gb/s.
Os switches de configuração fixa Q3200 são adequados para conectar novos clusters de computação à infraestrutura de armazenamento Quantum e Quantum-2 InfiniBand de geração anterior.
Os switches Q3400 e Q3200 incluem uma porta de gerenciamento em banda InfiniBand dedicada especificamente para o gerenciamento do NVIDIA Unified Fabric Manager (UFM®), separada no painel frontal das outras portas.
Essa separação permite que o conjunto completo de portas padrão seja usado para conectividade de rede de dados, simplificando a alocação de portas e otimizando o design da topologia.
Além disso, os switches NVIDIA Quantum-X800 apresentam recursos de roteador opcionais, facilitando a expansão de clusters InfiniBand para oferecer suporte a uma grande escala de nós localizados em vários sites.
Plataforma NVIDIA Quantum-X800 InfiniBand
A plataforma Quantum-X800 InfiniBand inclui os switches Q3400 e Q3200, o NVIDIA ConnectX®-8 SuperNIC e o portfólio de interconexão NVIDIA LinkX® de transceptores e cabos.
A plataforma atinge uma taxa de transferência de ponta a ponta de 800 Gb/s do switch ao host.
Para gerenciamento e monitoramento de plataforma em escala de malha, o Quantum-X800 apresenta UFM, que permite uma verdadeira rede definida por software com visibilidade e insights poderosos sobre o desempenho e a integridade da rede.
Esta plataforma de rede de ponta a ponta é construída especificamente para fornecer o mais alto desempenho para malhas de computação de expansão horizontal, permitindo IA em grande escala.