O AWS Parallel Computing Service oferece suporte aos UltraServers P6e-GB200 e P6e-GB300
O AWS Parallel Computing Service (PCS) agora oferece suporte às instâncias UltraServer P6e-GB200 e P6e-GB300 do Amazon EC2, permitindo que os clientes executem workloads de GPU em grande escala usando a arquitetura NVIDIA Blackwell em clusters gerenciados pelo Slurm. Você pode reservar UltraServers por meio de blocos de capacidade do EC2 para ML, associá-los a um grupo de nós de computação do PCS por meio de um modelo de inicialização do EC2 e o PCS configura automaticamente o Slurm com o plug-in de topologia correto.
Com os P6e-GB200 UltraServers, os clientes podem acessar até 72 GPUs Blackwell em um domínio NVLink para usar 360 petaflops de computação FP8 (sem dispersão) e 13,4 TB de memória total de alta largura de banda (HBM3e). Os P6e-GB300 UltraServers fornecem 1,5x de memória de GPU e 1,5x de computação FP4 (sem dispersão) em comparação com o P6e-GB200.
O AWS PCS é um serviço gerenciado que simplifica a execução e a escalabilidade de workloads de computação de alta performance (HPC) na AWS com o uso do Slurm. Você pode criar ambientes completos e elásticos que integram ferramentas de computação, armazenamento, rede e visualização, enquanto o serviço gerencia as operações do cluster com atualizações gerenciadas e recursos integrados de observabilidade.
Você pode usar os P6e UltraServers com PCS em todas as regiões da AWS em que os blocos de capacidade PCS e EC2 para UltraServers estão disponíveis. Para saber mais sobre os UltraServers e as instâncias P6e, acesse Instâncias P6 do Amazon EC2. Para reservar os P6e UltraServers, entre em contato com seu representante de vendas da AWS. Leia mais sobre o suporte do PCS para P6e UltraServers no Guia do Usuário de PCS e certifique-se de definir as permissões corretas.