AWS Parallel Computing Service unterstützt P6e-GB200 and P6e-GB300 UltraServer
AWS Parallel Computing Service (PCS) unterstützt jetzt Amazon EC2 P6e-GB200 and P6e-GB300 UltraServer Instances, sodass Kunden umfangreiche GPU-Workloads mithilfe der NVIDIA Blackwell-Architektur in Slurm-verwalteten Clustern ausführen können. Sie können UltraServer über EC2 Capacity Blocks für ML reservieren, sie über eine EC2-Startvorlage einer PCS-Rechenknotengruppe zuordnen, und PCS konfiguriert Slurm automatisch mit dem richtigen Topologie-Plugin.
Mit P6e-GB200 UltraServern können Sie auf bis zu 72 NVIDIA Blackwell GPUs innerhalb einer NVLink Domain zugreifen, um 360 Petaflops an FP8-Rechenleistung (ohne Sparsity) und 13,4 TB Gesamtspeicher mit hoher Bandbreite (HBM3e) zu nutzen. P6e-GB300 UltraServer bieten im Vergleich zu P6e-GB200 den 1,5-fachen GPU-Speicher und die 1,5-fache FP4-Rechenleistung (ohne Sparsity).
AWS PCS ist ein verwalteter Service, der die Ausführung und Skalierung von HPC-Workloads in AWS mit Slurm vereinfacht. Sie können komplette, elastische Umgebungen erstellen, die Computing, Speicher, Netzwerk und Visualisierung integrieren und in denen sich der Service um den Cluster-Betrieb kümmert, inklusive verwalteter Updates und integrierter Beobachtbarkeitsfunktionen.
Sie können P6e UltraServers mit PCS in allen AWS-Regionen verwenden, in denen sowohl PCS als auch EC2 Capacity Blocks für UltraServer verfügbar sind. Weitere Informationen zu P6e UltraServern finden Sie unter Amazon EC2 P6-Instances. Um P6e UltraServer zu reservieren, wenden Sie sich an Ihren AWS-Vertriebsmitarbeiter. Weitere Informationen zur PCS-Unterstützung für P6e UltraServer finden Sie im PCS-Benutzerhandbuch. Achten Sie darauf, die richtigen Berechtigungen festlegen.