Amazon SageMaker AI に P6e-GB200 UltraServer のサポートを追加

投稿日: 2025年8月12日

本日、Amazon SageMaker AI の SageMaker HyperPodトレーニングジョブで、P6e-GB200 UltraServer が利用できるようになったことをお知らせします。P6e-GB200 UltraServer を使用すると、単一の NVLink ドメインで最大 72 基の NVIDIA Blackwell GPU を利用でき、1 兆パラメータスケールで基礎モデルのトレーニングとデプロイを加速できます。P6e-GB200 UltraServer は、ml.u-p6e-gb200x72 (NVLink に 72 基の GPU) と ml.u-p6e-gb200x36 (NVLink に 36 基の GPU) の 2 つのサイズを利用できます。

P6e-GB200 UltraServer は、P5en インスタンスと比較して、単一の NVIDIA NVLink で 20 倍を超えるコンピューティングと 11 倍を超えるメモリを提供します。各 NVLink ドメインでは、360 ペタフロップスの FP8 コンピューティング (スパース性なし) と、合計 13.4 TB の高帯域幅メモリ (HBM3e) を活用できます。SageMaker AI で P6e-GB200 UltraServer を使用すると、GB200 の優れたパフォーマンスを得ながら、セキュリティ、組み込みの耐障害性、トポロジ対応のスケジューリング (SageMaker HyperPod EKS および Slurm)、統合モニタリング機能、SageMaker AI および AWS の他のサービスとのネイティブ統合といった SageMaker のマネージドインフラストラクチャの特性を活用できます。

UltraServer は、米国東部 (バージニア北部) AWS リージョンから延長されたダラス Local Zone (「us-east-1-dfw-2a」) の SageMaker フレキシブルトレーニングプランで利用できます。GB200 UltraServer のオンデマンド予約については、アカウントマネージャーにお問い合わせください。Amazon SageMaker AI では、パフォーマンス面とコスト面で最適化されたフルマネージド型インフラストラクチャを使用して、機械学習モデルのトレーニングを簡単かつ大規模に行うことができます。SageMaker AI で UltraServer の使用を開始するには、ドキュメントをご覧ください。