跳至主要内容

Amazon EC2 P6-B200 实例

为人工智能训练、推理和 HPC 工作负载提供高性能

为什么选择 Amazon EC2 P6-B200 实例?

与 P5en 实例相比,由 NVIDIA Blackwell GPU 加速的 Amazon EC2 P6-B200 实例在人工智能训练和推理场景中的性能可提升高达 2 倍。这些实例能够加速下一代人工智能模型的训练过程,并提升生产工作负载中实时推理的性能。P6-B200 实例是使用推理模型和代理式人工智能的中型到大型训练和推理应用程序的理想选择。

优势

P6-B200 实例配备 8 个 NVIDIA Blackwell GPU、1440 GB 高带宽 GPU 内存、第 5 代英特尔至强可扩展处理器(Emerald Rapids)、2 TiB 系统内存,以及 30 TB 本地 NVMe 存储。这些搭载 Blackwell GPU 的实例与 P5en 实例相比,GPU TFLOP 性能提升高达 125%,GPU 内存容量增加 27%,GPU 内存带宽增加 60%。

P6-B200 实例由 AWS Nitro System 提供支持,该系统配备专用的硬件和固件,旨在实施访问限制,确保包括 AWS 内部人员在内的任何人都无法访问您的敏感人工智能工作负载和数据。Nitro 实时更新功能可在系统正常运行时,为 Nitro 卡部署固件更新、漏洞修复及性能优化。这可以提高稳定性并减少停机时间,对于按时完成培训计划以及在生产环境中运行人工智能应用程序至关重要。

为实现高效的分布式训练,P6-B200 实例提供每秒 3.2 太比特的第 4 代 Elastic Fabric Adapter 网络(EFAv4)。这些实例部署在 Amazon EC2 UltraClusters 中,可在支持 PB 级的非阻塞网络中扩展至数万个 GPU。

P6-B200 实例可提升训练速度并降低训练成本,让模型提供商能够加快规模更大且性能更优的模型的上市时间。P6-B200 实例支持广泛的 AI 和 HPC 工作负载,涵盖深度学习训练与推理、科学模拟以及计算机视觉应用程序等领域。这是中型到大型训练和推理工作负载的理想之选。

功能

P6-B200 实例可提供多达 8 个 NVIDIA Blackwell GPU 和 1440 GB 的高带宽 GPU 内存。与 P5en 实例相比,这些实例的 GPU TFLOP 提升高达 125%,GPU 内存容量增加 27%,GPU 内存带宽增加 60%。

P6-B200 实例可通过 NVLink 提供高达每秒 3.2 太比特的 EFAv4 网络和 1800 GB/s 的 GPU 到 GPU 互连。 

P6-B200 实例支持适用于 Lustre 的 Amazon FSx 文件系统,因此您可以以大规模 DL 和 HPC 工作负载所需的数百 GB/s 吞吐量和数百万 IOPS 访问数据。P6-B200 实例支持高达 30TB 的本地 NVMe SSD 存储,从而对大型数据集进行快速访问。您还可以通过 Amazon Simple Storage Service(Amazon S3)使用几乎无限且经济实惠的存储。

产品详细信息

Instance Size
Available in EC2 UltraServers
Blackwell GPUs
GPU memory
vCPUs
Memory (TiB)
Instance storage (TB)
Network bandwidth (Gbps)
EBS bandwidth (Gbps)
p6-b200.48xlarge

8

1,440 HBM3e

192

2

8 x 3.84

8 x 400

100

机器学习使用案例入门

Amazon SageMaker 是一项完全托管的服务,用于构建、训练和部署 ML 模型。借助 Amazon SageMaker HyperPod(P6-B200 支持即将推出),您可以更轻松地扩展至数十、数百或数千个 GPU,从而以任何规模快速训练模型,而无需担心设置和管理弹性训练集群的问题。

AWS Deep Learning AMI(DLAMI)可为机器学习从业人员和研究人员提供基础设施和各种工具,从而加快在云中进行任意规模的深度学习的速度。 AWS Deep Learning Containers 是预先安装了深度学习框架的 Docker 映像,可以让您跳过从头构建和优化环境的复杂流程,从而简化自定义机器学习环境的部署。

如果您更愿意通过容器编排服务管理自己的容器化工作负载,则可以使用 Amazon Elastic Kubernetes Service(Amazon EKS)或 Amazon Elastic Container Service(Amazon ECS)部署 P6-B200 实例。

HPC 使用案例入门

P6-B200 实例非常适合用于运行工程模拟、计算金融、地震分析、分子建模、基因组学和其他基于 GPU 的 HPC 工作负载。HPC 应用程序通常需要高网络性能、快速存储、大量内存、超高计算能力或上述所有条件。P6-B200 实例支持 Elastic Fabric Adapter(EFA),该服务启用使用消息传递接口(MPI)的 HPC 应用程序扩展到数千个 GPU。AWS Batch 和 AWS ParallelCluster 可帮助 HPC 开发人员快速地构建和扩展分布式 HPC 应用程序。

了解更多