Amazon Web Services 한국 블로그

Amazon EC2 P6-B200 인스턴스 출시 – NVIDIA Blackwell GPU 기반 AI 혁신 가속화

오늘 인공 지능(AI), 기계 학습(ML)고성능 컴퓨팅(HPC) 분야의 고성능과 확장성에 대한 고객 니즈를 충족하기 위해 NVIDIA Blackwell GPU 기반 Amazon Elastic Compute Cloud(Amazon EC2) P6-B200 인스턴스를 정식 출시한다는 소식을 알려드립니다.

Amazon EC2 P6-B200 인스턴스는 광범위한 GPU 지원 워크로드를 가속화하지만, 특히 대규모 분산형 AI 훈련 및 강화 학습(RL)과 증류를 사용한 파운데이션 모델(FM)의 추론, 멀티모달 훈련 및 추론, 그리고 기후 모델링, 신약 개발, 지진 분석, 보험 위험 모델링 등 HPC 응용 분야에 매우 적합합니다.

Elastic Fabric Adapter(EFAv4) 네트워킹, EC2 UltraClusters의 하이퍼스케일 클러스터링, AWS Nitro System의 고급 가상화 및 보안 기능 등과 함께 사용하면 FM 훈련 및 제공 시 속도, 규모와 보안을 강화할 수 있습니다. 또한 이러한 인스턴스는 EC2 P5en 인스턴스에 비해 AI 훈련(훈련 시간) 및 추론(초당 토큰 수) 작업에서 최대 2배의 성능을 제공합니다.

이와 더불어 FM 훈련의 출시 시간을 단축하고 더 빠른 추론 처리량을 달성함으로써 추론 비용을 절감하고 생성형 AI 애플리케이션 채택률을 높일 수 있을 뿐만 아니라 HPC 애플리케이션의 처리 성능도 강화됩니다.

EC2 P6-B200 인스턴스 사양
신규 EC2 P6-B200 인스턴스는 NVIDIA Blackwell GPU GPU 8개, 고대역폭 GPU 메모리 1,440GB, 5세대 Intel Xeon Scalable 프로세서(Emerald Rapids), 시스템 메모리 2TiB 및 로컬 NVMe 스토리지 30TB를 제공합니다.

EC2 P6-B200 인스턴스의 사양은 다음과 같습니다.

인스턴스 크기 GPU(NVIDIA B200) GPU
메모리(GB)
vCPU GPU 피어 투 피어(GB/s) 인스턴스 스토리지(TB) 네트워크 대역폭(Gbps) EBS 대역폭(Gbps)
P6-b200.48xlarge 8 1440 HBM3e 192 1800 8 x 3.84 NVMe SSD 8 x 400 100

이러한 인스턴스는 P5en 인스턴스 대비 GPU TFLOP가 최대 125% 개선되었고 GPU 메모리 크기가 27% 증가했으며 GPU 메모리 대역폭이 60% 상향되었습니다.

P6-B200 인스턴스의 실제 작동 사례
P6-B200 인스턴스는 EC2 Capacity Blocks for ML을 통해 미국 서부(오리건) AWS 리전에서 사용할 수 있습니다. EC2 Capacity Blocks를 예약하려면 Amazon EC2 콘솔에서 용량 예약을 선택합니다.

Capacity Blocks for ML 구매를 선택한 다음, 총 용량을 선택하고 p6-b200.48xlarge 인스턴스에 대해 EC2 Capacity Blocks가 필요한 기간을 지정합니다. EC2 Capacity Blocks를 예약할 수 있는 총 일수는 1~14일, 21일, 28일 또는 7의 배수로 182일까지입니다. 가장 이른 시작 날짜를 최대 8주 전에 미리 선택할 수 있습니다.

이제 EC2 Capacity Blocks가 성공적으로 예약되었습니다. EC2 Capacity Blocks의 총 가격은 선불로 청구되며 구매 후 가격은 변동되지 않습니다. 결제 대금은 EC2 Capacity Blocks를 구매한 후 12시간 이내에 계정에 청구됩니다. 자세히 알아보려면 Amazon EC2 사용 설명서에서 Capacity Blocks for ML을 참조하세요.

P6-B200 인스턴스를 시작할 때 EC2 P6-B200 인스턴스를 지원하도록 AWS Deep Learning AMI(DLAMI)를 사용할 수 있습니다. DLAMI는 사전 구성된 환경에서 확장 가능하고 안전한 분산형 ML 애플리케이션을 신속하게 구축할 수 있는 인프라와 도구를 ML 실무자와 연구원에게 제공합니다.

인스턴스를 실행하려면 AWS Management Console, AWS Command Line Interface(AWS CLI) 또는 AWS SDK를 사용하면 됩니다.

EC2 P6-B200 인스턴스는 Amazon Elastic Kubernetes Service(Amazon EKS), Amazon Simple Storage Service(Amazon S3), Amazon FSx for Lustre 등의 다양한 AWS 관리형 서비스와 원활하게 통합됩니다. Amazon SageMaker HyperPod도 곧 지원 예정입니다.

정식 출시
Amazon EC2 P6-B200 인스턴스는 현재 미국 서부(오리건) 리전에서 출시되었으며, EC2 Capacity blocks for ML로 구매할 수 있습니다.

Amazon EC2 콘솔에서 Amazon EC2 P6-B200 인스턴스를 사용해 보세요. 자세한 내용은 Amazon EC2 P6 인스턴스 페이지를 참조하고, 피드백을 전달하려면 AWS re:Post for EC2를 이용하거나 평소 교류하는 AWS Support 담당자를 통해 보내주세요.

Channy


뉴스 블로그를 어떻게 생각하시나요? 이 1분짜리 설문조사에 참여해 주세요!

(이 설문조사는 외부 기업에서 호스트합니다. AWS는 AWS 개인정보 처리방침에 설명한 대로 사용자 정보를 처리합니다. AWS는 이 설문 조사를 통해 수집된 데이터를 소유하며 수집된 정보를 설문 응답자와 공유하지 않습니다)