Amazon Web Services 한국 블로그
Amazon EC2 P6-B200 인스턴스 출시 – NVIDIA Blackwell GPU 기반 AI 혁신 가속화
오늘 인공 지능(AI), 기계 학습(ML) 및 고성능 컴퓨팅(HPC) 분야의 고성능과 확장성에 대한 고객 니즈를 충족하기 위해 NVIDIA Blackwell GPU 기반 Amazon Elastic Compute Cloud(Amazon EC2) P6-B200 인스턴스를 정식 출시한다는 소식을 알려드립니다.
Amazon EC2 P6-B200 인스턴스는 광범위한 GPU 지원 워크로드를 가속화하지만, 특히 대규모 분산형 AI 훈련 및 강화 학습(RL)과 증류를 사용한 파운데이션 모델(FM)의 추론, 멀티모달 훈련 및 추론, 그리고 기후 모델링, 신약 개발, 지진 분석, 보험 위험 모델링 등 HPC 응용 분야에 매우 적합합니다.
Elastic Fabric Adapter(EFAv4) 네트워킹, EC2 UltraClusters의 하이퍼스케일 클러스터링, AWS Nitro System의 고급 가상화 및 보안 기능 등과 함께 사용하면 FM 훈련 및 제공 시 속도, 규모와 보안을 강화할 수 있습니다. 또한 이러한 인스턴스는 EC2 P5en 인스턴스에 비해 AI 훈련(훈련 시간) 및 추론(초당 토큰 수) 작업에서 최대 2배의 성능을 제공합니다.
이와 더불어 FM 훈련의 출시 시간을 단축하고 더 빠른 추론 처리량을 달성함으로써 추론 비용을 절감하고 생성형 AI 애플리케이션 채택률을 높일 수 있을 뿐만 아니라 HPC 애플리케이션의 처리 성능도 강화됩니다.
EC2 P6-B200 인스턴스 사양
신규 EC2 P6-B200 인스턴스는 NVIDIA Blackwell GPU GPU 8개, 고대역폭 GPU 메모리 1,440GB, 5세대 Intel Xeon Scalable 프로세서(Emerald Rapids), 시스템 메모리 2TiB 및 로컬 NVMe 스토리지 30TB를 제공합니다.
EC2 P6-B200 인스턴스의 사양은 다음과 같습니다.
인스턴스 크기 | GPU(NVIDIA B200) | GPU 메모리(GB) |
vCPU | GPU 피어 투 피어(GB/s) | 인스턴스 스토리지(TB) | 네트워크 대역폭(Gbps) | EBS 대역폭(Gbps) |
P6-b200.48xlarge | 8 | 1440 HBM3e | 192 | 1800 | 8 x 3.84 NVMe SSD | 8 x 400 | 100 |
이러한 인스턴스는 P5en 인스턴스 대비 GPU TFLOP가 최대 125% 개선되었고 GPU 메모리 크기가 27% 증가했으며 GPU 메모리 대역폭이 60% 상향되었습니다.
P6-B200 인스턴스의 실제 작동 사례
P6-B200 인스턴스는 EC2 Capacity Blocks for ML을 통해 미국 서부(오리건) AWS 리전에서 사용할 수 있습니다. EC2 Capacity Blocks를 예약하려면 Amazon EC2 콘솔에서 용량 예약을 선택합니다.
Capacity Blocks for ML 구매를 선택한 다음, 총 용량을 선택하고 p6-b200.48xlarge 인스턴스에 대해 EC2 Capacity Blocks가 필요한 기간을 지정합니다. EC2 Capacity Blocks를 예약할 수 있는 총 일수는 1~14일, 21일, 28일 또는 7의 배수로 182일까지입니다. 가장 이른 시작 날짜를 최대 8주 전에 미리 선택할 수 있습니다.
이제 EC2 Capacity Blocks가 성공적으로 예약되었습니다. EC2 Capacity Blocks의 총 가격은 선불로 청구되며 구매 후 가격은 변동되지 않습니다. 결제 대금은 EC2 Capacity Blocks를 구매한 후 12시간 이내에 계정에 청구됩니다. 자세히 알아보려면 Amazon EC2 사용 설명서에서 Capacity Blocks for ML을 참조하세요.
P6-B200 인스턴스를 시작할 때 EC2 P6-B200 인스턴스를 지원하도록 AWS Deep Learning AMI(DLAMI)를 사용할 수 있습니다. DLAMI는 사전 구성된 환경에서 확장 가능하고 안전한 분산형 ML 애플리케이션을 신속하게 구축할 수 있는 인프라와 도구를 ML 실무자와 연구원에게 제공합니다.
인스턴스를 실행하려면 AWS Management Console, AWS Command Line Interface(AWS CLI) 또는 AWS SDK를 사용하면 됩니다.
EC2 P6-B200 인스턴스는 Amazon Elastic Kubernetes Service(Amazon EKS), Amazon Simple Storage Service(Amazon S3), Amazon FSx for Lustre 등의 다양한 AWS 관리형 서비스와 원활하게 통합됩니다. Amazon SageMaker HyperPod도 곧 지원 예정입니다.
정식 출시
Amazon EC2 P6-B200 인스턴스는 현재 미국 서부(오리건) 리전에서 출시되었으며, EC2 Capacity blocks for ML로 구매할 수 있습니다.
Amazon EC2 콘솔에서 Amazon EC2 P6-B200 인스턴스를 사용해 보세요. 자세한 내용은 Amazon EC2 P6 인스턴스 페이지를 참조하고, 피드백을 전달하려면 AWS re:Post for EC2를 이용하거나 평소 교류하는 AWS Support 담당자를 통해 보내주세요.
— Channy
뉴스 블로그를 어떻게 생각하시나요? 이 1분짜리 설문조사에 참여해 주세요!
(이 설문조사는 외부 기업에서 호스트합니다. AWS는 AWS 개인정보 처리방침에 설명한 대로 사용자 정보를 처리합니다. AWS는 이 설문 조사를 통해 수집된 데이터를 소유하며 수집된 정보를 설문 응답자와 공유하지 않습니다)