AWS 기술 블로그

Category: Compute

VAMS에서 NVIDIA Isaac Lab을 활용한 GPU 가속 로봇 시뮬레이션 훈련

본 게시글은 AWS Spatial Compute Blog에 작성된 “GPU-Accelerated Robotic Simulation Training with NVIDIA Isaac Lab in VAMS” 블로그를 번역했습니다. 오픈소스 Visual Asset Management System(VAMS)이 이제 NVIDIA Isaac Lab과의 통합을 통해 로봇 자산에 대한 GPU 가속 강화학습(RL)을 지원합니다. 이 파이프라인을 통해 팀은 자산 관리 워크플로우에서 직접 RL 정책을 훈련하고 평가할 수 있으며, 확장 가능한 GPU 컴퓨팅을 […]

Amazon EKS에서 Friendli Container로 LLM 추론 최적화하기

FriendliAI는 AI 추론 효율을 크게 개선하는 고성능 서빙 플랫폼을 서비스하는 기업입니다. FriendliAI의 추론 스택은 높은 처리량(Throughput)과 비용 절감 효과를 통해 기업이 생성형 AI 서비스를 효율적으로 운영할 수 있도록 지원합니다. Figure 1: Friendli Container 개념도 Friendli Container Amazon EKS Add-on은 AWS 인프라를 기반으로 AI 추론 효율을 극대화하는 솔루션입니다. 이 Add-on을 활용하면 기존 Amazon EKS 워크플로우에 Friendli […]

Amazon SageMaker HyperPod의 오토스케일링 알아보기

이 글은 Artificial Intelligence 블로그에 게시된 글 (Introducing auto scaling on Amazon SageMaker HyperPod)을 한국어로 번역 및 편집하였습니다. 2025년 8월에 Amazon SageMaker HyperPod가 Karpenter를 통한 관리형 노드 오토스케일링 지원하기 시작했습니다. 이를 통해 추론 및 학습 요구 사항에 맞춰 SageMaker HyperPod 클러스터를 효율적으로 확장할 수 있습니다. 실시간 추론 워크로드는 예측 불가능한 트래픽 패턴에 대응하고 서비스 수준 계약(SLA)을 유지하기 […]

Amazon EKS에서 Slinky를 사용하여 Slurm 배포하기

이 글은 Containers 블로그에 게시된 글 (Running Slurm on Amazon EKS with Slinky)을 한국어로 번역 및 편집하였습니다. 사전 학습(pre-training), 파인튜닝(fine-tuning) 또는 추론(inference) 워크로드를 위한 AI 인프라 스택을 구축할 때, 흔히 Slurm이나 Kubernetes를 컴퓨팅 오케스트레이션 플랫폼으로 활용합니다. 각 플랫폼은 다양한 팀의 요구사항을 충족하고 AI 개발 과정의 여러 단계를 지원할 수 있습니다. 하지만 전통적으로 이 방식은 가속 컴퓨팅 용량을 위한 별도의 […]

Amazon OpenSearch Service User Behavior Insights(UBI)로 사용자 행동 분석하기

대고객 서비스를 제공하는 워크로드의 경우 고객 경험을 지속적으로 향상시키기 위해서 다양한 이벤트나 프로모션을 진행합니다. 어떤 경우는 정기적으로 고객을 초청하여 인터뷰를 하며 서비스의 개선을 위한 피드백을 받기도 하고 어떤 경우는 웹 서비스상의 설문 조사를 통해 개선점을 수집하기도 합니다. 이커머스와 같은 서비스는 고객의 경험이 매출과 직결되는 대표적인 워크로드입니다. 따라서 다양한 고객의 피드백과 워크로드의 품질을 검토하기 위해서 해당 […]

교촌에프앤비의 AWS Transform을 이용한 국내 최초의 VMware 마이그레이션 사례

Agentic AI 기반 자동화로 컨설팅 파트너 없이 성공한 교촌에프앤비 사례 회사소개 교촌에프앤비는 1991년 창립 이래 대한민국 치킨 프랜차이즈 업계를 선도해온 기업입니다. ‘교촌치킨’이라는 대표 브랜드를 통해 전국 1,000여 개 매장을 운영하며, 최근에는 해외 시장 진출에도 적극적으로 나서고 있습니다. 교촌에프앤비는 디지털 혁신을 통한 고객 경험 향상과 운영 효율성 제고를 위해 클라우드 전환을 추진해왔습니다. 배경 및 과제 교촌에프앤비는 […]

달파의 Amazon EKS Hybrid Nodes를 활용한 클러스터 안정성 및 비용 절감 사례

소개 달파는 기업의 비즈니스 문제를 쇼핑하듯 해결하는 B2B AI 에이전트 플랫폼 기업입니다. 2023년 서울에 설립된 달파는 150여 개 이상의 모듈화 된 AI 솔루션을 제공하며 업무 자동화, 내부 효율화 등 다양한 측면에서 기업을 지원하고 있습니다. CJ올리브네트웍스, SK스토아, 마켓컬리, KT커머스 등 국내 주요 대기업 및 유통사들을 포함한 150여 개 이상의 기업이 이미 달파의 AI 솔루션을 도입하여 성과를 […]

마이다스인의 플랫폼 혁신 여정, Part1: Amazon EKS 전환

마이다스인은 2,100여 고객사에 AI 기반 채용 플랫폼을 제공하는 대한민국 대표 HR 테크 기업입니다. AI 관련된 기능 추가와 더불어 복잡해지는 서비스 구조와 더불어 매년 수십만 명이 동시 접속하는 대규모 채용 시즌마다 증가하는 트래픽을 효과적으로 처리하기 위해 기존 Amazon ECS 기반의 인프라를 고도화 해야 하는 도전에 직면했습니다. 앞으로 2회에 걸친 블로그 포스트를 통해 마이다스인이 AWS와 협력하여 Amazon […]

하이퍼엑셀(HyperAccel), Amazon EC2 F2 Instance 기반 LPU로 고효율 LLM 추론 서비스 구축

Amazon EC2 F2 인스턴스는 AWS가 제공하는 FPGA(Field-Programmable Gate Array) 기반 컴퓨팅 인스턴스로, 고객이 하드웨어 가속이 필요한 워크로드를 클라우드 환경에서 유연하게 실행할 수 있도록 설계되었습니다. FPGA는 프로그래밍 가능한 하드웨어 칩으로, 특정 연산에 최적화된 맞춤형 로직을 구현할 수 있어 범용 프로세서 대비 높은 성능과 전력 효율을 제공합니다. F2 인스턴스는 AMD Virtex UltraScale+ HBM VU47P FPGA를 탑재하고 있으며, 머신러닝 추론, 비디오 처리, 금융 분석, 유전체학(Genomics) 등 연산 집약적인 작업에 적합합니다. 특히 AWS는 FPGA Developer AMI(Amazon Machine Image)와 HDK(Hardware Development Kit)를 함께 제공해, 개발자가 FPGA 설계부터 배포까지 […]

Regional NAT Gateway: 다중 가용 영역 환경에서의 실전 적용 가이드

기존 Amazon VPC Zonal NAT Gateway는 다중 가용 영역(Availability Zones, AZ) 환경에서 가용 영역별로 NAT를 생성하고 라우팅을 관리해야 하기 때문에, 가용 영역이 늘어날수록 운영 복잡도가 증가합니다. 2025년 11월 19일에 출시된 Regional NAT Gateway는 리전 단위로 NAT Gateway를 제공하고, 워크로드 분포에 따라 가용 영역으로 자동 확장/축소되는 방식으로 이러한 운영 부담을 줄일 수 있는 옵션을 제공합니다. 프로덕션 […]