메인 콘텐츠로 건너뛰기

AWS AI 칩

Build on Trainium

AWS Trainium을 통해 AI 연구 및 교육을 가속화하기 위한 1억 1,000만 USD 투자 프로그램

Build on Trainium이란?

Build on Trainium은 AWS Trainium의 차세대 혁신 및 개발을 지원하기 위해 AI 연구 및 대학 교육에 중점을 둔 1억 1천만 USD 투자 프로그램입니다. AWS Trainium은 최첨단 AI 아이디어 및 애플리케이션의 발전을 위해 고유하게 설계된 AI 시스톨릭 어레이 칩입니다. Build on Trainium은 새로운 모델 아키텍처, ML 라이브러리, 최적화, 대규모 분산 시스템 등을 비롯한 중요 영역에서 혁신을 구축하기 위해 주요 학술 팀에 투자하여 Trainium에 대한 새로운 AI 연구에 자금을 지원합니다. 다년에 걸친 이 이니셔티브는 학계가 Trainium과 관련된 오픈 소스 커뮤니티를 활용하고 여기에 투자 및 기여하도록 영감을 주어 AI의 미래를 위한 토대를 마련합니다. Trainium 고객은 이러한 이점을 Neuron 소프트웨어 개발 키트(SDK) 및 최근 출시한 Neuron Kernel Interface(NKI)와 결합하여 이제 클라우드에서 대규모로 혁신할 수 있습니다.
An abstract illustration depicting a stylized hand supporting a neural network or data sphere, represented by interconnected blue nodes and lines. The design features geometric shapes and a gradient blue and purple color palette, symbolizing artificial intelligence and machine learning concepts.

AWS Trainium 연구 클러스터

최대 40,000개의 Trainium 칩이 포함된 전용 Trainium 연구 클러스터를 만들었습니다. 이 클러스터는 Amazon EC2 UltraClusters를 사용하는 단일 비차단 페타비트급 네트워크에 연결된 Amazon EC2 Trn1 인스턴스를 통해 사용할 수 있습니다. 연구팀과 학생들은 Amazon EC2 Capacity Blocks for ML을 사용하는 자체 관리형 용량 블록 예약을 통해 이러한 칩에 액세스할 수 있습니다.
An abstract close-up image featuring a vibrant pattern of red and violet hues, resembling a geometric or honeycomb texture, with bright highlights and a modern, digital art aesthetic.

Amazon Research Awards

Amazon은 광범위한 연구 커뮤니티를 대상으로 여러 차례에 걸쳐 Amazon Research Awards(ARA) 제안서 모집(CFP)을 진행하고 있으며, 선정된 제안서에는 AWS Trainium 크레딧과 Trainium 연구 클러스터 액세스 권한이 제공됩니다. Build on Trainium은 인기 있는 오픈 소스 ML 라이브러리와 프레임워크를 활용하고 ML 개발자 커뮤니티의 리소스를 개선하기 위해 오픈 소스에 다시 기여하는 연구 제안을 환영합니다.
Illustration of two blue silhouettes drawing or collaborating on a complex digital workflow or process diagram against an orange background. Represents teamwork, planning, or designing digital infrastructure or compute processes.

Neuron Kernel Interface

Neuron Kernel Interface(NKI)는 AWS AI 칩, Trainium 및 Inferentia를 위한 새로운 프로그래밍 인터페이스입니다. NKI는 AWS Trainium 및 Inferentia에서 사용할 수 있는 하드웨어 프리미티브 및 지침에 대한 직접적인 액세스 권한을 제공하여 연구진이 최적의 성능을 위해 컴퓨팅 커널을 구축하고 조정할 수 있도록 합니다. 이는 일반적으로 사용되는 Triton과 같은 구문과 타일 수준 시멘틱을 도입한 Python 기반 프로그래밍 환경입니다. 연구진은 NKI를 사용하여 새로운 기능, 최적화 및 과학 혁신으로 딥 러닝 모델을 개선할 수 있습니다. NKI 설명서 페이지로 이동하여 자세한 내용을 참조하세요.
Abstract illustration featuring various geometric shapes, such as triangles, circles, rectangles, and grids, in gradient pastel yellow and purple tones on a lavender background. Arrows and dotted lines add motion and connectivity, suitable for themes of application integration and creative design.

장점

전용 AWS Trainium 연구 클러스터에 액세스하고 세계적 수준의 AI 하드웨어와 확장 가능한 클라우드 인프라를 사용하여 가장 야심찬 연구 프로젝트를 지원하세요.

기존 아키텍처와 기술을 능가하는 혁신적이고 최적화된 컴퓨팅 커널을 구축하여 생성형 AI 연구와 오픈 소스 혁신의 한계를 뛰어넘으세요. 고도로 최적화된 커널을 구축하여 모델에서 가장 중요하거나 차별화된 부분을 최적화하세요.

PyTorch 및 JAX와 원활하게 통합되는 Neuron SDK로 쉽게 시작하세요. Neuron Kernel Interface의 Python 기반 프로그래밍 환경은 일반적으로 사용되는 Triton과 유사한 구문을 도입하여 빠르게 강화할 수 있도록 도와줍니다.

광범위한 연구 커뮤니티인 AWS 전문가와 협력하여 여러분의 작업이 실제 세계에 미치는 영향을 확대하세요.

참여 대학

주요 대학들이 Build on Trainium 프로그램의 혜택을 누리고 있는 방법은 다음과 같습니다.

Massachusetts Institute of Technology

MIT의 디바이스 구현 연구소에서는 AWS Trainium을 사용하여 의료 AI 연구의 한계를 뛰어넘고 있습니다. 당사의 3D 초음파 분할 및 음속 추정 모델은 그 어느 때보다 빠르고 효율적으로 훈련하여 최첨단 정확도를 달성하면서 실험 시간을 절반 이상 단축합니다. AWS Trainium을 사용하면 기존 GPU 시스템으로는 불가능했던 방식으로 연구를 확장할 수 있었습니다. AWS Trainium(trn.32xlarge)에서 3D 완전 합성곱 신경망을 훈련시켜 NVIDIA A100 인스턴스에 비해 50% 더 높은 처리량과 더 낮은 비용으로 최첨단 성능을 달성했습니다. 32노드 Trainium 클러스터를 사용하여 180개 이상의 절제 실험을 효율적으로 수행, 총 훈련 시간을 몇 개월에서 몇 주로 줄이고 MIT의 의료 AI 혁신을 가속화했습니다. 향후에는 Trainium을 사용해 디지털 초음파 워크플로를 작동 및 자동화할 수 있는 AI 에이전트 모델을 훈련하여 임상의의 시간을 크게 절약하고 환자에게 더 나은 치료를 제공할 계획입니다.”


Missing alt text value

Carnegie Mellon University

“CMU Catalyst 연구 그룹은 ML 시스템 최적화를 위해 노력하고 있습니다. 우리의 프로젝트는 다양한 ML 시스템에서 더 쉬운 최적화를 목표로 합니다. Trainium은 Neuron Kernel Interface(NKI)를 통해 저수준 제어와 액세스 가능한 프로그래밍 인터페이스를 모두 제공한다는 점에서 독보적입니다.

연구진은 Build on Trainium 프로그램을 통해 AWS의 지원을 받아 중요한 커널인 FlashAtmention에 대한 고급 최적화를 탐색할 수 있었습니다. 가장 놀라운 부분은 반복 작업의 속도였습니다. 공개적으로 사용 가능한 NKI, Neuron 프로파일러 및 아키텍처 문서를 사용하여 불과 일주일 만에 이전 기술 외에도 의미 있는 개선을 달성했습니다. 강력한 도구와 명확한 하드웨어 인사이트의 결합으로 우리 팀은 정교하고도 저수준의 최적화에 접근할 수 있었습니다.

AWS Trainium과 Neuron Kernel Interface(NKI)는 일반적으로 하드웨어별 최적화 작업을 지연시키는 장벽을 제거하여 우리와 같은 연구진이 더 빠르게 혁신할 수 있도록 지원합니다.”

 

Missing alt text value

Berkeley University of California

“Build on Trainium 프로그램을 통해 그의 팀은 정확한 스케줄링과 메모리 할당을 위한 Trainium ISA 및 API에 대한 직접적인 가시성을 포함하여 AWS Neuron의 새로운 NKI 오픈 소스 컴파일러 스택에 대한 완전한 액세스 권한을 얻었습니다. 이러한 수준의 가시성과 제어를 통해 학생들은 최적화 기회를 보다 쉽게 분석하고 성능이 우수한 구현을 더 효과적으로 발견할 수 있습니다.”

Christopher Fletcher, Associate Professor of Computer Science, University of California, Berkeley
 

Missing alt text value

University of Illinios Urbana/Champaign

“AWS Trainium과 Inferentia에 대한 액세스는 대규모의 효율적인 AI 시스템에 대한 연구와 교육을 발전시키는 데 중요한 역할을 했습니다. 우리는 이러한 플랫폼을 전문가 혼합 훈련 및 추론 최적화, 새로운 액셀러레이터 아키텍처의 확장성, 효율성 및 이식성을 향상시키는 새로운 런타임과 스케줄링 기술의 프로토타이핑에 사용합니다. UIUC 연구원은 Neuron Developer 스택을 활용하여 AI 워크로드의 효율성과 이식성을 향상시키는 새로운 런타임 및 스케줄링 기술을 개발하고 있습니다. 팀은 특히 Neuron Developer 스택의 개방성에 깊은 인상을 받았습니다. 해당 플랫폼은 런타임 연구에 유용하게 활용할 수 있고 희소성, 메모리 계층 구조 및 통신 효율성의 혁신을 기존 GPU 아키텍처를 뛰어 넘습니다.”

Missing alt text value

University of California Los Angeles

“학생들과 저는 AWS Trainium과 Build on Trainium 프로그램을 활용하여 양자 회로 시뮬레이션을 현저하게 가속화할 수 있었습니다. 이 프로젝트에는 고성능 시뮬레이터를 공동으로 구축한 강력한 학생 그룹이 참여하여 이전에는 불가능했던 규모로 심층적인 실험과 실습 학습이 가능하게 되었습니다.”

Missing alt text value

University of Technology Sydney

“UTS 연구팀은 맞춤형 Neuron NKI 커널을 개발하여 트리링 워터마킹 알고리즘의 통합을 모색하고 있습니다. Build on Trainium 프로그램을 통해 오픈 소스 뉴런 스택에 액세스할 수 있게 된 것은 혁신적이었습니다. 이를 통해 Trainium 아키텍처에 대한 전례 없는 가시성과 하드웨어 수준에서 직접 작업할 수 있습니다. Trainium 액세스를 통해 우리 팀은 워터마킹 워크로드를 크게 가속화하여 반복 주기를 줄이고 더 복잡한 모델과 기술을 탐색할 수 있게 되었습니다. 이러한 심도 있는 접근성을 통해 연구원들은 새로운 아이디어의 프로토타입을 만들고, 저수준 최적화를 실험하고, 최신 AI 가속기에서 워터마킹 시스템이 달성할 수 있는 한계를 뛰어넘을 수 있습니다.”

Missing alt text value