AWS Yapay Zeka Çipleri

AWS Trainium

Trainium: Uygun ölçekte yüksek performanslı ve uygun maliyetli yapay zekâ için özel olarak geliştirilmiştir

AWS Neuron aracılığıyla Trainium'u kullanmaya başlayın

Neden Trainium?

AWS Trainium, çok çeşitli üretken yapay zekâ iş yüklerinde eğitim ve çıkarım için ölçeklenebilir performans ve maliyet verimliliği sağlamak üzere tasarlanmış, amaca yönelik yapay zekâ hızlandırıcıları (Trainium1, Trainium2 ve Trainium3) ailesidir.

AWS Trainium Ailesi

Trainium1

Birinci nesil AWS Trainium yongası, benzer Amazon EC2 bulut sunucularına kıyasla %50'ye kadar daha düşük eğitim maliyetleri içeren Amazon Elastic Compute Cloud (Amazon EC2) Trn1 bulut sunucularına güç vermektedir. Ricoh, Karakuri, SplashMusic ve Arcee AI dâhil birçok müşteri, Trn1 bulut sunucularının performans ve maliyet avantajlarını fark ediyor.

Trainium2

AWS Trainium2 yongası, birinci nesil Trainium'a kıyasla 4 kata kadar daha yüksek performans sunar. Trainium2 tabanlı Amazon EC2 Trn2 bulut sunucuları ve Trn2 UltraServers, üretken yapay zekâ için özel olarak geliştirilmiştir ve GPU tabanlı EC2 P5e ve P5en bulut sunucularına kıyasla %30-40 daha iyi fiyat performansı sunar. Trn2 bulut sunucuları 16 adede kadar Trainium2 yongasına sahiptir ve Trn2 UltraServers, tescilli yongadan yongaya ara bağlantımız olan NeuronLink ile birbirine bağlanan 64 adede kadar Trainium2 yongasına sahiptir. Çok çeşitli yeni nesil üretken yapay zekâ uygulamaları oluşturmak için büyük dil modelleri (LLM'ler), çok modlu modeller, difüzyon dönüştürücüleri dâhil olmak üzere en zorlu modelleri eğitmek ve dağıtmak üzere Trn2 bulut sunucularını ve UltraServers'ı kullanabilirsiniz.

Trainium3

AWS'nin ilk 3 nm yapay zekâ yongası, yeni nesil temsilci tabanlı uygulamalar, akıl yürütme uygulamaları ve video oluşturma uygulamaları için en iyi belirteç ekonomisini sunmak üzere özel olarak tasarlanmıştır. AWS Trainium3 yongası, 2,52 petaflop (PFLOP) FP8 işlem gücü için 2 kat daha yüksek işlem performansı sağlar ve Trainium2'ye kıyasla bellek kapasitesini 1,5 kat ve bant genişliğini 1,7 kat artırarak 144 GB HBM3e belleğe ve 4,9 TB/sn bellek bant genişliğine ulaşır. Trainium3 tarafından desteklenen Trn3 UltraServers, Trn2 UltraServers'a kıyasla 4,4 kata kadar daha yüksek performans, 3,9 kat daha yüksek bellek bant genişliği ve 4 katın üzerinde daha iyi enerji verimliliği sunar. Trainium3, gelişmiş veri türlerine (MXFP8 ve MXFP4) sahip yoğun ve uzman paralel iş yükleri için oluşturulmuştur ve gerçek zamanlı görevlerin, çok modlu görevlerin ve akıl yürütme görevlerinin bellek-işlem dengesini iyileştirir.

Geliştiriciler için Tasarlandı

Yeni Trainium3 tabanlı UltraServers, yapay zekâ araştırmacıları için geliştirilmiş olup AWS Neuron SDK tarafından desteklenir ve olağanüstü bir performans sağlar.

Yerel PyTorch entegrasyonu ile geliştiriciler, kodun tek bir satırını bile değiştirmeden eğitebilir ve dağıtabilir. Yapay zekâ performans mühendislerinin Trainium3'e daha derin erişimini sağlayarak geliştiricilerin performansa ince ayar yapmalarına, çekirdekleri özelleştirmelerine ve modelleri daha da ileriye taşımalarına olanak tanıdık. Yenilik açıklıkta gelişir; bu nedenle, geliştiricilerimizle açık kaynaklı araçlar ve kaynaklar aracılığıyla etkileşim kurmaya kararlıyız.

Daha fazla bilgi edinmek için Amazon EC2 Trn3 UltraServers'ı ziyaret edin ve AWS Neuron SDK'yi keşfedin.

Avantajlar

Trn3 UltraServers, 144 adede kadar Trainium3 yongasında daha hızlı tümden tüme kolektifler sağlayan NeuronSwitch-v1 sayesinde, ölçeği artırılan UltraServer teknolojisindeki en son yeniliklere sahiptir. Trn3 UltraServer, 20,7 TB'a kadar HBM3e, 706 Tb/sn bellek bant genişliği ve 362 MXFP8 PFLOP sağlayarak, Trn2 UltraServers'a göre 4,4 kata kadar daha yüksek performans ve 4 katın üzerinde daha iyi enerji verimliliği sunar. Trn3, en yeni 1 trilyondan fazla parametreli MoE ve akıl yürütme tipi modelleriyle eğitim ve çıkarım için en düşük maliyetle en yüksek performansı sunar ve Trainium2 tabanlı bulut sunucularına kıyasla uygun ölçekte hizmet veren GPT-OSS için önemli ölçüde daha yüksek aktarım hızı sağlar.

Trn2 UltraServers, 1 trilyona kadar parametreye sahip modellerin üretken yapay zekâ eğitimi ve çıkarımı için yüksek performanslı ve uygun maliyetli bir seçenek olmaya devam ediyor. Trn2 bulut sunucuları 16 adede kadar Trainium2 yongasına sahiptir ve Trn2 UltraServers, tescilli bir yongadan yongaya ara bağlantı olan NeuronLink ile bağlantılı 64 adede kadar Trainium2 yongasına sahiptir.

Trn1 bulut sunucuları 16 adede kadar Trainium yongasına sahiptir ve 3 PFLOP'a kadar FP8 işlem gücü, 9,8 TB/sn bellek bant genişliğine sahip 512 GB HBM ve 1,6 Tbps'ye kadar EFA ağ iletişimi sağlar.

AWS Neuron SDK, Trn3, Trn2 ve Trn1 bulut sunucularından tam performansı elde etmenize yardımcı olur, böylece modeller oluşturmaya ve dağıtmaya ve pazara ulaşma sürenizi hızlandırmaya odaklanabilirsiniz. AWS Neuron; PyTorch ve Jax'ın yanı sıra Hugging Face, vLLM, PyTorch Lightning ve diğerleri gibi gerekli kitaplıklarla yerel olarak entegre olur. Profil oluşturma ve hata ayıklama için derin öngörüler sağlarken modelleri optimize ederek dağıtılmış eğitim ve çıkarım için kullanıma hazır hâlde sunar. AWS Neuron hem Amazon SageMaker, Amazon SageMaker Hyerpod, Amazon Elastic Kubernetes Service (Amazon EKS), Amazon Elastic Container Service (Amazon ECS), AWS ParallelCluster ve AWS Batch gibi hizmetlerle hem de Ray (Anyscale), Domino Data Lab ve Datadog gibi üçüncü taraf hizmetleriyle entegrasyon sağlar.

AWS Trainium, doğruluk hedeflerini karşılarken yüksek performans sunmak için
BF16, FP16, FP8, MXFP8 ve MXFP4 gibi çeşitli karma duyarlıklı veri türlerini destekler. Trainium2 ve Trainium3, üretken yapay zekâda yüksek inovasyon hızını
desteklemek üzere 4 kat seyreklik (16:4), mikro ölçekleme, stokastik yuvarlama ve tahsis edilmiş kolektif altyapılar
için donanım optimizasyonlarına sahiptir.

Neuron, geliştiricilerin çekirdek geliştirme için Nöron Kernel Arabirimi (NKI) kullanarak iş yüklerini optimize etmelerini sağlar. NKI, talimat düzeyinde programlama, bellek tahsisi ve yürütme zamanlaması üzerinde tam kontrol sağlayan eksiksiz Trainium ISA'yı kullanıma sunar. Geliştiriciler, kendi çekirdeklerini oluşturabilir ve ayrıca, optimize edilmiş çekirdekleri dağıtmaya hazır olan, açık kaynaklı Neuron Çekirdek Kitaplığını kullanabilir. Son olarak, Neuron Explore, geliştiricilerin kodunu donanımdaki altyapılara bağlayarak tam yığın görünürlüğünü sağlar.

Müşteriler

Anthropic, Decart, poolside, Databricks, Ricoh, Karakuri, SplashMusic ve diğerleri gibi müşteriler, Trn1, Trn2 ve Trn3 bulut sunucularının ve UltraServers'ın performans ve maliyet avantajlarını fark ediyor.

Trn3'ü erken benimseyenler, yeni nesil büyük ölçekli üretken yapay zekâ modelleri için yeni verimlilik ve ölçeklenebilirlik seviyeleri elde ediyor.

Yapay zekânın performansını, maliyetini ve ölçeğini fethedin

Çığır açan yapay zekâ performansı için AWS Trainium2

AWS yapay zekâ yongaları müşteri hikâyeleri

Kaynaklar

Blog

AWS Trainium3 ile modelleri uygun maliyetli bir şekilde eğitin ve dağıtın (yakında)

Daha fazla bilgi edinin

Blog

AWS Inferentia ve AWS Trainium ile Amazon SageMaker JumpStart'ta Llama 2 modellerinde uygun maliyetli bir şekilde ince ayar yapın ve dağıtın

Blogu okuyun

Blog

Amazon Elastic Kubernetes Service'te (Amazon EKS) AWS Trainium ile Llama2'yi eğitin

Blogu okuyun

Blog

Tutumluluk ile doğruluk buluşuyor: AWS Trainium ile GPT NeoX ve Pythia modellerinin uygun maliyetli eğitimi

Blogu okuyun

Blog

Amazon Search M5, AWS Trainium'u kullanarak büyük dil modeli (LLM) eğitim maliyetlerinde nasıl %30 tasarruf sağladı?

Blogu okuyun

Blog

AWS Trainium ile hızlı ve uygun maliyetli LLaMA 2 ince ayarı

Blogu okuyun

Blog

AWS Trainium bulut sunucuları tarafından desteklenen Amazon ECS'de ML iş yüklerinizi ölçeklendirin

Blogu okuyun

Ek kaynaklar

AWS Neuron kullanın ve TensorFlow, PyTorch veya MXNet içinden AWS Trainium'u kullanmaya başlayın

Daha fazla bilgi edinin

Trainium'u kullanmaya başlayın

Konsol

Konsolda oluşturmaya başlayın

Oturum açın

Ücretsiz kullanım

Eğitim örnekleri ve öğreticiler (Trn1 ve Trn1n)

Daha fazla bilgi edinin

AWS Trainium

Neden Trainium?

AWS Trainium Ailesi

Trainium1

Trainium2

Trainium3

Geliştiriciler için Tasarlandı

Avantajlar

Müşteriler

Yapay zekânın performansını, maliyetini ve ölçeğini fethedin

Çığır açan yapay zekâ performansı için AWS Trainium2

AWS yapay zekâ yongaları müşteri hikâyeleri

Kaynaklar

AWS Trainium3 ile modelleri uygun maliyetli bir şekilde eğitin ve dağıtın (yakında)

AWS Inferentia ve AWS Trainium ile Amazon SageMaker JumpStart'ta Llama 2 modellerinde uygun maliyetli bir şekilde ince ayar yapın ve dağıtın

Amazon Elastic Kubernetes Service'te (Amazon EKS) AWS Trainium ile Llama2'yi eğitin

Tutumluluk ile doğruluk buluşuyor: AWS Trainium ile GPT NeoX ve Pythia modellerinin uygun maliyetli eğitimi

Amazon Search M5, AWS Trainium'u kullanarak büyük dil modeli (LLM) eğitim maliyetlerinde nasıl %30 tasarruf sağladı?

AWS Trainium ile hızlı ve uygun maliyetli LLaMA 2 ince ayarı

AWS Trainium bulut sunucuları tarafından desteklenen Amazon ECS'de ML iş yüklerinizi ölçeklendirin

AWS Neuron kullanın ve TensorFlow, PyTorch veya MXNet içinden AWS Trainium'u kullanmaya başlayın

Trainium'u kullanmaya başlayın

Konsolda oluşturmaya başlayın

Eğitim örnekleri ve öğreticiler (Trn1 ve Trn1n)

Öğrenin

Kaynaklar

Geliştiriciler

Yardım

AWS Trainium

Neden Trainium?

AWS Trainium Ailesi

Trainium1

Trainium2

Trainium3

Geliştiriciler için Tasarlandı

Avantajlar

Yüksek performanslı, uygun maliyetli üretken yapay zekâ

Makine öğrenimi çerçeveleri ve kitaplıkları için yerel destek

Son teknoloji yapay zekâ optimizasyonları

Trainium'da Oluşturun ve Optimize Edin

Müşteriler

Yapay zekânın performansını, maliyetini ve ölçeğini fethedin

Çığır açan yapay zekâ performansı için AWS Trainium2

AWS yapay zekâ yongaları müşteri hikâyeleri

Kaynaklar

AWS Trainium3 ile modelleri uygun maliyetli bir şekilde eğitin ve dağıtın (yakında)

AWS Inferentia ve AWS Trainium ile Amazon SageMaker JumpStart'ta Llama 2 modellerinde uygun maliyetli bir şekilde ince ayar yapın ve dağıtın

Amazon Elastic Kubernetes Service'te (Amazon EKS) AWS Trainium ile Llama2'yi eğitin

Tutumluluk ile doğruluk buluşuyor: AWS Trainium ile GPT NeoX ve Pythia modellerinin uygun maliyetli eğitimi

Amazon Search M5, AWS Trainium'u kullanarak büyük dil modeli (LLM) eğitim maliyetlerinde nasıl %30 tasarruf sağladı?

AWS Trainium ile hızlı ve uygun maliyetli LLaMA 2 ince ayarı

AWS Trainium bulut sunucuları tarafından desteklenen Amazon ECS'de ML iş yüklerinizi ölçeklendirin

AWS Neuron kullanın ve TensorFlow, PyTorch veya MXNet içinden AWS Trainium'u kullanmaya başlayın

Trainium'u kullanmaya başlayın

Konsolda oluşturmaya başlayın

Eğitim örnekleri ve öğreticiler (Trn1 ve Trn1n)

Öğrenin

Kaynaklar

Geliştiriciler

Yardım