AWS Trainium
Trainium: Uygun ölçekte yüksek performanslı ve uygun maliyetli yapay zekâ için özel olarak geliştirilmiştir
Neden Trainium?
AWS Trainium, çok çeşitli üretken yapay zekâ iş yüklerinde eğitim ve çıkarım için ölçeklenebilir performans ve maliyet verimliliği sağlamak üzere tasarlanmış, amaca yönelik yapay zekâ hızlandırıcıları (Trainium1, Trainium2 ve Trainium3) ailesidir.
AWS Trainium Ailesi
Trainium1
Birinci nesil AWS Trainium yongası, benzer Amazon EC2 bulut sunucularına kıyasla %50'ye kadar daha düşük eğitim maliyetleri içeren Amazon Elastic Compute Cloud (Amazon EC2) Trn1 bulut sunucularına güç vermektedir. Ricoh, Karakuri, SplashMusic ve Arcee AI dâhil birçok müşteri, Trn1 bulut sunucularının performans ve maliyet avantajlarını fark ediyor.
Trainium2
AWS Trainium2 yongası, birinci nesil Trainium'a kıyasla 4 kata kadar daha yüksek performans sunar. Trainium2 tabanlı Amazon EC2 Trn2 bulut sunucuları ve Trn2 UltraServers, üretken yapay zekâ için özel olarak geliştirilmiştir ve GPU tabanlı EC2 P5e ve P5en bulut sunucularına kıyasla %30-40 daha iyi fiyat performansı sunar. Trn2 bulut sunucuları 16 adede kadar Trainium2 yongasına sahiptir ve Trn2 UltraServers, tescilli yongadan yongaya ara bağlantımız olan NeuronLink ile birbirine bağlanan 64 adede kadar Trainium2 yongasına sahiptir. Çok çeşitli yeni nesil üretken yapay zekâ uygulamaları oluşturmak için büyük dil modelleri (LLM'ler), çok modlu modeller, difüzyon dönüştürücüleri dâhil olmak üzere en zorlu modelleri eğitmek ve dağıtmak üzere Trn2 bulut sunucularını ve UltraServers'ı kullanabilirsiniz.
Trainium3
AWS'nin ilk 3 nm yapay zekâ yongası, yeni nesil temsilci tabanlı uygulamalar, akıl yürütme uygulamaları ve video oluşturma uygulamaları için en iyi belirteç ekonomisini sunmak üzere özel olarak tasarlanmıştır. AWS Trainium3 yongası, 2,52 petaflop (PFLOP) FP8 işlem gücü için 2 kat daha yüksek işlem performansı sağlar ve Trainium2'ye kıyasla bellek kapasitesini 1,5 kat ve bant genişliğini 1,7 kat artırarak 144 GB HBM3e belleğe ve 4,9 TB/sn bellek bant genişliğine ulaşır. Trainium3 tarafından desteklenen Trn3 UltraServers, Trn2 UltraServers'a kıyasla 4,4 kata kadar daha yüksek performans, 3,9 kat daha yüksek bellek bant genişliği ve 4 katın üzerinde daha iyi enerji verimliliği sunar. Trainium3, gelişmiş veri türlerine (MXFP8 ve MXFP4) sahip yoğun ve uzman paralel iş yükleri için oluşturulmuştur ve gerçek zamanlı görevlerin, çok modlu görevlerin ve akıl yürütme görevlerinin bellek-işlem dengesini iyileştirir.
Geliştiriciler için Tasarlandı
Yeni Trainium3 tabanlı UltraServers, yapay zekâ araştırmacıları için geliştirilmiş olup AWS Neuron SDK tarafından desteklenir ve olağanüstü bir performans sağlar.
Yerel PyTorch entegrasyonu ile geliştiriciler, kodun tek bir satırını bile değiştirmeden eğitebilir ve dağıtabilir. Yapay zekâ performans mühendislerinin Trainium3'e daha derin erişimini sağlayarak geliştiricilerin performansa ince ayar yapmalarına, çekirdekleri özelleştirmelerine ve modelleri daha da ileriye taşımalarına olanak tanıdık. Yenilik açıklıkta gelişir; bu nedenle, geliştiricilerimizle açık kaynaklı araçlar ve kaynaklar aracılığıyla etkileşim kurmaya kararlıyız.
Daha fazla bilgi edinmek için Amazon EC2 Trn3 UltraServers'ı ziyaret edin ve AWS Neuron SDK'yi keşfedin.
Avantajlar
Trn3 UltraServers, 144 adede kadar Trainium3 yongasında daha hızlı tümden tüme kolektifler sağlayan NeuronSwitch-v1 sayesinde, ölçeği artırılan UltraServer teknolojisindeki en son yeniliklere sahiptir. Trn3 UltraServer, 20,7 TB'a kadar HBM3e, 706 Tb/sn bellek bant genişliği ve 362 MXFP8 PFLOP sağlayarak, Trn2 UltraServers'a göre 4,4 kata kadar daha yüksek performans ve 4 katın üzerinde daha iyi enerji verimliliği sunar. Trn3, en yeni 1 trilyondan fazla parametreli MoE ve akıl yürütme tipi modelleriyle eğitim ve çıkarım için en düşük maliyetle en yüksek performansı sunar ve Trainium2 tabanlı bulut sunucularına kıyasla uygun ölçekte hizmet veren GPT-OSS için önemli ölçüde daha yüksek aktarım hızı sağlar.
Trn2 UltraServers, 1 trilyona kadar parametreye sahip modellerin üretken yapay zekâ eğitimi ve çıkarımı için yüksek performanslı ve uygun maliyetli bir seçenek olmaya devam ediyor. Trn2 bulut sunucuları 16 adede kadar Trainium2 yongasına sahiptir ve Trn2 UltraServers, tescilli bir yongadan yongaya ara bağlantı olan NeuronLink ile bağlantılı 64 adede kadar Trainium2 yongasına sahiptir.
Trn1 bulut sunucuları 16 adede kadar Trainium yongasına sahiptir ve 3 PFLOP'a kadar FP8 işlem gücü, 9,8 TB/sn bellek bant genişliğine sahip 512 GB HBM ve 1,6 Tbps'ye kadar EFA ağ iletişimi sağlar.
AWS Neuron SDK, Trn3, Trn2 ve Trn1 bulut sunucularından tam performansı elde etmenize yardımcı olur, böylece modeller oluşturmaya ve dağıtmaya ve pazara ulaşma sürenizi hızlandırmaya odaklanabilirsiniz. AWS Neuron; PyTorch ve Jax'ın yanı sıra Hugging Face, vLLM, PyTorch Lightning ve diğerleri gibi gerekli kitaplıklarla yerel olarak entegre olur. Profil oluşturma ve hata ayıklama için derin öngörüler sağlarken modelleri optimize ederek dağıtılmış eğitim ve çıkarım için kullanıma hazır hâlde sunar. AWS Neuron hem Amazon SageMaker, Amazon SageMaker Hyerpod, Amazon Elastic Kubernetes Service (Amazon EKS), Amazon Elastic Container Service (Amazon ECS), AWS ParallelCluster ve AWS Batch gibi hizmetlerle hem de Ray (Anyscale), Domino Data Lab ve Datadog gibi üçüncü taraf hizmetleriyle entegrasyon sağlar.
AWS Trainium, doğruluk hedeflerini karşılarken yüksek performans sunmak için
BF16, FP16, FP8, MXFP8 ve MXFP4 gibi çeşitli karma duyarlıklı veri türlerini destekler. Trainium2 ve Trainium3, üretken yapay zekâda yüksek inovasyon hızını
desteklemek üzere 4 kat seyreklik (16:4), mikro ölçekleme, stokastik yuvarlama ve tahsis edilmiş kolektif altyapılar
için donanım optimizasyonlarına sahiptir.
Neuron, geliştiricilerin çekirdek geliştirme için Nöron Kernel Arabirimi (NKI) kullanarak iş yüklerini optimize etmelerini sağlar. NKI, talimat düzeyinde programlama, bellek tahsisi ve yürütme zamanlaması üzerinde tam kontrol sağlayan eksiksiz Trainium ISA'yı kullanıma sunar. Geliştiriciler, kendi çekirdeklerini oluşturabilir ve ayrıca, optimize edilmiş çekirdekleri dağıtmaya hazır olan, açık kaynaklı Neuron Çekirdek Kitaplığını kullanabilir. Son olarak, Neuron Explore, geliştiricilerin kodunu donanımdaki altyapılara bağlayarak tam yığın görünürlüğünü sağlar.
Müşteriler
Anthropic, Decart, poolside, Databricks, Ricoh, Karakuri, SplashMusic ve diğerleri gibi müşteriler, Trn1, Trn2 ve Trn3 bulut sunucularının ve UltraServers'ın performans ve maliyet avantajlarını fark ediyor.
Trn3'ü erken benimseyenler, yeni nesil büyük ölçekli üretken yapay zekâ modelleri için yeni verimlilik ve ölçeklenebilirlik seviyeleri elde ediyor.
Yapay zekânın performansını, maliyetini ve ölçeğini fethedin
Çığır açan yapay zekâ performansı için AWS Trainium2
AWS yapay zekâ yongaları müşteri hikâyeleri