- 機器學習›
- AWS Trainium›
- AWS Trainium 研究
什麼是 Build on Trainium?
AWS Trainium 研究叢集
Amazon 研究獎
Neuron Kernel Interface
優勢
參與大學
以下是領先的大學如何從 Build on Trainium 計畫中受益。
麻省理工學院
麻省理工學院的 Device Realization Lab 使用 AWS Trainium 來挑戰醫學 AI 研究的極限。我們使用比以往更快、更有效率的方式訓練 3D 超音波分段和聲速估算模型,從而在縮短一半以上實驗時間的同時,達成頂尖的準確度。AWS Trainium 讓我們得以透過傳統 GPU 系統無法達成的方式擴展研究。透過在 AWS Trainium (trn.32xlarge) 上訓練我們的 3D 完全卷積神經網路,我們得以實現最先進的效能,與 NVIDIA A100 執行個體相比,輸送量提高 50%,而且成本更為低廉。透過 32 節點的 Trainium 叢集,我們有效率地進行了 180 多項消融實驗,將總訓練時間從數個月縮短為數週,並加速了麻省理工學院的醫療 AI 創新。未來,我們計劃使用 Trainium 訓練 AI 代理程式模型,以操作和自動化數位超音波工作流程,從而節省大量臨床醫生時間,並為患者提供更好的照護。」
卡內基梅隆大學
「CMU Catalyst 研究小組致力於最佳化 ML 系統。我們的專案旨在讓使用者能夠於不同的 ML 系統中更輕鬆地進行最佳化。Trainium 能夠以獨一無二的方式,透過 Neuron Kernel Interface (NKI) 提供低層級控制和可存取的程式設計介面。
在 AWS 透過 Build on Trainium 計畫的支援下,我們的研究人員得以探索 FlashAttention 這項關鍵核心的進階最佳化作業。最令我們驚訝的是我們能夠進行迭代的速度:我們僅花費一周時間,就透過公開可用的 NKI、Neuron Profiler 和架構文件,在先前最先進的成果上實現了有意義的改善。強大工具和清晰硬體見解的結合,讓我們的團隊能夠輕鬆進行複雜的低層級最佳化。
AWS Trainium 和 Neuron Kernel Interface (NKI) 使我們這類研究人員能夠更快地進行創新,消除通常會減慢硬體特定最佳化工作的障礙。」
加州大學柏克萊分校
「透過 Build on Trainium 計畫,他的團隊獲得了 AWS Neuron 全新 NKI 開放原始碼編譯器堆疊的完整存取權限,包括針對 Trainium ISA 和 API 的直接可見性,以便進行精確的排程和記憶體配置。這種可見性和控制程度,讓他的學生得以更輕鬆地分析最佳化機會,並更有效地探索高效能的實作方式。」
加州大學柏克萊分校資訊系副教授 Christopher Fletcher
伊利諾大學厄巴納/香檳分校
「AWS Trainium 和 Inferentia 的存取權對於推動我們對大規模、高效 AI 系統的研究和教育至關重要。我們使用這些平台進行混合專家訓練和推論最佳化,並為新的執行時期和排程技術設計原型,以提高新興加速器架構的可擴展性、效率和可攜性。UIUC 研究人員正在利用 Neuron 開發人員堆疊開發新的執行時期和排程技術,以提高 AI 工作負載的效率和可攜性。團隊對 Neuron 開發人員堆疊的開放性留下了深刻印象,這項特性使這些平台在執行時期研究中格外有價值,並在稀疏度、記憶體階層和通訊效率方面實現了超越傳統 GPU 架構的創新。」
加州大學洛杉磯分校
「透過利用 AWS Trainium 和 Build on Trainium 計畫,我和我的學生得以大幅加速量子電路模擬作業。這項專案聚集了一群優秀的學生,他們合作構置了一個高效能模擬器,從而大規模完成先前不可能實現的更深入實驗和實踐學習。」
雪梨科技大學
「我們 UTS 的研究團隊正在透過開發自訂 Neuron NKI 核心來探索樹輪水印演算法的整合。透過 Build on Trainium 計畫存取開放原始碼 Neuron 堆疊,帶來了變革性的結果。這為我們提供前所未有的 Trainium 架構可見性,以及直接在硬體層級作業的能力。Trainium 的存取權讓我們的團隊能夠大幅加速我們的水印工作負載、減少迭代週期,並使我們得以探索更複雜的模型和技術。這種深入的存取權使我們的研究人員能夠為新想法建立原型、實驗低層級最佳化,並挑戰水印系統在現代 AI 加速器上的限制。」