メインコンテンツに移動

Amazon SageMaker HyperPod

Amazon SageMaker HyperPod のお客様

あらゆる規模のトップの AI スタートアップや組織が、SageMaker HyperPod で規模応じて基盤モデルのトレーニングとデプロイをに行っています

WRITER

WRITER は AWS インフラストラクチャを利用して LLM のトレーニングへのアプローチを変えました。同社は SageMaker HyperPod を使用して、シームレスなマルチノード分散トレーニングに役立てました。これにより、WRITER の研究チームは、業界ベンチマークにかけてパフォーマンスを向上させながら、モデル開発に集中できるようになりました。

Salesforce

Salesforce の AI リサーチチームは、分離されたノードを SageMaker HyperPod 上で高性能な GPU ファブリックに変えることで、トレーニングインフラストラクチャの迅速かつ大規模なデプロイを実現しました。HyperPod は、DevOps のオーバーヘッドを排除し、すぐに使える高度なトレーニングスタックのレシピを提供することで、モデルトレーニングサイクルを劇的に短縮し、Salesforce が顧客のためにイノベーションをより迅速に行えるようにしています。Amazon SageMaker HyperPod でのチェックポイントレストレーニングは、当社の LLM トレーニングインフラストラクチャを変革するでしょう。このテクノロジーにより、トレーニングの進行状況を失ったり、チェックポイントにフォールバックする必要なく、数分で障害回復が可能になり、Salesforce の AI 研究チームはワークロードとロードマップを加速できます。エラスティックトレーニングにより、開発サイクルを中断することなく、アイドル状態の GPU が利用できるようになったらそれを吸収し、シームレスにリソースを生成するようにワークロードを自動的にスケーリングできるようになります。最も重要なのは、利用可能なコンピューティングに合わせてジョブを手動で再設定するのに費やす時間を節約でき、イノベーションに再投資できることです。

Luma AI

最先端のビジュアル AI モデルのトレーニングには、膨大なコンピューティング能力とシームレスなインフラストラクチャが必要です。Luma AI は、最大規模の LLM の 1,000 倍のデータでトレーニングを行うため、高度でスケーラブルなソリューションが求められています。SageMaker HyperPod は、GPU、ネットワーク、ストレージを完璧に連携させるために必要な信頼性、パフォーマンス、効率性をもたらします。HyperPod を使用すると、AI デベロッパーは複雑なモデルをより迅速にトレーニングし、リソースを最適化し、最先端の AI を自信を持って市場に投入できます。

Amazon Nova

Amazon AGI チームは、最適化されたインフラストラクチャ、高速ストレージ、統合されたモニタリングおよびオブザーバビリティツールを使用して、SageMaker HyperPod 上で Amazon Nova 基盤モデルのトレーニングを行いました。SageMaker HyperPod は、大規模な分散クラスター全体にわたって、レジリエントで効率的かつスケーラブルなモデル開発を可能にします。

Hugging Face

Hugging Face は SageMaker HyperPod を使用して、StarCoder、IDEFICS、Zephyr などの新しいオープン基盤モデルを作成しました。SageMaker HyperPod の専用設計の耐障害性とパフォーマンス機能により、当社のオープンサイエンスチームは、インフラストラクチャの管理ではなく、基盤モデルの構築方法に関する重要な改善点の革新と公開に集中できるようになりました。

Perplexity AI

Perplexity は、会話回答エンジンを強化する LLM を構築してファインチューニングしました。この LLM は、引用の形で提供される参照とともに質問に回答します。SageMaker HyperPod を使用すると、モデルトレーニングの実行速度が 40% 短縮され、実験の実行速度が 2 倍になります。

Articul8 AI

HyperPod を導入したことで、Articul8 は生産性を 35% 向上させ、GenAI 事業をスケールアップすることができました。SageMaker HyperPod のタスクの優先順位付けとリソース割り当ての自動化により、GPU の使用率が劇的に高まり、アイドル時間が短縮され、トレーニングやファインチューニングから推論に至るまでのタスクを最適化することでモデル開発プロセスが加速しました。SageMaker HyperPod オブザーバビリティにより、同社はメトリクスの収集と視覚化システムをワンクリックでデプロイできるようになりました。これにより、チームが手動でセットアップする必要がなくなり、クラスター オブザーバビリティのワークフローとインサイトが強化されます。

Coastal Carbon

Coastal Carbon は、人工知能とクラウドを通じて環境保全に革命を起こしています。同社は SageMaker HyperPod を使って何千ペタバイトもの過去の衛星データを処理し、デジタルツインと自然界の基盤モデルを作成しています。

EvolutionaryScale

EvolutionaryScale は、科学者がタンパク質を理解し、想像し、作成できるようにする先駆的な AI スタートアップです。同社は SageMaker HyperPod を使って 20 億を超えるタンパク質配列のトレーニングを行い、タンパク質工学と創薬の限界を押し広げました。

Noetik

Noetik は、SageMaker HyperPod を活用してがん治療薬の発見と開発を行っている AI ネイティブのバイオテクノロジー企業です。

Latent Labs

Latent Labs は SageMaker HyperPod を利用して、トレーニング、ファインチューニング、推論 (モデルを使用して新しいデータに基づいて予測を行う) などのモデル開発タスクを、数百、数千の AI アクセラレーターのクラスター全体で迅速にスケールできるようになりました。AI モデルを介して新しい生物学的配列 (DNA など) をより正確かつ簡単に生成してテストできるようになれば、その製造と現実世界への展開が高速化します。

TwelveLabs

TwelveLabs は、企業が AI を活用したビデオインテリジェンスを操作し、利用する方法を変革しています。同社は SageMaker HyperPod を使用してモデルのトレーニングとスケーリングをより効率的に行っています。耐障害性と分散型トレーニングインフラストラクチャにより、GPU をすばやく起動し、モデルをできるだけ早くトレーニングできます。

Arcee AI

Arcee AI は、企業が法律文書の分析などの特殊なタスクを実行できるように、ドメインに合わせたスモールランゲージモデル (SLM) を開発しています。SageMaker HyperPod を使用してトレーニングワークロードを GPU 全体に効率的に分散し、モデルトレーニング時間を 40%短縮しました。

Intercom

Intercomでは、Finを改善するために常に新しいモデルのトレーニングを行っており、チェックポイントのないトレーニングをパイプラインに統合できることを非常に嬉しく思います。これにより、チェックポイントを手動でリカバリする必要がなくなります。柔軟なトレーニングと組み合わせることで、より迅速に、より少ないインフラコストでFinの改善を実現できるようになります。

Missing alt text value

Bayer

SageMaker HyperPod を使用することで、Bayer はわずか数か月で新しい FM をトレーニングし、活用することができました。同社の科学チームは、膨大な量の生物医学画像データを処理し、高度な機械学習 (ML) モデルをトレーニングし、表現型の特徴に基づいて有望な薬剤候補を特定できるようになりました。Bayer がイノベーションを続ける中、AWS との連携は、より迅速で効率的な医薬品の研究開発への道を開くのに役立っています。 

Bayer logo with a blue and green circular design and the word 'BAYER' arranged vertically and horizontally in the center.

ソニー・ホンダモビリティ

ソニー・ホンダモビリティは、AFEELA Intelligent Drive を強化するために、MLOps パイプライン内のモデルトレーニングに SageMaker HyperPod を使用しています。「HyperPod のすぐに使用できるオブザーバビリティ機能により、複数のディメンション (クラスター、ノード、タスクなど) にわたる包括的なメトリクスセットが得られます。タスクレベルの集計により、事前に設定された状態とパフォーマンスに関するより深いインサイトが得られることを楽しみにしています」

ソニー・ホンダモビリティ、ネットワークサービス開発部の MLOps エンジニア、片岡 基氏

Missing alt text value

Thomson Reuters

Thomson Reuters は 30 年以上にわたり AI 開発の最前線に立ってきました。私たちは、お客様が信頼できる情報にアクセスしやすく、より迅速に結果を出せるように、有意義なソリューションを提供することに全力を注いでいます。生成 AI のイノベーションを加速させるために、LLM プロバイダーとの提携に加えて、独自のコンテンツと人間の専門知識を活用して、カスタムモデルのトレーニングをより効率的に行うことも検討しています。SageMaker HyperPod の分散型トレーニングライブラリは、大規模モデルトレーニングのパフォーマンスを向上させるのに役立ちます。また、その耐障害性機能により、インフラストラクチャの監視と管理にかかる時間を節約できます。基盤モデルを SageMaker HyperPod でトレーニングすることで、市場投入までの時間が短縮され、顧客に質の高いソリューションを迅速に提供できるようになります。

Thomson Reuters Labs、Head of AI and Labs、Joel Hron 氏、および Thomson Reuters Labs、Distinguished Engineer、John Duprey 氏

Missing alt text value

Stability AI

オープンソースの生成 AI の大手企業として、私たちの目標はモダン AI のアクセシビリティを最大限高めることです。私たちは数百億のパラメータを持つ基礎モデルを構築しており、そのためには最適なトレーニングパフォーマンスをスケーリングできるインフラストラクチャが必要です。SageMaker HyperPod のマネージドインフラストラクチャと最適化ライブラリにより、トレーニング時間とコストを 50% 以上削減できます。これにより、モデルトレーニングの回復力とパフォーマンスが向上し、最先端のモデルをより迅速に構築できるようになります。

Stability AI、創立者兼 CEO、Emad Mostaque 氏

Missing alt text value

Recursal AI

プロセス全体が合理化されました。SageMaker HyperPod を利用すると、ハードウェア障害が発生した場合に、最後に保存されたチェックポイントからトレーニングジョブを特定して自動的に回復する、クラスターの回復力機能を活用できます。当社は Kubernetes を共通のスレッドとして使用して、アプリケーション、推論、トレーニングなど、非常に多様なワークロードを実行しています。当社にとって、SageMaker HyperPod での Amazon EKS はよく機能しています。そのプロセスは、ノードがクラスターに追加されるというシンプルなものです。

Recursal、インフラストラクチャ/データ責任者、Nathan Wilce 氏

Missing alt text value

Hippocratic AI

Hippocratic AI は、医療向けに安全性を重視した初の大規模言語モデル (LLM) を開発する AI 企業です。主要な LLM とスーパーバイザーモデルをトレーニングするために、Hippocratic AI は強力なコンピューティングリソースを必要としていましたが、これは需要が高く、入手するのが困難でした。Amazon SageMaker HyperPod の柔軟なトレーニングプランにより、Amazon Elastic Compute Cloud (Amazon EC2) P5 インスタンスへのアクセスが容易になりました。また、Hippocratic AI は、Grafana などの AWS サービスも活用して、重要な GPU 使用率メトリクスを追跡しています。Hippocratic AI は Amazon EC2 P5 インスタンスを使用することで、モデルトレーニングの速度を 4 倍にしたほか、何百ものユースケースに対応するためにソリューションをスケールしました。これは、必要なコンピューティングリソースを確保し、モデルを迅速にトレーニングするのに役立ちました。

Missing alt text value

NinjaTech

無限の生産性を実現するためのオールインワンの SuperAgent を提供する生成 AI 企業である NinjaTech AI は、Amazon SageMaker HyperPod の柔軟なトレーニングプランを使用して、Llama 3.1 405B モデルを含むさまざまな内部モデルのファインチューニングを加速し、モデルトレーニングのコストを削減して、プロセスを自動化しました。同社は、SuperAgent テクノロジーを強化するさまざまな AI エージェントへのアクセスを希望するユーザーにシームレスなエクスペリエンスを提供することを目指しています。これを実現するには、ユーザーの意図を自動的に予測し、どの AI エージェントが適しているかを判断できるモデルが必要でした。このメカニズムでは、顧客からのフィードバックと新機能を反復的に取り入れてモデルを頻繁に更新する必要があり、LoRA のファインチューニングの各ラウンドで 1,000 万~1 億トークンが必要でした。スタートアップにとって、高性能コンピューティングリソースの取得と運用は、アクセラレーテッドコンピューティングに加えて、高速ネットワークと高速ストレージを必要とするマルチノードクラスターでは特に、非常に高額なコストと帯域幅の問題により困難です。さらに、トレーニングプロセスには時間がかかり、モデルのダウンロード、分散トレーニング、チェックポイント、モニタリング、自動是正、マージ、量子化などのステップが含まれます。HyperPod の柔軟なトレーニングプランは、トレーニング実行前に信頼性が高く手頃な料金のコンピューティングを会社に提供しました。これにより、効率的なモデルトレーニングを実現しながら、特定のコンピューティングとタイムラインの要件を満たすことができました。

Missing alt text value

OpenBabylon

過小評価されている言語の大規模言語モデルをカスタマイズする AI 企業である OpenBabylon のデベロッパーとデータサイエンティストは、数か月間にわたって SageMaker HyperPod の柔軟なトレーニングプランを使用して、GPU リソースへのアクセスを効率化し、大規模な実験を実行しています。マルチノード SageMaker HyperPod の分散トレーニング機能を使用して、100 件の大規模なモデルトレーニング実験を実施し、英語からウクライナ語への翻訳で最先端の結果を得ることができました。この画期的な進歩はスケジュールどおりに、かつ、コスト効率よく達成され、SageMaker HyperPod が複雑なプロジェクトを、スケジュールどおりに、かつ、予算内で成功裏に実現できることを実証しました。

Missing alt text value

H.AI

「Amazon SageMaker HyperPod で、同じ高性能コンピューティングを使用してエージェンティック AI プラットフォームの基盤モデルを構築し、デプロイしました。トレーニングから推論へのシームレスな移行によってワークフローが合理化され、本番までの時間が短縮され、ライブ環境での一貫したパフォーマンスを確保できました。HyperPod は、実験から現実世界へのインパクトをより迅速かつ効率的に実現する上で役立ちました」

H.AI、Co-founder & CTO、Laurent Sifre 氏

Missing alt text value

Datology AI

「Amazon SageMaker HyperPod のワンクリック オブザーバビリティ ソリューションを使用するのが楽しみです。当社のシニア スタッフ メンバーは、私たちが高価な GPU リソースをどのように活用しているかについてインサイトを必要としていました。事前に構築された Grafana ダッシュボードにより、監視インフラストラクチャを維持しなくても、タスク固有の GPU 使用率からファイル システム (FSx for Lustre) のパフォーマンスに至るまで重要な指標を即座に可視化し、必要なものを確実に提供できます。Prometheus Query Language のパワーを高く評価している私としては、インフラストラクチャの問題を気にすることなく、独自のクエリを作成してカスタム メトリクスを分析できる点が気に入っています」

Datology AI、Member of Technical Staff、Josh Wills 氏

Missing alt text value

Splash Music

「SageMaker HyperPod と Trainium を使えば、当社の研究者はコミュニティが制作するのと同じくらい速く実験できます。私たちは音楽のトレンドについていくだけでなく、トレンドを作り出しているのです」

Splash Music、Chief Technology Officer、Randeep Bhatia 氏

Missing alt text value

Amazon SageMaker HyperPod パートナー

深い技術的知識と実績のある顧客成功経験を持つ AWS パートナーを活用して、イノベーションを推進し、より大きなビジネス価値を引き出しましょう

Accenture

「私たちは、Amazon SageMaker HyperPod のタスクガバナンスのローンチパートナーとして AWS との提携を拡大しています。AWS とのコラボレーションにより、生成 AI アプリケーションのコストを削減しながら、お客様を最新の技術的ブレークスルーへと導くことができます。SageMaker HyperPod の一元化されたガバナンス機能と、生成 AI プロジェクトにおける当社の経験を組み合わせることで、企業が生成 AI の価値をより早く実感し、カスタマーエクスペリエンスを向上させ、投資収益率を高めるのを支援できます」

Accenture、Global Lead for AWS Business Group & Senior Managing Director、Jennifer Jackson 氏

Missing alt text value

Slalom

「Amazon SageMaker HyperPod タスクガバナンスのローンチパートナーとして AWS と協力できることを嬉しく思います。AWS と連携することで、お客様が最新の技術進歩を迅速に採用し、生成 AI アプリケーションのコストを削減できるよう支援できるようになりました。SageMaker HyperPod の一元化されたガバナンス機能と、Slalom の豊富な AI とクラウドの経験を組み合わせることで、投資収益率を高めるとともに、優れたカスタマーエクスペリエンスをもたらすることができます」

Slalom、Managing Director of Amazon Center of Excellence (CoE)、Jeff Kempiners 氏

Missing alt text value

Rackspace Technology

「SageMaker HyperPod タスクガバナンスのローンチパートナーとして AWS と協力できることを嬉しく思います。私たちは力を合わせることで、最新の技術の進歩に歩調を合わせながら、お客様が生成 AI アプリケーションのコストを削減できるよう支援できます。SageMaker HyperPod の一元化されたガバナンス機能と、Rackspace の深い AI とクラウドの専門知識を組み合わせることで、カスタマーエクスペリエンスを変革し、同時に投資収益率を向上させることができます」

Rackspace Technology、President, AI, Technology and Sustainability、Srini Koushik 氏

Missing alt text value

今日お探しの情報は見つかりましたか?

ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます