Amazon SageMaker HyperPod でオープンウェイトモデルのデプロイを加速
Amazon SageMaker HyperPod では、Amazon SageMaker JumpStart のオープンウェイトの基盤モデルと、Amazon S3 と Amazon FSx のファインチューニングされた独自のモデルの両方を Amazon SageMaker HyperPod に直接デプロイできるようになりました。これにより、同じ HyperPod コンピューティングリソース上でモデルのトレーニング、ファインチューニング、デプロイをシームレスに行うことができるようになり、モデルのライフサイクル全体でリソースを最大限に活用できます。
いくつかの簡単な手順により、SageMaker JumpStart のオープンウェイトの基盤モデルを選択し、SageMaker HyperPod クラスターにすばやくデプロイできます。SageMaker は、インフラストラクチャのプロビジョニング、クラスターへのモデルのデプロイ、自動スケーリングの有効化、SageMaker エンドポイントの設定を自動的に行います。SageMaker は、モデルエンドポイントのトラフィックの変化に応じて、HyperPod タスクガバナンスを通じてコンピューティングリソースをスケールアップ/スケールダウンし、HyperPod オブザーバビリティダッシュボードにメトリックを自動的に公開して、モデルのパフォーマンスを完全に可視化します。
SageMaker JumpStart のモデルは、HyperPod が利用可能なすべての AWS リージョン (米国東部 (バージニア北部)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、アジアパシフィック (ムンバイ)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ロンドン)、欧州 (ストックホルム)、南米 (サンパウロ)) にデプロイできます。
詳細については、SageMaker HyperPod のウェブページ、ブログ、ドキュメントを参照してください。