Amazon Web Services ブログ

Architecture diagram of the solution

JWT を使用した Amazon Bedrock と Amazon OpenSearch Service による SaaS 向けマルチテナント RAG 実装

本ブログでは、RAG 実装で使用される Vector DB の一つである Amazon OpenSearch Service を例に、JSON Web Token(JWT)と FGAC を組み合わせたテナント分離パターンとテナントリソースへのルーティング方法を紹介します。

Neuron Community

【開催報告】Neuron Community – Vol.2

2025年7月15日に開催された「Neuron Community – Vol.2」の様子をレポートします。このイベントは、「Neuron Community」の協力のもと開催しました。Neuron Community は、ユーザー間で AWS Trainium / AWS Inferentia エコシステムに関する情報や知見の共有を促進するための場として発足したものです。今回は、AWS Trainium / AWS Inferentia を実際に利用した経験を共有していただき、さらに Amazon EC2 Inf2 インスタンス上で推論サーバーを立ち上げるハンズオンを実施しました。

詳解: Amazon EKS 超大規模クラスター

本日、Amazon Elastic Kubernetes Service (Amazon EKS) は最大 10 万台のノードをサポートするクラスターの提供を発表しました。Amazon EC2 の新世代高速コンピューティングインスタンスタイプを活用することで、これは単一の Kubernetes クラスターで 160 万個の AWS Trainium チップまたは 80 万個の NVIDIA GPU を実現することを意味します。これにより、最先端のモデルトレーニング、ファインチューニング、エージェント推論などの超大規模人工知能 (AI) および機械学習 (ML) ワークロードが可能になります。

Amazon S3 Vectors と Amazon OpenSearch Service によるベクトル検索の最適化

ベクトル埋め込みと類似度検索機能の進歩に伴い、データの保存と検索方法が急速に進化しています。ベクトル検索は、生成 AI やエージェント AI などの最新のアプリケーションにとって不可欠なものとなっています。しかし、大規模なベクトルデータを管理することは大きな課題があります。組織は、数百万または数十億ものベクトル埋め込みを保存して検索する際、レイテンシー、コスト、精度のトレードオフに悩まされることが多くあります。従来のソリューションでは、大規模なインフラストラクチャの管理が必要になるか、データ量が増えるにつれて非常に高額なコストがかかります。

私たちは、Amazon Simple Storage Service (Amazon S3) Vectors と Amazon OpenSearch Service の 2 つの統合機能のパブリックプレビューを公開しました。これにより、ベクトル埋め込みをより柔軟に格納および検索することができるようになります。