Amazon Web Services ブログ

週刊生成AI with AWS – 2025/8/18 週

みなさん、こんにちは。AWS ソリューションアーキテクトの野間です。既に夏休みを取られた方もいらっしゃるのではないかと思います。アウトドアでアクティブに過ごした方も、涼しい部屋でゆっくりリフレッシュできた方も、それぞれの“最高の休暇の使い方”があったのではないでしょうか。実はこの「自分に合った活用法を見つける」感覚、生成AIにピッタリ重なります。今週の週間生成AI with AWSでも、あなたの“生成AI活用体験”がさらに一歩進む情報をお届けします。

8月22日に、LLMの基礎からRAG、AIエージェントまで網羅し、ハンズオンで実践力が身につく書籍「AWS 生成 AI アプリ構築実践ガイド」が出版されました。基礎理解から応用・実装方法までしっかり学べる内容となっていますので、ぜひ読んでみてください!
また、先日新たに2つのプランが追加された「AWS ジャパン生成 AI 実用化推進プログラム」も、たくさんのお申し込みをいただいています。企業やプロジェクト単位でもまだまだ募集中ですので、この機会にご活用いただけますと幸いです。

では今週も生成 AI with AWS界隈のニュースを見ていきましょう!

さまざまなニュース

  • ブログ記事「Kiro と Model Context Protocol (MCP) で開発生産性を解き放つ」
    Kiro IDE と Model Context Protocol (MCP) の統合により、開発者は既存のツールやサービスとシームレスに連携しながら AI を活用した開発が可能になります。ブログでは GitLab との統合例として、GitLab のIssueを自動的に読み込んで Kiro の仕様駆動開発機能で要件ドキュメントや設計書を生成し、実装可能なタスクリストまで自動作成する流れが紹介されています。これにより開発者はコンテキストスイッチに費やす時間を大幅に削減し、コード作成やアーキテクチャ設計といった本質的な開発作業により多くの時間を集中できるようになり、チーム全体の生産性向上と品質の高いソフトウェア開発が実現されます。
  • ブログ記事「Kiro の料金プランが公開されました」
    Kiroが正式に料金プラン体系を発表し、Amazon Q Developer サブスクリプション非所有者向けの新しい料金モデルの提供を開始しました。無料プランでは月50件のVibeリクエストが利用可能で、全ユーザーに対して14日間有効な100件のSpecリクエストと100件のVibeリクエストのウェルカムボーナスが提供されます。有料プランとしてPro、Pro+、Powerの3つのオプションが用意され、ユーザーは自身の利用パターンに合わせて最適なプランを選択できます。また、使用状況の監視や支払い管理が可能な新しいダッシュボードも導入され、よりフレキシブルな利用が可能になりました。
  • ブログ記事「Amazon Q Developer CLI を使用した運用のトラブルシューティング効率化」
    Amazon Q Developer CLI は、従来の複雑で時間のかかる運用トラブルシューティング作業を、自然言語による対話形式のインターフェイスで劇的に効率化する機能を提供します。記事では Nginx の 502 Gateway Timeout エラーを例に、従来であれば複数のコンソール間を行き来しながら手動で行っていた調査・分析・修正作業を、Amazon Q Developer CLI が自動的にインフラストラクチャ検出、ログ分析、根本原因特定、CDK コードの修正、デプロイ、検証まで一貫して実行する様子が紹介されています。単一の対話型インターフェイスで AWS CLI コマンドを実行し、複数サービスにわたる情報を相関分析して問題を特定・解決できるため、エンジニアは数時間から数日かかっていたトラブルシューティング作業を大幅に短縮できます。インフラストラクチャチームの認知負荷を軽減し、より本質的な改善作業に時間を集中できるようになる、運用効率化において非常に価値の高いツールです。
  • ブログ記事「機械の故障予防: フィジカル AI が機器の問題を予測する方法」
    フィジカル AI とは、コンピューター画面の中だけでなく、現実世界で実際に動いて作業するAI技術のことです。従来のAIがテキストや画像を処理するのに対し、フィジカルAIはロボットや自動運転車のように、私たちの身の回りの環境を理解して物理的に行動できる点が大きな特徴です。この技術が機械の故障予防分野で革命的な変化をもたらしており、特に電気自動車(EV)では、車両が自分自身の健康状態を常に監視し、バッテリーやモーターの調子を学習することで、故障する前に問題を予測・防止する賢いメンテナンスシステムが実現されています。AWS IoT FleetWise、Amazon SageMaker、Amazon Bedrock などの AWS サービスを組み合わせることで、車両データの収集から機械学習による故障予測、生成 AI を活用した修理計画作成まで、総合的な予防保全ソリューションが構築できます。この技術は工場のロボット、医療機器、社会インフラにも応用でき、「壊れてから直す」従来の方法から「壊れる前に予防する」賢いシステムへと進化させ、企業の運用コスト削減と機器の長寿命化という大きな価値を提供します。
  • ブログ記事「Amazon Q Business と Amazon Bedrock によるSAP データ価値の最大化 – パート 1」
    このブログでは、SAP システムを利用している企業が AWS の生成AI サービスを活用して、日々の業務を効率化し、データから新たな価値を創出する方法を紹介しています。多くの企業が「生成AIを使いたいが、SAPデータでどこから始めればよいかわからない」という課題を抱えている中、Amazon Q Business と Amazon Bedrock を使った2つの実践的なソリューションが提案されています。1つ目は、通常数十ページに及ぶ SAP Early Watch Analysis (EWA) レポートを自然言語で簡単に分析できるシステムで、従来の手作業による分析時間を大幅に削減し、複数システムの健康状態を迅速に把握できるようになります。2つ目は、紙やPDFの請求書処理を自動化するインテリジェントドキュメントプロセッシング機能で、手作業によるエラーを減らし、処理速度を向上させることができます。これらのソリューションは詳細な構築手順とコスト例も含まれており、SAP環境で生成AIの導入を検討している企業にとって、具体的で実用的な価値を提供します。従来の時間のかかる分析作業から、AIを活用した効率的な業務プロセスへの転換を支援する内容となっています。
  • ブログ記事「Realtek、Plumerai、Amazon Kinesis Video Streams を活用したエッジでの効率的な動画ストリーミングとビジョンAI」
    このブログでは、最新のスマートカメラ技術を組み合わせた監視システムソリューションを紹介しています。従来の防犯カメラは常に録画してクラウドに送信していましたが、今回紹介するシステムは、カメラ自体が賢くなって人を見つけた時だけ動画を送信します。Realtek の小型で高性能なマイクロコントローラー「Ameba Pro2」、軽量で効率的な AI を提供する Plumerai の機械学習モデル、そして AWS の動画ストリーミングサービス Amazon Kinesis Video Streams を組み合わせることで実現されています。このシステムの特徴は、カメラが現地で人物検知の AI 処理を行うため、プライバシーが守られ、インターネットの通信量も大幅に削減できることです。実際の性能も優秀で、わずかなメモリ使用量で 20 メートル先の人物を検知でき、最大 20 人まで同時に追跡可能です。スマートホームから企業の監視システムまで幅広く活用でき、必要な時だけ動画を送信する賢いカメラシステムによって、コスト削減とプライバシー保護を両立した次世代の監視ソリューションを提供します。

サービスアップデート

  • Amazon Bedrock が、Anthropic Claude Sonnet 4 と OpenAI GPT-OSS モデルのバッチ推論をサポート
    Amazon Bedrockで、Anthropic Claude Sonnet 4およびOpenAI GPT-OSS(120Bと20B)モデル向けのバッチ推論が利用可能になりました。複数の推論リクエストを非同期で処理できるようになり、大規模データセットでのパフォーマンスが向上し、通常のオンデマンド推論価格の半額で利用できます。ドキュメント分析、マーケティングコピーの一括生成、ナレッジベースの自動要約、サポートチケットの分類など、様々なシナリオで効率的に大量のデータを処理できるようになりました。さらに、以前のモデルと比較してバッチスループットが向上し、Amazon CloudWatchメトリクスを使ってバッチワークロードの進捗をAWSアカウントレベルで追跡することも可能になりました。大規模な生成AIワークロードをコスト効率よく処理したいユーザーにとって、非常に価値のあるアップデートです。
  • TwelveLabs の Pegasus 1.2 モデルが 米国東部(バージニア北部)およびアジアパシフィック(ソウル)で利用可能に
    TwelveLabs の Pegasus 1.2 モデルが米国東部(バージニア北部)およびアジアパシフィック(ソウル)の AWS リージョンで新たに利用可能になりました。Pegasus 1.2 は長時間ビデオに特化した言語モデルで、従来のテキスト中心のモデルとは異なり、ビデオコンテンツの理解に最適化されて設計されています。ビデオ内の視覚・音声・テキスト情報を総合的に分析してテキストを生成できる強力な機能を持っています。新しいリージョンでの提供により、ユーザーのデータや最終利用者により近い場所でアプリケーションを構築できるようになり、レイテンシーの削減とアーキテクチャの簡素化が実現できます。
  • Amazon Bedrock で OpenAI のオープンウェイトモデルへのアクセスが簡素化
    Amazon Bedrock で OpenAI のオープンウェイトモデル(gpt-oss-120b と gpt-oss-20b)へのアクセスが大幅に簡素化されました。これまで必要だったモデルアクセスの明示的な有効化作業が不要となり、すべての Bedrock ユーザーが自動的にこれらのモデルを利用できるようになりました。ユーザーは Amazon Bedrock Console のプレイグラウンドや AWS SDK のAPI を通じて、すぐにモデルの使用を開始できます。今後、Bedrock では他の既存サーバーレスモデルにもこの簡素化されたアクセス方式を拡張し、新しいサーバーレス基盤モデルはすべてデフォルトでアクセス可能な状態でリリースされる予定です。アカウント管理者は引き続き IAM ポリシーや Service Control Policies を通じてモデルアクセスを制御できるため、セキュリティを保ちながら開発者の利便性を大幅に向上させるアップデートです。
  • Amazon CloudWatch の自然言語クエリ結果要約とクエリ生成機能が対応リージョンを拡大
    Amazon CloudWatch Logs Insightsの自然言語クエリ結果要約機能が、東京リージョンを含むアジアパシフィック、ヨーロッパ、南米など15の新しいAWSリージョンで利用可能になりました。この機能により、複雑なログクエリの結果を自然言語で分かりやすく要約し、迅速な問題特定と洞察の獲得が可能になります。さらに、自然言語によるクエリ生成機能も6つの新しいリージョンで展開され、PPLとSQLのクエリ生成は3つのリージョンで新たに利用可能になりました。これらの機能強化により、クエリ言語の専門知識がなくても、平易な英語で簡単にログ分析が行えるようになり、運用効率の大幅な向上が期待できます。
  • AWS Neuron SDK 2.25.0 が一般提供開始
    AWS Neuron SDK 2.25.0が一般提供を開始し、AWS InferentiaとTrainium インスタンスにおける推論ワークロードとパフォーマンス監視機能が改善されました。この最新リリースでは、コンテキストとデータ並列処理のサポートに加え、長いシーケンス処理に対応したチャンクアテンション機能が追加され、より効率的な推論処理が可能になります。また、neuron-ls と neuron-monitor API もアップデートされ、ノードアフィニティとデバイス使用率に関するより詳細な情報が取得できるようになりました。さらに、高速テンソル操作のための自動エイリアシング機能(ベータ版)や分散サービング機能(ベータ版)の改善も含まれており、推論・トレーニング用の AMI と Deep Learning Containers もアップグレードされています。これらの機能強化により、AWS の AI/ML 専用チップを使用した高性能かつコスト効率の良い機械学習ワークロードの実行がより容易になり、特に大規模言語モデルの推論処理において大きな価値を提供します。
  • Amazon Bedrock で Anthropic Claude モデル向けの Count Tokens API が利用可能に
    Amazon Bedrock において、推論実行前にプロンプトや入力データのトークン数を事前に確認できる Count Tokens API が利用可能になりました。この機能により、特定のモデル ID に送信する前にトークン数を把握できるため、より正確なコスト予測が可能になり、AI モデル使用に関する透明性と制御性が大幅に向上します。Amazon Bedrock でのトークン制限を事前に管理できるようになるため、使用量の最適化と予期しないスロットリングの回避が実現され、ワークロードがモデルのコンテキスト長制限内に収まることを事前に確認できます。特に大規模な生成 AI アプリケーションを運用する企業にとって、コスト管理とパフォーマンス最適化の両面で価値のある機能追加です。
  • Amazon SageMaker Unified Studio でプロジェクトにS3ファイル共有オプションを追加
    Amazon SageMaker Unified Studio で、プロジェクト内のファイル保存と共有方法が大幅に簡素化されました。従来の Git リポジトリ(GitHub、GitLab、Bitbucket Cloud)に加えて、Amazon S3 バケットを使用したファイル共有オプションが新たに追加され、S3 がデフォルトオプションとして設定されています。この機能により、データサイエンティストや分析担当者は Git の複雑な操作を覚える必要がなく、JupyterLab、Code Editor、SQL クエリエディタなど SageMaker Unified Studio 内のどのツールからでも一貫したファイルビューでコードの作成・編集・共有が可能になります。また、管理者が有効にした場合は基本的なバージョン管理もサポートします。
  • AWS Billing and Cost Management MCP server の発表
    Model Context Protocol(MCP)に対応した Billing and Cost Management MCP server が AWS Labs GitHub リポジトリでリリースされました。このMCPサーバーにより、ユーザーは任意のAIアシスタントを使用して、過去の支出分析、コスト最適化の機会の特定、新規ワークロードのコスト見積もりなどが可能になります。Amazon Q Developer以外のMCP互換のAIアシスタントでも、AWS料金データへのアクセスや分析が可能になり、専用のSQL計算エンジンを通じて信頼性の高い計算処理を実行できます。これにより、期間比較や単位コストメトリクスなどの分析が容易になり、大量のコストと使用量データを効率的に処理できるようになりました。

今週は以上です。それでは、また来週お会いしましょう!

著者について

Aiichiro Noma

野間 愛一郎 (Aiichiro Noma)

AWS Japan のソリューションアーキテクトとして、製造業のお客様を中心に日々クラウド活用の技術支援を行なっています。データベースやデータ分析など、データを扱う領域が好きです。最近、麻辣醤にハマっています。