Amazon Bedrock Guardrails が日本語に対応しました

日本時間 2025/6/25 に、Amazon Bedrock Guardrails が日本語に対応しました。この日付はくしくもAWS Summit Japan 2025 の開幕初日になり日本にとってはうれしいニュースとなりました。本記事では、日本語対応の詳細について執筆時点での内容と利用方法を解説します。

Amazon Bedrock Guardrails のアップデート概要

今回のアップデートで、コンテンツフィルターと拒否トピックについて Standard Tier を選択することで日本語を含む 60 以上の言語をカバーできるようになり、誤字等の表記ゆれにも頑健な検出ができるようになりました。コンテンツフィルターには、モデルのシステムプロンプトを抜き出すような Prompt Attack の検知も含みます。これまでのモデルは Classic Tier という扱いになりました。なお、Standard Tier であってもワードフィルタとグラウンディングチェックはまだ日本語に対応していません。

詳細 : Amazon Bedrock Guardrails announces tiers for content filters and denied topics
対応言語 : Languages supported by Amazon Bedrock Guardrails

Classic Tier と Standard Tier の違いを次の表にまとめています。Classic Tier を使う場合として「英語、フランス語、スペイン語が対象」また「Standard にマイグレーションするために時間が必要な場合」とあるため、理由がなければ Standard Tier の利用を推奨します。

	Standard Tier	Classic Tier
コンテンツフィルター / Prompt Attack	Classic Tier のパフォーマンスに加え表記ゆれ等に対する頑健性	確立されたパフォーマンス
拒否トピックの文字数制限	最大 1,000 文字	最大 200 文字
言語サポート	60 の幅広い言語	英語、フランス語、スペイン語
クロスリージョン推論	必須	不可

詳細 : Safeguard tiers for guardrails policies
※ Standard Tier はより “robust” と表記されており、News Release には typographical errors に関する記述があることから表記ゆれに強いと記載しています

注意点として、Standard Tier ではクロスリージョン推論が必須となります。クロスリージョン先は Guardrails のリージョンにより決まっており、例えば東京で Guardrails を使う場合は APAC Guardrail v1:0 のプロファイルを使うことになり APAC 圏内で推論が分散されます。国内に閉じる要件がある場合この点にご留意ください。

詳細 : Supported Regions for cross-Region guardrail inference

Amazon Bedrock Guardrails の価格

本記事執筆時点ではコンテンツフィルタの価格が $0.15 / 1,000 text units となります。”text unit” はモデルの価格に使用されるトークンではなく文字数の単位で、1 text unit は最大 1,000 文字を含むチャンクになります。この「文字」は Unicode 文字で、2 byte の日本語であっても文字は 1 文字になります。1 text unit = 最大 1,000 文字ですから、コンテンツフィルタの価格は $0.15 / 1,000,000 文字となります。

なお、記事執筆時点で Classic と Standard で料金に差異はありませんが、最新の価格は Pricing のページをご確認ください。

Amazon Bedrock Guardrails の利用方法

実際に Standard Tier を利用した Guardrails の利用方法を解説します。作成方法と動作確認の 2 つに分けて紹介します。

Amazon Bedrock Guardrails の作成

AWS マネジメントコンソールで Amazon Bedrock のメニューにアクセスします。

Amazon Bedrock のメニューの中から Guardrails を選択します。

Guardrails を作成します。

Guardrails 作成時には、クロスリージョン推論にチェックを入れてください。クロスリージョン先は、”Choose guardrail profile” で選択しているプロファイルに依存します。先ほど記載した通り、これはリージョンごと固定されています (画像は us-east-1 で作成しているので US Guardrails v1:0 になっています)。東京で作成すると APAC Guardrail v1:0 になり APAC で分散されます。

コンテンツフィルターや拒否トピックを作成していきます。フィルターごとに Classic Tier か Standard Tier を選択できます。Standard Tier を選択する際、Cross Region にチェックを入れていないとエラーになります。なお、コンソール上の記載が “over 50 language” となり News Release の 60 言語と値がずれていますが、執筆時点で Supported Language の数を数えると “59” であり数としては同等です。

こちらは拒否トピックの例です。

すべての設定を終えたら作成します。

Amazon Bedrock Guardrails の動作確認

AWS マネジメントコンソール上で動作を確認することが出来ます。今回は、ゲームキャラクターを模したプロンプトで検出がされるか検証しました。

日本語の入力であってもコンテンツフィルターによりブロックされていることを確認できました。Trace を見ると、Violence が理由に挙げられていることがわかります。

日本語による Prompt Attack でもコンテンツフィルタにより検知されることが確認できます。

拒否トピックも日本語で記載した拒否内容を基にブロックができることが確認できます。

Amazon Bedrock Guardrails の速度

Guardrails はモデルを呼ぶごとに呼び出されるため、推論のパフォーマンスは大きな考慮事項です。Amazon Bedrock のコンソールではモデルのパフォーマンスを比較でき、比較する際に Guardrails が設定できます。以下は、左が何も設定していない Claude 3.5 Haiku 、右が Guardrails を設定した状態です。比較すると、Guardrails で拒否された右側の推論時間はわずか 531 ms であり、Haiku の推論時間の 1/73,000 と非常に高速です。実際に導入する際はユースケースに合わせた十分な回数の検証が必要ですが、Guardrails の導入によるレイテンシへの影響は軽微になることが期待できます。

おわりに

本記事では、日本語対応した Amazon Bedrock Guardrails の概要と価格、使い方をお伝えしました。生成 AI の返答に誤りや有害な内容が含まれていたためにサービス停止につながった事例が 2024 年時点でも複数観測されています。サービス停止は開発の停滞だけでなく会社の評判にも悪影響を与えるインシデントです。Guardrails の適用によりリスクを抑え持続的な生成 AI 活用につなげて頂ければ幸いです。

Amazon Web Services ブログ