Amazon Bedrock ガードレールがコンテンツフィルターと拒否トピックのティアを発表

投稿日: 2025年6月24日

Amazon Bedrock ガードレールは、コンテンツフィルターと拒否トピックのティアを発表しました。これにより、ユースケースに応じて、より柔軟かつ容易に機能を選択したり、言語サポートを拡張したりできます。新しいスタンダードティアにより、ガードレールはコンテキストをより適切に理解し、タイプミスなどの修正を含め、不適切なコンテンツを検出およびフィルタリングできるようになりました。また最大 60 の言語をサポートするようになりました。

Bedrock ガードレールは、ユーザーが設定可能な保護手段を提供し、有害なコンテンツやプロンプト攻撃の検出およびブロックを支援します。また、拒否するトピックを定義したり、特定のトピックを禁止し、入力プロンプトやモデルの応答から、個人データなどの個人を特定できる情報 (PII) を編集するのに役立ちます。さらに、Bedrock ガードレールは、モデルのハルシネーションを検出してブロックし、自動推論チェックを使用してモデル応答の事実に基づく主張を識別、修正、説明するのに役立ちます。ガードレールは、Amazon Bedrock でホストされているモデル、セルフホストモデル、ApplyGuardrail API を使用する Bedrock の外部のサードパーティーモデルなど、あらゆる基盤モデルに適用できるため、ユーザーエクスペリエンスを一貫させて、安全とプライバシーの管理を標準化できます。

新しいスタンダードティアでは、プロンプトと応答のバリエーションに対する検出を強化し、プロンプト攻撃を含むあらゆるカテゴリのコンテンツフィルターに対する防御を強化し、言語サポートを拡張することにより、Bedrock ガードレール内のコンテンツフィルターと拒否トピックの保護機能を強化しています。改良されたプロンプト攻撃フィルターは、バックエンドでジェイルブレイクとプロンプトインジェクションを明確に区別する一方で、出力操作を含むその他の脅威から保護します。スタンダードティアの機能を利用するには、お客様は Bedrock ガードレールによるクロスリージョン推論を使用開始することを明示的に選択する必要があります。

詳細については、技術文書Bedrock ガードレールの製品ページを参照してください。