メインコンテンツに移動

AWS Clean Rooms

なぜ AWS Clean Rooms を使うのですか?

AWS Clean Rooms を使用すると、お客様とお客様のパートナーが、集合的データセットの分析とコラボレーションを簡単に行い、元になるデータを互いに公開することなくインサイトを入手できます。AWS Clean Rooms を使えば、ご自身のクリーンルームを数分で作成し、データセット集合の分析をわずかなステップで開始することができます。AWS Clean Rooms では、コラボレーションしたい AWS のお客様を招待し、データセットを選択し、関連するレコードを照合し、参加者の制限を設定することができます。

わずかなステップで、独自のクリーンルームを作成し、参加者を追加して、コラボレーションを開始

AWS Clean Rooms は、独自のソリューションを構築、管理、メンテナンスすることなく、独自のクリーンルームをより迅速かつ簡単にデプロイするのに役立ちます。企業は API を使用して AWS Clean Rooms の機能をワークフローに統合することもできます。
A businesswoman wearing glasses and earbuds is smiling while working on a computer in a modern office setting with natural light.

基礎となるデータを共有したり公開したりすることなく、あらゆる企業とコラボレーションすることが可能

AWS Clean Rooms では、未加工データを移動したり共有したりすることなく、複数の関係者のデータからすばやく簡単にインサイトを生成できます。お客様は AWS のデータを直接許可し、抽出、変換、ロードなしに ( ゼロ ETL で) Snowflake と AWS に保存されているパートナーのデータセットとのコラボレーションを開始できます。
A close-up image of multiple hands coming together in a fist bump, symbolizing teamwork, collaboration, and unity during a creative agency business meeting.

クリーンルームのプライバシーを強化するさまざまな制御により、基礎となるデータを保護します

AWS Clean Rooms は、きめ細かな分析ルール、AWS Clean Rooms Differential Privacy、暗号コンピューティングなど、プライバシーを強化する一連のさまざまな機能を通じて、厳格なデータ処理ポリシーをサポートします。また、分析ログを使用して、データの使用方法を理解および監査することもできます。
Close-up of hands typing on a laptop keyboard with digital graphics overlay showing a login screen and a security shield icon, representing secure user authentication and data protection.

顧客レコードのリンクと照合、柔軟な分析ツールの使用、パートナーとの ML モデルのトレーニングとデプロイが可能

AWS Clean Rooms を利用すると、あらゆるアプリケーション、チャネル、またはデータストアの顧客レコードを照合してリンクできます。PySpark、SQL を使用するか、パートナーとともに、独自の ML モデルを持ち込んでデプロイすることで、カスタムモデルや生データをパートナーと共有することなく、インサイトを得ることができます。
Missing alt text value

ページトピック

マルチパーティー

すべて開く

AWS Clean Rooms では、1 回のコラボレーションで複数の他の参加者とデータを分析できます。各コラボレーションメンバーは、自分のアカウントにデータを維持します。コードを記述しなくても、自分やパートナーの集合データから安全にインサイトを生成できます。クリーンルームを作成したり、コラボレーションしたい企業を招待したりできます。またコラボレーションの中で SQL 分析を実行したり、AWS Clean Rooms ML を使用して予測インサイトを生成したりできる参加者を選択することもできます。

データが存在する場所でのコラボレーション

すべて開く

AWS Clean Rooms を使用すると、未加工データを移動または共有しなくても、複数の参加者のデータを簡単にコラボレーションできます。AWS のデータを直接許可し、抽出、変換、ロード (ゼロ ETL) なしに Snowflake と AWS に保存されているパートナーのデータセットとのコラボレーションを開始できます。レコードの照合、クエリの実行、機械学習モデルのトレーニング、予測インサイトの生成を行うと、AWS Clean Rooms はそのデータが存在する場所からデータを読み取ります。AWS Clean Rooms で AWS Entity Resolution を利用する場合、複数の共同作業識別子をマップするデータセットの設定に利用された基盤となるデータが、共同作業者間で共有または公開されることはありません。SQL クエリ分析を使用すると、データに対して許可されるルールと SQL クエリ制限を指定できます。これらのルールは、各参加者の基盤となるデータを保護するために自動的に適用されます。例えば、最小集計しきい値のような出力の制限を設定することも可能です。AWS Clean Rooms ML を利用する場合、モデルのトレーニングや類似セグメントの生成に利用された基盤となるデータが共同作業者間で共有または公開されたり、モデルをトレーニングするために AWS によって利用されたりすることはありません。

完全にプログラム化されたアクセス

すべて開く

AWS Clean Rooms の機能には AWS マネジメントコンソールからアクセスできるほか、API を使ってアクセスできます。AWS SDK またはコマンドラインインターフェイス (CLI) を使用して、AWS Clean Rooms の操作の自動化、既存のワークフローや製品への Clean Rooms 機能の統合、あるいは、お客様向けに自社版のクリーンルームの作成などができます。

設定可能なロール

すべて開く

AWS Clean Rooms コラボレーションを設定する場合、特定の SQL クエリのユースケースに合わせて、コラボレーションメンバーごとに何が行えるかを指定できます。例えば、クエリ出力を別のメンバーに送る場合は、あるメンバーをクエリを記述できる SQL クエリ実行者として指定し、別のメンバーを結果を受け取ることができる SQL クエリ結果レシーバーとして指定できます。これにより、コラボレーションの作成者は、クエリを実行できるメンバーがクエリ結果にアクセスできないようにすることができます。コラボレーションを設定すると、SQL クエリの支払い責任を設定して、自動的にクエリ実行者に請求する代わりに、選択したメンバーがコラボレーション内のクエリ計算コストを負担するように割り当てることもできます。これにより、クエリ実行者に任せる代わりに、パートナーと協力して SQL の責任を指定する柔軟性が高まります。

AWS Clean Rooms での AWS Entity Resolution

すべて開く

AWS Clean Rooms の AWS Entity Resolution を利用すると、プライバシーが強化された AWS Clean Rooms コラボレーションの中で、共同作業者と関連する顧客記録をより簡単に作成して照合できます。ルールベースまたはデータサービスプロバイダーベースの照合方法を使用すると、広告キャンペーンの計画、ターゲティング、測定などのユースケースにおけるデータ照合を改善できます。設定可能な照合ロジックや、LiveRamp などの信頼できるデータサービスプロバイダーのデータセットと ID を使用して、デバイス、プラットフォーム、チャネル間でレコードを接続できます。

PySpark

すべて開く

AWS Clean Rooms で PySpark を使用すると、お客様とパートナーは、Apache Spark 用の Python API である PySpark を使用して、大規模なデータセットにわたって高度な分析を実行できます。例えば、広告測定プロバイダーは AWS Clean Rooms で PySpark を使用してカスタムアルゴリズムを複数のパブリッシャーデータセットで同時に実行し、広告効果を測定できます。同様に、製薬会社は、所有データを共有することなく、適切な患者の同意を得て、独自のアルゴリズムとライブラリを複数の医療提供者のデータセットにわたって実行し、臨床試験全体にわたる服薬アドヒアランスを評価できます。

フレキシブル SQL

すべて開く

分析ルールは、データの分析方法を制御するための制限です。指定されたクエリ実行者としてコラボレーションを作成または参加するコラボレーションメンバーは、設定した分析ルールに従ってデータテーブルを交差させて分析するクエリを記述できます。AWS Clean Rooms は、集計、リスト、カスタムの 3 種類の分析ルールをサポートします。

集計分析ルール: 集計分析ルールを使用すると、2 つのデータセットの共通部分の大きさなど、集計統計を生成するクエリを実行できます。集計分析ルールを使用すると、データに対して集計クエリのみを実行できるようにしたり、実行するクエリの特定の部分 (ブラインドマッチでのみ使用しなければならない列や、合計、カウント、平均などの集計で使用できる列など) に制限を適用することができます。また、出力の最小集計制約も制御します。  集計の最小制限を設定して、出力行の戻り値に条件を設定することもできます。この制限は、COUNT DISTINCT (列) >= しきい値、の形式を取ります。クエリ結果の出力行がいずれの制約も満たさない場合、その行は結果セットから削除されます。これを使えば、データコラボレーターに、任意のクエリを柔軟に記述することを可能にしながら、確実に最小集計しきい値を自動的に適用するのに役立ちます。

リスト分析ルール: リスト分析ルールを使用すると、2 つのデータセットの重複など、複数のデータセットの共通部分の行レベルのリストを抽出するクエリを実行できます。リスト分析ルールを使用すると、データに対してリストクエリのみを実行できるようにしたり、ブラインドマッチでのみ使用する必要がある列や、出力でリストとして出力できる列など、実行するクエリを制限したりできます。

カスタム分析ルール: カスタム分析ルールでは、共通テーブル式 (CTE) やウィンドウ関数など、ANSI 標準 SQL のほとんどを使用してカスタムクエリを作成できます。また、コラボレーションパートナーが実行する前にクエリを確認して許可したり、他のコラボレーターのクエリを自身のテーブルで実行する前に確認したりすることもできます。カスタム分析ルールを使用すると、分析が完了した後にクエリログに頼る必要がなくなり、組み込みコントロールを使用して基になるデータを分析する方法を事前に決定または制限できます。カスタム SQL クエリを使用する場合、分析テンプレートを作成または使用して、コラボレーション内のパラメーターを含むカスタムクエリを保存することもできます。これにより、顧客はコラボレーションにおいてより簡単に互いに助け合うことができます。例えば、SQL の経験が豊富なメンバーは、他のメンバーが確認して実行できるようにテンプレートを作成できます。また、コラボレーションでの再利用可能な分析も容易になります。カスタム分析ルールを選択し、差分プライバシーパラメータを設定することで、AWS Clean Rooms Differential Privacy を使用することもできます。

AWS Clean Rooms Differential Privacy は、数学的に裏付けられた直感的なコントロールをわずか数ステップで実装できるため、ユーザーのプライバシーを保護するのに役立ちます。差分プライバシーとは、データプライバシー保護の厳密な数学的定義です。しかし、この手法の設定は複雑であるため、効果的に適用するには理論と数学的に厳密な式を深く理解する必要があります。AWS Clean Rooms Differential Privacy は、AWS Clean Rooms の直感的なフルマネージド機能で、ユーザーの再識別を防ぐのに役立ちます。この機能を使用するにあたり、差分プライバシーに関する経験がなくても使用できます。AWS Clean Rooms Differential Privacy は、AWS Clean Rooms のコラボレーションの集計出力から個人のデータがどのように寄与しているのかをわかりにくくします。また、幅広い SQL クエリを実行して、広告キャンペーン、投資についての意思決定、臨床研究などに関するインサイトを引き出すのに役立ちます。AWS Clean Rooms コラボレーションでカスタム分析ルールを適用することで、AWS Clean Rooms Differential Privacy を設定できます。そうすれば、特定のビジネスユースケースに柔軟に対応し、ほんの数ステップで適用できるコントロールで AWS Clean Rooms Differential Privacy を設定できます。AWS Clean Rooms Differential Privacy を利用すると、いくつかの簡単な選択を行うだけで、AWS Clean Rooms コラボレーションで差分プライバシーを簡単に有効にできます。その他の専門知識やパートナーのセットアップは一切必要ありません。

Analysis Builder を使用すると、ビジネスユーザーは SQL の記述したり理解しなくても、いくつかの簡単な手順のみでインサイトを得ることができます。ガイド付きユーザーインターフェースの手順に従って、集合データセットに関連する指標、セグメント、フィルターなどの自動提案基準に基づいて、各コラボレーターがテーブルに設定したデータ制限に準拠したクエリを作成できます。Analysis Builder は、集計ルールまたはリスト分析ルールのいずれかで構成された 1 つまたは 2 つのテーブルを持つコラボレーションで使用します。

AWS Clean Rooms のクエリは、暗号で保護されたデータに実行することができます。機密データの暗号化を要求するデータ処理方針が社内で施行されている場合、クエリの実行中でもデータが暗号化されるように、コラボレーション固有の、共有暗号化キーを使うことでデータを事前に暗号化することができます。暗号コンピューティングは、コラボレーションの計算に使用されたデータを、保管中、転送中、使用中 (処理中) も暗号化された状態に保ちます。

Cryptographic Computing for Clean Rooms (C3R) は、オープンソースの Java SDK と CLI のことで、GitHub で公開されています。この機能は追加料金なしでご利用いただけます。ビッグデータをお持ちの場合は、ドキュメントを見ると、C3R を Apache Spark に統合する方法を確認できます。

この機能は、AWS が提供する柔軟性、スケーラビリティ、パフォーマンス、使いやすさを活用しながら、お客様のセキュリティやコンプライアンスのニーズを満たすために構築された、幅広い AWS 暗号コンピューティングツールの最新版です。

プライバシーを強化する ML

すべて開く

AWS Clean Rooms ML により、お客様とパートナーがプライバシー強化機械学習 (ML) を適用して、互いに未加工データを共有せずに予測的なインサイトを生成できるようになります。AWS Clean Rooms ML は、カスタムおよびルックアライクの機械学習 (ML) モデリングをサポートしています。カスタムモデリングを使用すると、基礎となるデータや知的財産を共同作業者間で共有することなく、トレーニング用のカスタムモデルを持ち込み、集合データセットに対して推論を実行できます。ルックアライクモデリングでは、AWS が作成したモデルを使用して、パートナーがコラボレーションに持ち込む少量のプロファイルサンプルに基づいて、類似のプロファイルの拡張セットを生成できます。

AWS Clean Rooms ML は、複数のユースケースでお客様をサポートします。例えば、広告主は独自のモデルとデータを Clean Rooms のコラボレーションに持ち込み、パブリッシャーに自社のデータを組み合わせて、キャンペーンの効果を高めるカスタム ML モデルのトレーニングとデプロイを依頼します。金融機関は、過去の取引記録を使用してカスタム ML モデルをトレーニングしたり、不正の可能性のある取引を検出するために Clean Rooms のコラボレーションにパートナーを招待したりできます。研究機関や病院ネットワークは、臨床試験を加速させるために、既存の臨床試験参加者に似た候補者を見つけることができます。ブランドとパブリッシャーは、市場内の顧客の類似セグメントをモデル化し、関連性の高い広告エクスペリエンスを提供することができ、どちらの企業も基盤となるデータを他方と共有する必要はありません。

AWS が作成したモデルを使用する AWS Clean Rooms ML のルックアライクモデリングは、e コマースやストリーミング動画などのさまざまなデータセットで構築され、テストされており、類似モデリングの精度を、代表的な業界ベースラインと比較して最大 36% 向上させることができます。新規顧客のプロスペクティング活動などの実際の適用場面では、この精度の改善は、数百万 USD のコスト削減につながります。

AWS Clean Rooms では、お客様とパートナーが集合データから合成データセットを生成して、リグレッションおよび分類用の機械学習 (ML) モデルをトレーニングできます。AWS Clean Rooms ML はプライバシーを強化するコントロールを適用して、予測インサイトを生成しながら所有データと機械学習モデルを保護します。プライバシーを強化するコントロールとして、合成データセットの生成により、お客様とパートナーは元のデータセットと同様の統計的特性を持つトレーニングデータセットを作成できます。これにより、以前はデータプライバシーの問題によって制限されていた集合データセットの新しい機械学習モデルトレーニングのユースケースの扉が開きます。

AWS Clean Rooms ML でのカスタム機械学習のためのプライバシーを強化する合成データセットの生成は、元のデータ内の主題 (データが収集された個人や団体など) を匿名化することで行います。これにより、モデルがデータセット内の個人に関する情報を記憶するリスクを軽減します。合成データセットの生成プロセスは、希望するリグレッションアルゴリズムおよび分類アルゴリズムと互換性のあるデータセットを作成するように最適化されています。