AWS Clean Rooms

AWS Clean Rooms – Preisübersicht

Mit AWS Clean Rooms können Sie und Ihre Partner gemeinsam genutzte Daten analysieren, datenschutzoptimiertes Machine Learning (ML) nutzen und Entitäten mittels AWS Entity Resolution auf AWS Clean Rooms auflösen und so auf Ihre geschäftlichen Anforderungen optimieren. Beim Analysieren von gemeinsam mit Partnern genutzten Daten in AWS Clean Rooms zahlen Sie oder ein benannter Partner für die Verarbeitung der Abfragen über PySpark oder SQL, die im Rahmen einer Zusammenarbeit auf einer Clean Rooms Processing Unit (CRPU) ausgeführt werden, auf Stundenbasis. Weitere Informationen über CRPU-Stunden erfahren Sie weiter unten. Wenn Sie AWS Clean Rooms ML Custom Modeling verwenden, zahlen Sie auf Basis eines Preises pro Million Einträge, die für Training, Inferenz oder beides verwendet werden, für die Nutzung des von Ihnen gewählten Datenverarbeitungs-Instance-Typs und für die Datenverarbeitungskapazität der Spark SQL-Abfragen, die ausgeführt werden, um die Eingabedaten aus Training und Inferenz in einer Zusammenarbeit zu erstellen. Wenn Sie die Lookalike-Modellierung von AWS Clean Rooms ML verwenden, zahlen Sie nur für die von Ihnen angeforderten Modelltrainings und für die erstellten Lookalike-Segmente auf der Basis des Preises pro 1 000 Profile. Wenn Sie AWS Entity Resolution in AWS Clean Rooms verwenden, zahlen Sie zu einem Preis pro 1 000 Einträge.

Hinweis: Die Preise können je nach AWS-Region variieren, je nachdem, welche Funktionen Sie nutzen. Das kostenlose AWS-Kontingent ist für PySpark in AWS Clean Rooms, AWS Clean Rooms ML oder AWS Entity Resolution nicht verfügbar.

AWS Clean Rooms ist in den folgenden AWS-Regionen verfügbar: USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland), Europa (London) und Europa (Stockholm).

Kostenloses AWS-Kontingent

Das kostenlose Paket ist für das kostenlose Kontingent von AWS Clean Rooms nicht verfügbar. Neue AWS-Kunden können kostenlos loslegen und Guthaben nur mit dem AWS Clean Paid Plan nutzen. 

  • PySpark – Preise
  • PySpark in AWS Clean Rooms läuft in der Spark-SQL-Analytik-Engine in einer Clean-Rooms-Zusammenarbeit. Sie können sich auch dafür entscheiden, Abfragen im Spark-SQL- oder SQL-Dialekt auszuführen. Weitere Informationen finden Sie unter Preise für Spark SQL oder SQL. PySpark in AWS Clean Rooms misst die Datenverarbeitungskapazität in Stunden der Clean Rooms Processing Unit (CRPU) pro Sekunde (mit einer Mindestgebühr von 10 Minuten). 

    PySpark in AWS Clean Rooms berechnet einen Stundensatz basierend auf der Anzahl der CRPUs, die für die Ausführung Ihres PySpark-Jobs verbraucht werden. Sie bezahlen für die Nutzung der Datenverarbeitungsleistung zu einem Preis pro CRPU-Stunde und können aus verschiedenen Instances wählen, um Ihre Abfragen auszuführen. Sie können die Konfiguration der Datenverarbeitungs-Engine für die Ausführung Ihres PySpark-Jobs entsprechend Ihren Anforderungen hinsichtlich Leistung, Skalierbarkeit und Kosten auswählen. Standardmäßig weist AWS Clean Rooms jedem PySpark-Job 32 CRPUs zu, und Sie können optional Workload-Größen von bis zu 256 CRPUs oder nur 8 CRPUs konfigurieren. Standardmäßig weist AWS Clean Rooms jedem PySpark-Job 32 CRPUs zu. Es gibt keine Ressourcen zu verwalten, und Ihnen werden keine Kosten für Start- oder Stillstandszeiten berechnet. Wenn Sie PySpark verwenden, können die Zahlungsverpflichtungen entweder für das Mitglied der Zusammenarbeit, das den PySpark-Job ausführt, oder für jedes der Mitglieder, die an einer Zusammenarbeit teilnehmen, konfiguriert werden. Dem für die Zahlung verantwortlichen Mitglied werden alle PySpark-Jobs in der Zusammenarbeit in Rechnung gestellt.

    Sie können den Instance-Typ und die Anzahl der Instances (Worker) wählen, um Ihre PySpark-Jobs auszuführen. Für CR.1X können Sie bis zu 128 Worker oder mindestens 4 Worker auswählen. Für CR.4X können Sie bis zu 32 Worker oder mindestens 4 Worker auswählen. Beispiel:

     

    Instance-Typ Instances CRPU-Stunde insgesamt
    CR.1X
    4 8
    CR.1X (Standard) 16 (Standard) 32 (Standard)
    CR.1X 128 256
    CR.4X 4 32
    CR.4X 32 256

    PySpark-Preisdimension

    PySpark-Datenverarbeitung: Sie zahlen für die Dauer, die Ihre PySpark-Jobs benötigen, zu einem Preis pro CPU-Stunde (der je nach AWS-Region variiert), der auf Ihrer monatlichen Nutzung basiert. PySpark in AWS Clean Rooms misst die Datenverarbeitungskapazität in Stunden der Clean Rooms Processing Unit (CRPU) pro Sekunde (mit einer Mindestgebühr von 10 Minuten).  PySpark in AWS Clean Rooms variiert je nach AWS-Region. 


    Preisbeispiele für benutzerdefinierte Analyseregeln in PySpark

    Beispiel 1 – PySpark-Job (Kampagnenmessung)

    Sie möchten PySpark verwenden, um benutzerdefinierte Analysen für konfigurierte Tabellen aus dem Datensatz eines Werbetreibenden durchzuführen, um die Kampagnenleistung zu messen. Ihr PySpark-Job läuft 3 Minuten und muss einmal pro Monat in einer Zusammenarbeit mit AWS Clean Rooms in USA Ost (Nord-Virginia) verarbeitet werden. Sie möchten PySpark in der AWS-Clean-Rooms-Datenverarbeitungskonfiguration mit CR.1X und 16 Instances verwenden, die eine Gesamtkapazität von 32 CRPUs zur Ausführung des Jobs verwendet. Für jeden PySpark-Job in AWS Clean Rooms fällt eine Mindestgebühr von 10 Minuten* an.

    Die folgende Tabelle fasst die Gesamtnutzung für diesen Monat zusammen.

    Zeitraum der Abfrageausführung Der Job wurde einmal pro Monat ausgeführt und dauerte 3 Minuten (mindestens 10 Minuten*) = 600 Sekunden/3 600 = 0,167 Stunden
    Monatlich genutzte Kapazität 5,3 CRPUs = (0,167 Stunden * 32 CRPUs mit CR.1X und 16 Instances)
    Monatliche Gebühren 21,33 USD = (5,3 CRPUs * 4,00 USD pro CRPU-Stunde)

    *PySpark in AWS Clean Rooms misst die Datenverarbeitungskapazität in Stunden der Clean Rooms Processing Unit (CRPU) pro Sekunde (mit einer Mindestgebühr von 10 Minuten). Für jeden PySpark-Job in AWS Clean Rooms fallen mindestens 0,167 Stunden = 10 Minuten = 600 Sekunden/3 600 Sekunden an.

    Beispiel 2 – PySpark-Job (Betrugserkennung)

    Sie möchten PySpark verwenden, um benutzerdefinierte Analysen für konfigurierte Tabellen eines Finanzinstituts durchzuführen, um betrügerische Transaktionen zu identifizieren. Ihr PySpark-Job läuft 5 Minuten und muss einmal pro Tag in einer Zusammenarbeit mit AWS Clean Rooms in USA Ost (Nord-Virginia) verarbeitet werden. Sie möchten PySpark in der AWS-Clean-Rooms-Datenverarbeitungskonfiguration mit CR.4X und 4 Instances verwenden, die eine Gesamtkapazität von 32 CRPUs zur Ausführung des Jobs verwendet. Für jeden PySpark-Job in AWS Clean Rooms fällt eine Mindestgebühr von 10 Minuten* an.

    Die folgende Tabelle fasst die Gesamtnutzung für diesen Monat zusammen.

    Zeitraum der Abfrageausführung Der Job wurde einmal pro Tag ausgeführt und dauerte 5 Minuten (mindestens 10 Minuten*) = 600 Sekunden/3 600 = 0,167 Stunden
    Täglich genutzte Kapazität 5,3 CRPUs = (0,167 Stunden * 32 CRPUs mit CR.4X und 4 Instances)
    Tägliche Gebühren 21,33 USD = (5,3 CRPUs * 4,00 USD pro CRPU-Stunde)
    Monatliche Gebühren 640 USD = (21,33 USD * 30)

    *PySpark in AWS Clean Rooms misst die Datenverarbeitungskapazität in Stunden der Clean Rooms Processing Unit (CRPU) pro Sekunde (mit einer Mindestgebühr von 10 Minuten). Für jeden PySpark-Job in AWS Clean Rooms fallen mindestens 0,167 Stunden = 10 Minuten = 600 Sekunden/3 600 Sekunden an.

    Beispiel 3 – PySpark-Job (klinische Studien)

    Sie möchten PySpark verwenden, um die Arzneimitteladhärenz in klinischen Studien anhand mehrerer Datensätze von Gesundheitsdienstleistern mit entsprechender Einwilligung des Patienten zu bewerten. Sie verwenden PySpark, um benutzerdefinierte Analysen für konfigurierte Tabellen mehrerer Zusammenarbeitsmitglieder in einer Zusammenarbeit von AWS Clean Rooms durchzuführen. Ihr PySpark-Job läuft 12 Minuten und muss zweimal täglich in einer Zusammenarbeit mit AWS Clean Rooms in der Region USA Ost (Nord-Virginia) verarbeitet werden. Sie möchten PySpark in der AWS-Clean-Rooms-Datenverarbeitungskonfiguration mit CR.1X und 12 Instances verwenden, die eine Gesamtkapazität von 24 CRPUs zur Ausführung des Jobs verwendet.

    Die folgende Tabelle fasst die Gesamtnutzung für diesen Monat zusammen.

    Zeitraum der Abfrageausführung Der Job wurde zweimal täglich ausgeführt und dauerte jeweils 12 Minuten = 24 Minuten = 1 440 Sekunden/3 600 = 0,40 Stunden
    Täglich genutzte Kapazität 9,6 CRPUs = (0,40 Stunden * 24 CRPUs mit CR.1X und 12 Instances)
    Tägliche Gebühren 38,40 USD = (9,6 CRPUs * 4,00 USD pro CRPU-Stunde)
    Monatliche Gebühren 1 152 USD = (38,40 USD * 30)

    Beispiel 4 – PySpark-Job (Zuordnung mehrerer Parteien)

    Sie möchten PySpark verwenden, um ein Zuordnungsmodell mehrerer Parteien für mehrere Publisher-Datensätze zur Messung von Marketingkanälen auszuführen. Sie verwenden PySpark, um benutzerdefinierte Analysen für konfigurierte Tabellen mehrerer Zusammenarbeitsmitglieder in einer Zusammenarbeit von AWS Clean Rooms durchzuführen. Ihr PySpark-Job läuft 10 Minuten und muss zweimal täglich in einer Zusammenarbeit mit AWS Clean Rooms in der Region USA Ost (Nord-Virginia) verarbeitet werden. Sie möchten PySpark in der AWS-Clean-Rooms-Datenverarbeitungskonfiguration mit CR.4X und 8 Instances verwenden, die eine Gesamtkapazität von 64 CRPUs zur Ausführung des Jobs verwendet.

    Die folgende Tabelle fasst die Gesamtnutzung für diesen Monat zusammen.

    Zeitraum der Abfrageausführung Der Job wurde zweimal täglich ausgeführt und dauerte jeweils 10 Minuten = 20 Minuten = 1 200 Sekunden/3 600 = 0,33 Stunden
    Täglich genutzte Kapazität 21,3 CRPUs = (0,33 Stunden * 64 CRPUs mit CR.4X und 8 Instances)
    Tägliche Gebühren 85,33 USD = (21,3 CRPUs * 4,00 USD pro CRPU-Stunde)
    Monatliche Gebühren 2 560 USD = (85,33 USD * 30)
  • SQL – Preise
  • Mit AWS Clean Rooms können Sie Abfragen mithilfe des Spark-SQL-Dialekts in Zusammenarbeiten von AWS Clean Rooms ausführen. AWS Clean Rooms Spark SQL bietet konfigurierbare Datenverarbeitungsgrößen, um bei der Ausführung von SQL-Workloads eine bessere Kontrolle über das Preis-Leistungs-Verhältnis zu ermöglichen.

    • Spark SQL – Preise
    • AWS Clean Rooms misst die Datenverarbeitungskapazität in Stunden der Clean Rooms Processing Unit (CRPU) pro Sekunde (mit einer Mindestgebühr von 60 Sekunden). Es sind keine Ressourcen zu verwalten und keine Vorabkosten zu tragen, und Ihnen werden keine Kosten für Start- oder Sillstandszeiten berechnet. Wenn Sie Spark-SQL-Abfragen in AWS Clean Rooms ausführen, können die Zahlungszuständigkeiten entweder für das Mitglied der Zusammenarbeit, das die Abfragen ausführt, oder für jedes der an einer Zusammenarbeit beteiligten Mitglieder konfiguriert werden. Dem für die Zahlung verantwortlichen Mitglied werden alle Abfragen im Rahmen der Zusammenarbeit in Rechnung gestellt.

      AWS Clean Rooms Spark SQL berechnet einen Stundensatz, der auf der Anzahl der CRPUs basiert, die für die Ausführung Ihrer Abfrage verwendet werden. Sie bezahlen für die Nutzung der Datenverarbeitungsleistung zu einem Preis pro CRPU-Stunde und können aus verschiedenen Instances wählen, um Ihre Abfragen auszuführen. Standardmäßig weist AWS Clean Rooms jeder Spark-SQL-Abfrage 32 CRPUs zu. 

      Sie können den Instance-Typ und die Anzahl der Instances (Worker) wählen, um Ihre Spark-SQL-Abfragen auszuführen. Für CR.1X können Sie bis zu 128 Worker oder mindestens 2 Worker auswählen. Für CR.4X können Sie bis zu 32 Worker oder mindestens 2 Worker auswählen. Beispiel:

      Instance-Typ Instances CRPU-Stunde insgesamt
      CR.1X
      2 4
      CR.1X (Standard) 16 (Standard) 32 (Standard)
      CR.1X 128 256
      CR.4X 8 64
      CR.4X 32 256

      Hinweis: Sie können eine Datenverarbeitungs-Engine-Konfiguration mit mehr Instances wählen, um mehr Ressourcen für Ihre Spark-SQL-Abfragen zuzuweisen. Eine höhere Datenverarbeitungs-Engine-Konfiguration verteilt den Workload auf mehr Instances, um Ihre Jobanforderungen und Einschränkungen zu erfüllen. Weitere Informationen über die zugehörige vCPU, den Arbeitsspeicher und den Speicher für jede Konfiguration finden Sie hier.

      Preisdimension für Spark-SQL-Regeln

      Datenverarbeitung mit Spark SQL: Sie zahlen für die Dauer, die Ihre Spark-SQL-Abfragen benötigen, zu einem Preis pro CRPU-Stunde. Die Preise für Datenverarbeitung mit AWS Clean Rooms Spark SQL variieren je nach AWS-Region.


      Preisbeispiele für Spark SQL

      Beispiel 1 – Spark-SQL-Abfrage (unter Verwendung des Standard-CR.1X mit 16 Instances)

      Sie möchten Spark-SQL-Abfragen verwenden, um Analysen für konfigurierte Tabellen mehrerer Zusammenarbeitsmitglieder durchzuführen. Ihre Spark-SQL-Abfrage wird 3 Minuten lang ausgeführt und muss dreimal täglich in einer Zusammenarbeit mit AWS Clean Rooms in der Region USA Ost (Nord-Virginia) verarbeitet werden. Sie möchten die standardmäßige Datenverarbeitungs-Engine-Konfiguration von AWS Clean Rooms Spark SQL mit CR.1X und 16 Instances verwenden, die eine Gesamtkapazität von 32 CRPUs pro Stunde für die Ausführung der Abfragen verwendet.

      Die folgende Tabelle fasst die Gesamtnutzung für den Tag und das Jahr zusammen.

      Zeitraum der Abfrageausführung Die Abfrage wurde dreimal täglich ausgeführt und dauerte jeweils 3 Minuten = 9 Minuten = 540 Sekunden/3 600 = 0,150 Stunden
      Genutzte Kapazität 4,8 CRPUs = (0,150 Stunden * 32 CRPU-Stunden mit CR.1X und 16 Instances)
      Tägliche Gebühren 9,60 USD = (4,8 CRPUs * 2,00 USD pro CRPU-Stunde)
      Jährliche Gebühren 3 504 USD = 9,60 USD * 365

      Beispiel 2 – Spark-SQL-Abfrage (mit CR.4X mit 8 Instances)

      Sie möchten Spark-SQL-Abfragen verwenden, um Analysen für konfigurierte Tabellen mehrerer Zusammenarbeitsmitglieder durchzuführen. Ihre Spark-SQL-Abfrage wird einmal täglich für 3 Minuten in einer Zusammenarbeit mit AWS Clean Rooms in der Region USA Ost (Nord-Virginia) ausgeführt. Sie wählen eine Datenverarbeitungs-Engine-Konfiguration von AWS Clean Rooms Spark mit CR.4X und 8 Instances, die eine Gesamtkapazität von 64 CRPUs pro Stunde für die Ausführung der Abfragen verwendet.

      Die folgende Tabelle fasst die Gesamtnutzung für den Tag und das Jahr zusammen.

      Zeitraum der Abfrageausführung Die Abfrage wurde einmal ausgeführt und dauerte 3 Minuten = 180 Sekunden/3 600 = 0,050 Stunden
      Genutzte Kapazität 3,2 CRPUs = (0,050 Stunden * 64 CRPU-Stunden mit CR.4X und 8 Instances)
      Tägliche Gebühren 6,40 USD = (3,2 CRPUs * 2,00 USD pro CRPU-Stunde)
      Jährliche Gebühren 2 336 USD = 6,40 USD * 365

      Beispiel 3 – Spark-SQL-Abfrage mit aktiviertem AWS Clean Rooms Differential Privacy

      Sie möchten Spark-SQL-Abfragen verwenden, um Analysen für konfigurierte Tabellen mehrerer Zusammenarbeitsmitglieder durchzuführen, und AWS Clean Rooms Differential Privacy als eine zusätzliche Schutzebene verwenden. Die Gesamtkosten pro CRPU-Stunde betragen 4,00 USD (2,00 USD pro CRPU-Stunde für Datenverarbeitung mit Spark SQL + 2,00 USD pro CRPU-Stunde für AWS Clean Rooms Differential Privacy). Die Anfrage muss einmal täglich in einer Zusammenarbeit mit AWS Clean Rooms in der Region USA Ost (Nord-Virginia) bearbeitet werden. Sie möchten die standardmäßige Datenverarbeitungs-Engine-Konfiguration von AWS Clean Rooms Spark SQL mit CR.1X und 16 Instances verwenden, die eine Gesamtkapazität von 32 CRPUs pro Stunde für die Ausführung der Abfragen verwendet. Ihre durchschnittliche Bearbeitungszeit für Abfragen beträgt 4,5 Minuten.

      Die folgende Tabelle fasst die Gesamtnutzung für den Tag und das Jahr zusammen.

      Zeitraum der Abfrageausführung Die Abfrage wurde einmal ausgeführt und dauerte 4.5 Minuten = 270 Sekunden/3 600 = 0,075 Stunden
      Genutzte Kapazität 2,4 CRPUs = (0,075 Stunden * 32 CRPU-Stunden mit CR.1X und 16 Instances)
      Tägliche Gebühren 9,60 USD = (2,4 CRPUs * 4,00 USD pro CRPU-Stunde)
      Jährliche Gebühren 3 504 USD = 9,60 USD * 365
  • AWS Clean Rooms ML – Preise
  • AWS Clean Rooms ML unterstützt benutzerdefinierte und Lookalike-Machine-Learning-Modellierung. Mit der benutzerdefinierten Modellierung können Sie ein benutzerdefiniertes Modell für das Training erstellen und Inferenzen auf kollektiven Datensätzen ausführen, ohne die zugrunde liegenden Daten oder das geistige Eigentum unter den Mitgliedern der Zusammenarbeit zu teilen. Sie können optional synthetische Datensätze für das Training Ihrer benutzerdefinierten ML-Modelle generieren. Mit der Lookalike-Modellierung können Sie ein von AWS erstelltes Modell verwenden, um einen erweiterten Satz ähnlicher Profile zu generieren, der auf einer kleinen Stichprobe von Profilen basiert, die Ihre Partner in eine Zusammenarbeit einbringen.

    Hinweis: Für AWS Clean Rooms ML steht kein kostenloses AWS-Kontingent zur Verfügung.

    • Preise für benutzerdefinierte Modellierungen
    • Wenn Sie die benutzerdefinierte Modellierung von AWS Clean Rooms ML ausführen, zahlen Sie für Training, Inferenz oder beides. Dabei richten Sie sich nach den drei Kostendimensionen. Dazu gehören die Anzahl der Einträge auf der Basis eines Preises pro Million Einträge, die Nutzung des von Ihnen ausgewählten Datenverarbeitungs-Instance-Typs und die Datenverarbeitungskapazität der Spark-SQL-Abfragen, die ausgeführt werden, um die Eingabedaten aus Training und Inferenz in einer Zusammenarbeit zu erstellen. Im Folgenden finden Sie Einzelheiten zu den drei Kostendimensionen.

      Hinweis: Um die benutzerdefinierte Modellierung von AWS Clean Rooms ML anzuwenden, müssen Sie Spark SQL als Analytik-Engine verwenden. Einzelheiten finden Sie unter AWS Clean Rooms Spark SQL – Preise.

      Preisdimension für benutzerdefinierte Modellierungen

      1. Anzahl der Einträge: Sie zahlen für die Anzahl der Einträge auf der Basis des Preises pro Million Einträge. Je nach Anzahl der Einträge, die monatlich zu Trainings- oder Inferenzzwecken verarbeitet werden, gelten unterschiedliche Preise.

      Hinweis: Die Preise für die Anzahl der Einträge für Training und Inferenz variieren nicht je nach AWS-Region.

      2. Benutzerdefinierte Modellierungsdatenverarbeitung: Sie zahlen für die Nutzung des von Ihnen ausgewählten Datenverarbeitungs-Instance-Typs und für die Dauer der Durchführung von Training und Inferenz. 

      Hinweis: Die Preise für benutzerdefinierte Modellierungsdatenverarbeitung in AWS Clean Rooms ML können je nach AWS-Region variieren, je nachdem, welche Funktionen Sie verwenden. Die Berechnung wird Ihnen auf der Grundlage der Dauer der einzelnen Trainings- und Inferenzjobs, die Sie ausführen, in Rechnung gestellt.

      3. Datenverarbeitung mit Spark SQL: Sie zahlen für die Dauer, die Ihre Spark-SQL-Abfragen benötigen, zu einem Preis pro CRPU-Stunde mit der Option, aus verschiedenen Instances für die Ausführung Ihrer Abfragen zu wählen. Sie können je nach Ihren Leistungs-, Skalierungs- und Kostenanforderungen aus vier Datenverarbeitungs-Engine-Konfigurationsoptionen wählen, um Ihre Abfragen auszuführen. Standardmäßig weist AWS Clean Rooms jeder Spark-SQL-Abfrage 32 CRPUs zu, und Sie können optional Workload-Größen bis zu 256 CRPUs oder nur 4 CRPUs wählen.

      Hinweis: Um die benutzerdefinierte Modellierung von AWS Clean Rooms ML anzuwenden, müssen Sie Spark SQL als Analytik-Engine verwenden. Einzelheiten finden Sie unter AWS Clean Rooms Spark SQL – Preise.

      Preisbeispiel für eine benutzerdefinierte Modellierung (für Training)

      Sie möchten die benutzerdefinierte Modellierung von AWS Clean Rooms ML verwenden, um ein proprietäres Modell zur Erkennung betrügerischer Transaktionen mit einem anderen Finanzinstitut zu trainieren. Sie möchten dieses Modell mithilfe eines kollektiven Datensatzes trainieren, der aus 30 000 000 Transaktionseinträgen von Ihnen und einem anderen Mitglied der Zusammenarbeit besteht. Sie möchten die Instance ml.p3.8xlarge verwenden, wobei jeder Trainingsjob durchschnittlich 6 Stunden benötigt, um abgeschlossen zu werden. Ihre Spark-SQL-Abfrage zum Abrufen der Liste der verdächtigen Transaktionen läuft 1 Stunde lang. Sie möchten die Datenverarbeitungs-Engine-Konfiguration von AWS Clean Rooms Spark SQL mit CR.1X und 16 Instances verwenden, die eine Gesamtkapazität von 32 CRPUs pro Stunde für die Ausführung der Abfragen verwendet.

      In der folgenden Tabelle sind Ihre Nutzung und Ihre Gebühren in der Region USA Ost (Nord-Virginia) zusammengefasst:

      Anzahl der Einträge im Trainingsdatensatz

      30 Millionen Einträge

      300 USD = 30 Mio. * 0,01 USD pro 1 000 Einträge

      Datenverarbeitung beim benutzerdefinierten Modellieren

      ml.p3.8xlarge für 6 Stunden

      88 128 USD = 14 688 * 6 Stunden

      Datenverarbeitung mit Spark SQL für Trainingsdaten

      32 CRPU-Stunden mit CR.1X und 16 Instances für 1 Stunde

      64 USD = (1 Stunde * 32 CRPUs * 2,00 USD pro CRPU-Stunde)

      Gesamtkosten pro Training

       

      452 128 USD = 300 USD + 88 128 USD + 64 USD

      Preisbeispiel für eine benutzerdefinierte Modellierung (für Inferenz)

      Sie möchten die benutzerdefinierte Modellierung von AWS Clean Rooms ML verwenden, um die Wahrscheinlichkeit vorherzusagen, mit der potenzielle Kunden auf Ihre Anzeigen auf einer E-Commerce-Website klicken. Sie möchten Rückschlüsse auf einen Datensatz ziehen, der aus 50 Milliarden Kundeneinträgen Ihres E-Commerce-Partners besteht. Sie möchten ml.m5.4xlarge verwenden, wobei jeder Inferenzjob durchschnittlich 2 Stunden benötigt, um abgeschlossen zu werden. Die Spark-SQL-Abfrage wird 1 Stunde lang ausgeführt, um die Daten für die Inferenz zu generieren. Sie möchten die Datenverarbeitungs-Engine-Konfiguration von AWS Clean Rooms Spark SQL mit CR.4X und 8 Instances verwenden, die eine Gesamtkapazität von 64 CRPUs pro Stunde zur Ausführung der Abfragen verwendet.

      In der folgenden Tabelle sind Ihre Nutzung und Ihre Gebühren in der Region USA Ost (Nord-Virginia) zusammengefasst:

      Anzahl der Einträge im Inferenzdatensatz

      50 Milliarden Einträge

      19 800 USD = 10 000 USD + 9 800 USD = (10 USD pro Million Einträge * 1 000) + (0,20 USD pro Million Einträge * 49 000)

      Datenverarbeitung beim benutzerdefinierten Modellieren

      ml.m5.4xlarge für 2 Stunden

      1 844 USD = 0,922 USD * 2 Stunden

      Spark SQL berechnet für Inferenz

      64 CRPU-Stunden mit CR.4X und 8 Instances für 1 Stunde

      128 USD = (1 Stunde * 64 CRPUs * 2,00 USD pro CRPU-Stunde)

      Gesamtkosten pro Inferenzierung

       

      19 929,84 USD = 19 800,00 USD + 1,844 USD + 128,00 USD

    • Synthetische Datensätze – Preise
    • Mit der benutzerdefinierten Modellierung von AWS Clean Rooms ML können Sie und Ihre Partner statistisch repräsentative synthetische Datensätze aus Ihren kollektiven Daten generieren, um Regressions- und Klassifikations-ML-Modelle zu trainieren, ohne vertrauliche Informationen aus den Originaldaten preiszugeben. 

      Die datenschutzfreundliche Generierung synthetischer Datensätze für benutzerdefiniertes Machine Learning in AWS Clean Rooms misst die Datenverarbeitungskapazität in Synthetic Data Generation Units (SDGUs). Sie zahlen für die Datenverarbeitungsressourcen, um Ihren Generierungsjob auszuführen, zu einem Preis pro SDGU. Weitere Informationen finden Sie in der Dokumentation.     

      Hinweis: Die Preise für die Generierung synthetischer Datensätze variieren nicht je nach AWS-Region.

      Typ Preise
      Bild der Generierung synthetischer Daten 2,00 USD pro SDGU

      Die Anzahl der SDGUs, die Ihr Job verbraucht, hängt von der Größe und Komplexität des Datensatzes ab, den Sie synthetisieren möchten. Im Folgenden finden Sie Beispiele, anhand derer Sie die Kosten Ihrer Aufträge zur Generierung synthetischer Datensätze auf der Grundlage von Variationen von Open-Source-Wettervorhersagedaten abschätzen können.  

      Reihen Spalten SDGUs  
      100 000 15 152  
      2 500 000 100 1 844  
      1 000 000 1 000 15 219  

      Hinweis: Dies dient nur zu Informationszwecken. Der Preis Ihrer Aufträge zur Generierung synthetischer Datensätze entspricht möglicherweise nicht den angegebenen Beispielen.

      Preisbeispiel für die Generierung synthetischer Datensätze

      Sie möchten ein Modell anhand der Benutzerdaten Ihrer Partner trainieren. Sie müssen einmal pro Woche einen neuen synthetischen Datensatz erstellen, um Ihr Modell zu trainieren. Jeder Job zur synthetischen Datengenerierung verbraucht 100 SDGUs.

      Die folgende Tabelle fasst die Gesamtnutzung für diesen Monat zusammen.

      Verbrauchte SDGUs

      400 SDGUs pro Monat = 100 SDGUs * 4 Jobs pro Monat

      Monatliche Gesamtkosten

      800,00 USD = 400 SDGUs pro Monat * 2,00 USD pro SDGU
    • Lookalike-Modelle – Preise
    • Wenn Sie die Lookalike-Modellierung von AWS ML in AWS Clean Rooms ML ausführen, zahlen Sie nur für die von AWS verfassten Modelltrainings, die Sie anfordern, und für die erstellten Lookalike-Segmente, auf der Basis des Preises pro 1 000 Profile. Dem Besitzer des Modells werden sowohl Trainings als auch Jobs zur Segmentgenerierung in Rechnung gestellt.

      Hinweis: Die Preise variieren nicht je nach AWS-Region.

      Preisdimension der Lookalike-Modellierung

      Dimension

      Preis

      Preis pro 1 000 Profile für den Trainingsdatensatz 0,04 USD pro 1 000 Profile
      Preis pro 1 000 Profile in einem Lookalike-Segment 0,25 USD pro 1 000 Profile

      Preisbeispiel für Lookalike-Modellierung

      Sie möchten die Lookalike-Modellierung von AWS Clean Rooms ML verwenden, um das von AWS erstellte Modell zu trainieren und Interaktionsdaten von 50 000 000 Kunden zuzuordnen. Ein Partner, mit dem Sie zusammenarbeiten, fordert in einer Woche 10 Lookalike-Segmente mit einer durchschnittlichen Größe von 2 000 000 Profilen pro Segment an.

      Die folgende Tabelle fasst Ihre wöchentliche Nutzung und Gebühren zusammen:

      Anzahl der Profile im Trainingsdatensatz (wöchentlich)

      50 Millionen Profile

      2000 USD = 50 Mio. * 0,04 USD pro 1 000 Profile

      Anzahl der Profile pro Segment

      2 Millionen Profile

      500 USD = 2 Mio * 0,25 USD pro 1 000 Profile

      Anzahl der Segmente

      10

      5 000 USD = 10 * 500 USD pro Segment

      Wöchentliche Gesamtgebühren

       

      7 000USD = 2 000 USD + 5 000 USD

  • AWS Entity Resolution in AWS Clean Rooms – Preise
  • Wenn Sie AWS Entity Resolution in AWS Clean Rooms verwenden, werden Ihnen 1 000 Einträge in Rechnung gestellt. Sie können Ihre Daten vorbereiten und Einträge mit den Datensätzen der Mitglieder Ihrer Zusammenarbeit abgleichen, indem Sie einen regelbasierten Abgleich oder einen Datendienstanbieter verwenden, der Anbieterdatensätze nutzt (wie LiveRamp).

    Hinweise: Die Preise variieren nicht je nach AWS-Region, und das kostenlose AWS-Kontingent für AWS Entity Resolution in AWS Clean Rooms ist nicht verfügbar. Wenn Sie den Datendienstanbieter-basierten Abgleich verwenden, müssen Sie über ein Abonnement verfügen. Die Preise beinhalten keine Gebühren, die von Dritten für die Nutzung ihrer Dienste erhoben werden. Sie können die auf AWS Data Exchange (ADX) aufgeführten öffentlichen Abonnements verwenden oder ein privates Abonnement direkt beim Datendienstanbieter Ihrer Wahl erwerben und dann Bring Your Own Subscription (BYOS) für ADX verwenden. Um AWS Entity Resolution außerhalb von AWS Clean Rooms zu verwenden, erfahren Sie hier mehr über die Preise.

    AWS Entity Resolution in AWS Clean Rooms ist in den folgenden AWS-Regionen verfügbar: Regelbasierter Abgleich ist nur in USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland) und Europa (London) verfügbar. Der Datendienstanbieter-basierte Abgleich ist nur in den USA Ost (Ohio), USA Ost (Nord-Virginia) und USA West (Oregon) verfügbar. 

    • Datenaufbereitung – Preise
    • Preisdimension für die Datenaufbereitung

      Wenn Sie den regelbasierten Abgleich verwenden, muss mindestens ein Mitglied einer Kollaboration seine Daten vorbereiten, bevor sie mit den Datensätzen seiner Partner abgeglichen werden. Wenn Sie den Datendienstanbieter-basierten Abgleich verwenden, müssen alle Kollaborationsmitglieder ihren Datensatz mit Anbieter-IDs vorbereiten, bevor die Daten mit den Datensätzen ihrer Partner abgeglichen werden.

      Dimension Preis

      Preis pro 1 000 Einträge für die Datenaufbereitung

      0,10 USD pro 1 000 verarbeitete Einträge

      Hinweise: Wenn Sie vor dem Beitritt zu einer AWS-Clean-Rooms-Zusammenarbeit bereits AWS Entity Resolution zur Vorbereitung Ihrer Daten verwendet haben, können Sie diesen Datensatz für den Abgleich in einer AWS-Clean-Rooms-Zusammenarbeit verwenden. Sie müssen die Daten nicht erneut vorbereiten.

    • Datenabgleich – Preise
    • Preisdimension für den Datenabgleich

      Ein beliebiges Mitglied einer Zusammenarbeit kann für den Datenabgleich bezahlen. Für den regelbasierten Abgleich muss ein Mitglied der Zusammenarbeit eine einmalige Abgleichsgebühr von 100 USD pro Zusammenarbeit zahlen. Diese Gebühr wird jenem Mitglied der Zusammenarbeit zugewiesen, das für den Datenabgleich bezahlt.

      Passende Technik Dimension Preis
      Regelbasiert Preis pro 1 000 Einträge für den Datenabgleich 0,50 USD pro 1 000 übereinstimmenden Einträgen
      Datendienstanbieter-basiert* Preis pro 1 000 Einträge für den Datendienstanbieter-basierten Abgleich 0,10 USD pro 1 000 verarbeitete Einträge

      *Für den Datendienstanbieter müssen alle Mitglieder ihren Datensatz vorbereiten, bevor die Daten mit den Anbieter-IDs abgeglichen werden.


      Preisbeispiel für regelbasierten Abgleich

      Sie möchten AWS Entity Resolution in AWS Clean Rooms zusammen mit den Mitgliedern Ihrer Zusammenarbeit verwenden, um Einträge mithilfe eines regelbasierten Abgleichs abzugleichen. Ihr Datensatz enthält 1 000 000 Einträge. Sie führen diesen Abgleich einmal für alle Einträge durch. Sie möchten zuerst Ihre Daten vorbereiten und dann die Einträge mit dem Mitglied Ihrer Zusammenarbeit abgleichen. Nachdem Sie den regelbasierten Abgleich-Workflow mit AWS Entity Resolution ausgeführt haben, erhalten Sie eine Trefferquote von 60 % (60 % ist ein Beispiel für die Preisdarstellung; die Trefferquoten variieren von Fall zu Fall). Alle Mitglieder der Zusammenarbeit sind sich einig, dass Sie der Zahler für die Datenaufbereitung, den Abgleich und die Grundgebühr sind.

      Die folgende Tabelle fasst die Gesamtnutzung für den Tag zusammen.

      Anzahl der zur Datenaufbereitung verarbeiteten Einträge 1 000 000 100 USD = 1 Million Einträge * 0,10 USD pro 1 000 Einträge
      Anzahl der Einträge, die für den Datenabgleich abgeglichen wurden 600 000 300 USD = 1 Million Einträge * 60 % abgeglichene Einträge * 0,50 USD pro 1 000 Einträge
      Grundgebühr für den Datenabgleich 100 USD 100 USD = Grundgebühr für den Datenabgleich pro Zusammenarbeit
      Gesamtgebühren   500 USD = 100 USD + 300 USD + 100 USD

      Preisbeispiel für Datendienstanbieter-basierten Abgleich

      Sie möchten AWS Entity Resolution in AWS Clean Rooms zusammen mit den Mitgliedern Ihrer Zusammenarbeit verwenden, um Einträge mithilfe eines Datendienstanbieters mit LiveRamp (RAMPIDS) abzugleichen. Sie und das Mitglied Ihrer Zusammenarbeit haben Ihre Datensätze mit Anbieter-IDs vorbereitet. Ihr Datensatz enthält 1 000 000 Einträge. Sie möchten Ihre Daten mit den Daten der Mitglieder Ihrer Zusammenarbeit abgleichen, die aus 5 000 000 Einträgen bestehen. Die Datensatzgröße der Mitglieder Ihrer Zusammenarbeit wirkt sich jedoch nicht auf Ihre Gebühren aus, da Sie nur für verarbeitete Einträge zahlen. Alle Mitglieder der Zusammenarbeit stimmen zu, dass Sie der Zahler sind. Wenn das Mitglied Ihrer Zusammenarbeit jedoch der Zahler wäre, würde er trotzdem für 1 000 000 verarbeitete Einträge bezahlen, indem er angibt, welche Liste von Einträgen verarbeitet wird, was in diesem Fall 1 000 000 Einträge sind. Sie verwenden die auf einem Datendienstanbieter basierte Abgleichstechnik, um den Abgleich mithilfe von LiveRamp durchzuführen. Um LiveRamp verwenden zu können, müssen Sie bereits über eine bestehende Anbieterlizenz verfügen, die für die Verwendung dieser Abgleichstechnik erforderlich ist.

      In der folgenden Tabelle sind Ihre Gesamtkosten zusammengefasst:

      Anzahl der Einträge, die für den Datenabgleich verarbeitet wurden 1 000 000 100 USD = 1 Million Einträge * 0,10 USD pro 1 000 Einträge
      Gesamtgebühren   100 USD (zusätzlich zu den Abonnementkosten des Anbieters)

      Hinweise: Wenn Sie den Datendienstanbieter-basierten Abgleich verwenden und dafür bezahlen, müssen Sie über ein Anbieterabonnement verfügen. Die Preise beinhalten keine Gebühren, die von Dritten für die Nutzung ihrer Dienste erhoben werden. Sie können die auf AWS Data Exchange (ADX) aufgeführten öffentlichen Abonnements verwenden oder ein privates Abonnement direkt beim Datendienstanbieter Ihrer Wahl erwerben und dann Bring Your Own Subscription (BYOS) für ADX verwenden. Alle Mitglieder müssen ihren Datensatz vor dem Datenabgleich mit Anbieter-IDs vorbereiten.

  • Weitere Kosten
  • AWS Clean Rooms fragt Daten von Amazon Simple Storage Service (Amazon S3) und Metadaten aus dem AWS-Glue-Datenkatalog ab. Für die Abfrage Ihrer Daten mit AWS Clean Rooms fallen keine zusätzlichen Speichergebühren an. Jedem Mitglied der Zusammenarbeit, das Daten zu einer Zusammenarbeit beisteuert, werden die standardmäßigen Amazon-S3-API- und Abrufgebühren sowie Gebühren für die AWS-Glue-Datenkatalog-API berechnet, wenn seine Datensätze in Abfragen verwendet werden. 

    • Das Lesen, Speichern und Übertragen von Daten durch Ihre Workloads wird Ihnen von S3 in Rechnung gestellt. Die Abfrageergebnisse werden in einem S3-Bucket Ihrer Wahl gespeichert und zu S3-Standardtarifen in Rechnung gestellt. Weitere Informationen finden Sie in der Preisübersicht zu Amazon S3.
    • Die Anfragen an den AWS-Glue-Datenkatalog werden Ihnen von AWS Glue in Rechnung gestellt. Weitere Informationen finden Sie unter AWS Glue – Preise.