- Analytik›
- AWS Clean Rooms›
- Features
Features von AWS Clean Rooms
Erstellen Sie Clean Rooms in Minutenschnelle. Arbeiten Sie mit Ihren Partnern zusammen, ohne Rohdaten zu teilen.
Warum AWS Clean Rooms?
Erstellen Sie Ihren eigenen Clean Room, fügen Sie Teilnehmer hinzu und beginnen Sie in wenigen Schritten mit der Zusammenarbeit
Arbeiten Sie mit jedem Unternehmen zusammen, ohne die zugrunde liegenden Daten zu teilen oder preiszugeben
Zugrunde liegenden Daten mit einer Vielzahl von Datenschutzkontrollen für Clean Rooms schützen
Verknüpfen und vergleichen Sie Kundendatensätze, verwenden Sie flexible Analyse-Tools und trainieren und implementieren Sie ML-Modelle mit Ihren Partnern
Themen der Seite
Mehrparteien
Alles öffnenArbeiten Sie gemeinsam an Ihren Daten, wo sie sich befinden
Alles öffnenVollständiger programmatischer Zugriff
Alles öffnenKonfigurierbare Rollen
Alles öffnenAWS Entity Resolution in AWS Clean Rooms
Alles öffnenPySpark
Alles öffnenFlexibles SQL
Alles öffnenAnalyseregeln sind Einschränkungen, die Ihnen eine integrierte Kontrolle darüber geben, wie Ihre Daten analysiert werden können. Kollaborationsmitglieder, die als designierte Abfrage-Runner eine Kollaboration erstellen oder einer Kollaboration beitreten, können Abfragen schreiben, um Ihre Datentabellen gemäß den von Ihnen festgelegten Analyseregeln zu überschneiden und zu analysieren. AWS Clean Rooms unterstützt drei Arten von Analyseregeln: Aggregation, Liste und benutzerdefinierte Regeln.
Regel für die Aggregationsanalyse: Mit der Regel für die Aggregationsanalyse können Sie Abfragen ausführen, die aggregierte Statistiken generieren, z. B. wie groß die Schnittmenge zweier Datensätze ist. Wenn Sie die Regel für die Aggregationsanalyse verwenden, können Sie erzwingen, dass nur Aggregationsabfragen für Ihre Daten ausgeführt werden können, und Einschränkungen für bestimmte Teile der ausgeführten Abfragen erzwingen, z. B. welche Spalten nur bei einem Blind Match verwendet werden dürfen und welche Spalten in Aggregationen wie Summen, Anzahlen oder Durchschnittswerten verwendet werden können. Sie steuern auch die minimale Aggregationsbeschränkung in der Ausgabe. Sie können auch Mindestaggregationsbeschränkungen festlegen, die es Ihnen ermöglichen Bedingungen für die Rückgabe von Ausgabezeilen festzulegen. Diese Einschränkungen haben das Format COUNT DISTINCT (Spalte) >= Schwellenwert. Wenn eine Ausgabezeile in den Abfrageergebnissen keine der Einschränkungen erfüllt, wird sie für die Ergebnismenge entfernt. Dies hilft Ihnen, sicherzustellen, dass Mindestaggregationsschwellenwerte automatisch durchgesetzt werden, während Sie Datenmitarbeitern Flexibilität bieten, die Abfragen ihrer Wahl zu schreiben.
Listenanalyseregel: Mit der Listenanalyseregel können Sie Abfragen ausführen, die die Liste der Schnittmenge mehrerer Datensätze auf Zeilenebene extrahieren, z. B. die Überlappung zweier Datensätze. Wenn Sie die Listenanalyseregel verwenden, können Sie erzwingen, dass nur Listenabfragen für Ihre Daten ausgeführt werden können, und Einschränkungen der ausgeführten Abfragen erzwingen, z. B. welche Spalten nur bei einem Blind Match verwendet werden dürfen und welche Spalten als Liste in der Ausgabe ausgegeben werden können.
Benutzerdefinierte Analyseregel: Mit der benutzerdefinierten Analyseregel können Sie benutzerdefinierte Abfragen mithilfe der meisten ANSI-Standard-SQL erstellen, z. B. allgemeine Tabellenausdrücke (CTE) und Fensterfunktionen. Sie können Abfragen auch überprüfen und zulassen, bevor Kooperationspartner sie ausführen, und die Abfragen anderer Mitarbeiter überprüfen, bevor sie für Ihre Tabellen ausgeführt werden dürfen. Wenn Sie die benutzerdefinierte Analyseregel verwenden, können Sie die integrierte Steuerung verwenden, um im Voraus zu bestimmen oder einzuschränken, wie Ihre zugrunde liegenden Daten analysiert werden könnten, anstatt sich nach Abschluss der Analysen auf Abfrageprotokolle verlassen zu müssen. Wenn Sie benutzerdefinierte SQL-Abfragen verwenden, können Sie auch Analysevorlagen erstellen oder verwenden, um benutzerdefinierte Abfragen mit Parametern in den Kollaborationen zu speichern. Auf diese Weise können sich Kunden bei einer Zusammenarbeit leichter gegenseitig helfen. Beispielsweise kann ein Mitglied, das über mehr SQL-Erfahrung verfügt, Vorlagen erstellen, die andere Mitglieder überprüfen und möglicherweise ausführen können. Es ermöglicht auch wiederverwendbare Analysen in der Zusammenarbeit. Sie können AWS Clean Rooms Differential Privacy auch verwenden, indem Sie eine benutzerdefinierte Analyseregel auswählen und dann Ihre differenziellen Datenschutzparameter konfigurieren.
Sie können AWS-Clean-Rooms-Abfragen bezüglich kryptografisch geschützter Daten durchzuführen. Wenn Sie Richtlinien für den Umgang mit Daten haben, die die Verschlüsselung vertraulicher Daten vorschreiben, können Sie Ihre Daten mit einem zusammenarbeitsspezifischen, gemeinsamen Verschlüsselungsschlüssel vorverschlüsseln, sodass die Daten auch bei der Ausführung von Abfragen verschlüsselt sind. Kryptografisches Computing stellt sicher, dass Daten, die für gemeinsame Berechnungen verwendet werden, verschlüsselt bleiben: im Ruhezustand, bei der Übertragung und bei der Verwendung (während der Verarbeitung).
Kryptografisches Computing für Clean Rooms (C3R) ist ein Open-Source-Java-SDK mit einer CLI, das auf GitHub verfügbar ist. Für dieses Feature fallen keine Zusatzgebühren an. Wenn Sie über Big Data verfügen, können Sie in der Dokumentation nachlesen, wie C3R in Apache Spark integriert werden kann.
Diese Funktion ist die jüngste einer breiten Palette von AWS-Tools für kryptografisches Computing, die Ihnen dabei helfen, Ihre Sicherheits- und Compliance-Anforderungen zu erfüllen und gleichzeitig die Vorteile der Flexibilität, Skalierbarkeit, Leistung und Benutzerfreundlichkeit von AWS zu nutzen.
Datenschutzverbesserndes ML
Alles öffnenAWS Clean Rooms ML unterstützt Sie und Ihre Partner bei der Anwendung von Machine Learning (ML) zur Verbesserung des Datenschutzes, um prädiktive Erkenntnisse zu generieren, ohne dass Sie Rohdaten miteinander teilen müssen. AWS Clean Rooms ML unterstützt benutzerdefinierte und Lookalike-Machine-Learning-Modellierung. Mit der benutzerdefinierten Modellierung können Sie ein benutzerdefiniertes Modell für das Training erstellen und Inferenzen auf kollektiven Datensätzen ausführen, ohne die zugrunde liegenden Daten oder das geistige Eigentum unter den Kollaborationsmitgliedern zu teilen. Mit der Lookalike-Modellierung können Sie ein von AWS erstelltes Modell verwenden, um einen erweiterten Satz ähnlicher Profile zu generieren, der auf einer kleinen Stichprobe von Profilen basiert, die Ihre Partner in eine Kollaboration einbringen.
AWS Clean Rooms ML unterstützt Kunden bei mehreren Anwendungsfällen. Werbetreibende können beispielsweise ihr proprietäres Modell und ihre Daten in eine Clean-Rooms-Kollaboration einbringen und Publisher einladen, ihre Daten hinzuzufügen, um ein benutzerdefiniertes ML-Modell zu trainieren und bereitzustellen, das ihnen dabei hilft, die Effektivität ihrer Kampagnen zu steigern. Finanzinstitute können historische Transaktionsaufzeichnungen verwenden, um ein benutzerdefiniertes ML-Modell zu trainieren, und Partner zu einer Clean-Rooms-Kollaboration einladen, um potenziell betrügerische Transaktionen zu erkennen. Forschungseinrichtungen und Krankenhausnetzwerke können Kandidaten finden, die bestehenden Teilnehmern an klinischen Studien ähneln, um klinische Studien zu beschleunigen, und Marken und Publisher können ähnliche Segmente von Kunden im Markt modellieren und hochrelevante Werbeerlebnisse liefern, ohne dass eines der Unternehmen die zugrunde liegenden Daten mit dem anderen teilt.
Die Lookalike-Modellierung von AWS Clean Rooms ML wurde unter Verwendung eines von AWS erstellten Modells erstellt und anhand verschiedener Datensätze getestet, z. B. E-Commerce und Videostreaming. Es kann Ihnen dabei helfen, die Genauigkeit der Lookalike-Modellierung um bis zu 36 % zu verbessern (im Vergleich zu repräsentativen Branchen-Baselines). In realen Anwendungen wie der Neukundenakquise kann diese Verbesserung der Genauigkeit zu Einsparungen in Millionenhöhe führen.
Mit AWS Clean Rooms können Sie und Ihre Partner synthetische Datensätze aus Ihren kollektiven Daten generieren, um Regressions- und Klassifikationsmodelle für Machine Learning (ML) zu trainieren. AWS Clean Rooms ML wendet datenschutzverbessernde Kontrollen an, um Ihre geschützten Daten und ML-Modelle zu schützen und gleichzeitig prädiktive Erkenntnisse zu generieren. Als Maßnahme zur Verbesserung des Datenschutzes ermöglicht die Generierung synthetischer Datensätze Ihnen und Ihren Partnern die Erstellung von Trainingsdatensätzen mit ähnlichen statistischen Eigenschaften wie das Original. Dadurch eröffnen sich neue Anwendungsfälle für das Training von ML-Modellen für kollektive Datensätze, die zuvor aufgrund von Datenschutzbedenken eingeschränkt waren.
Die Erstellung datenschutzverbessernder synthetischer Datensätze für benutzerdefiniertes Machine Learning in AWS Clean Rooms ML funktioniert durch die Anonymisierung von Subjekten – beispielsweise Personen oder Organisationen, über die Daten erfasst wurden – in den Originaldaten, wodurch das Risiko gemindert wird, dass ein Modell Informationen über Personen im Datensatz speichert. Der Prozess zur Generierung synthetischer Datensätze ist so optimiert, dass Datensätze erstellt werden, die mit den Regressions- und Klassifizierungsalgorithmen Ihrer Wahl kompatibel sind.