- Analytik›
- Amazon SageMaker›
- Lakehouse-Architektur
Die Lakehouse-Architektur von Amazon SageMaker
Analytik und KI mit einer einheitlichen, offenen und sicheren Datenarchitektur vereinfachen
Übersicht
Die nächste Generation von Amazon SageMaker basiert auf einer offenen Lakehouse-Architektur, die vollständig mit Apache Iceberg kompatibel ist. Vereinheitlichen Sie alle Daten über Data Lakes von Amazon Simple Storage Service (Amazon S3), einschließlich S3-Tabellen, und Amazon Redshift Data Warehouses hinweg, um leistungsstarke Analytik- und KI/ML-Anwendungen auf Basis einer einzigen Datenkopie zu erstellen. Verbinden Sie Daten aus zusätzlichen Quellen durch Null-ETL-Integrationen mit operativen Datenbanken und Anwendungen, Abfrageverbund mit Datenquellen und Katalogverbund für entfernte Apache-Iceberg-Tabellen. Mit allen Iceberg-kompatiblen Tools und Engines erhalten Sie die Flexibilität, direkt auf Ihre Daten zuzugreifen und diese abzufragen. Sichern Sie Ihre Daten, indem Sie integrierte Zugriffskontrollen definieren, die für alle Analytik- und Machine-Learning-Tools und -Engines (ML) gelten.
In Aktion erleben
Erfahren Sie, wie Sie in einem offenen und sicheren Data Lakehouse auf vereinheitlichte Daten aus S3 Data Lakes, S3 Tables und Redshift-Data-Warehouses zugreifen können.
Vorteile
Vereinheitlichen Sie alle Daten über Amazon S3 Data Lakes, einschließlich S3-Tabellen, und Amazon Redshift Data Warehouses hinweg. Bringen Sie Ihre Daten aus Betriebsdatenbanken und Anwendungen durch Null-ETL-Integrationen nahezu in Echtzeit in das Lakehouse. Greifen Sie über Abfrage-Verbundfunktionen auf Daten in Drittanbieter-Datenquellen zu und fragen Sie diese ab. Darüber hinaus erhalten Sie über den Katalogverbund einen direkten, sicheren und kosteneffizienten Zugriff auf in S3 gespeicherte und in dezentralen Katalogen registrierte Apache-Iceberg-Tabellen von AWS-Analytik-Engines.
Mit allen Apache-Iceberg-kompatiblen Analytik-Tools und -Engines wie SQL, Apache Spark, Business Intelligence (BI) und KI/ML-Tools wie SQL, Apache Spark, Business Intelligence (BI) und KI/ML-Tools erhalten Sie die Flexibilität, direkt in Ihrem Lakehouse auf Ihre Daten zuzugreifen und diese abzufragen.
Sichern Sie alle Daten mit integrierten, detaillierten Zugriffskontrollen auf Tabellen-, Spalten- oder Zellenebene und setzen Sie diese Berechtigungen in allen Ihren Analytik-Tools und -Engines durch. Verwenden Sie Tag-basierte, attributbasierte oder rollenbasierte Zugriffsrichtlinien, um Ihren Sicherheitsanforderungen gerecht zu werden. Geben Sie Daten innerhalb Ihres Unternehmens frei, ohne Kopien zu erstellen.
Anwendungsfälle
Vereinheitlichen Sie all Ihre Daten in Data Lakes von Amazon S3 und Data Warehouses von Amazon Redshift für Ihre Analytik- und KI-Initiativen mit einer einzigen Datenkopie. Integrierte Zugriffskontrollen ermöglichen es Ihnen, detaillierte Berechtigungen zu definieren und eine einzige Datenkopie sicher im gesamten Unternehmen zu teilen.
Greifen Sie über Null-ETL-Integrationen nahezu in Echtzeit auf Daten aus operativen Datenbanken und Anwendungen zu. Greifen Sie direkt auf Ihre Daten zu und fragen Sie sie ab – mit einer Vielzahl von AWS-Services sowie Open-Source-Tools und Engines von Drittanbietern, die Apache Iceberg unterstützen.
Bringen Sie vorhandene Daten aus mehreren Data Warehouses von Amazon Redshift in das Lakehouse, um Daten abzufragen und zu verknüpfen, die in Amazon-Redshift-Clustern und -Arbeitsgruppen gespeichert sind. Skalieren Sie Ihre Workloads für Prozesse von Extract, Transform, Load (ETL), BI-Berichte und Analysen nach Bedarf, ohne mehrere Datenfreigaben verwalten zu müssen.
Kunden
Lennar
„Wir haben die letzten 18 Monate damit verbracht, mit AWS zusammenzuarbeiten, um unsere Datenbasis so zu transformieren, dass wir erstklassige Lösungen verwenden können, die auch kostengünstig sind. Mit Fortschritten wie Amazon SageMaker Unified Studio und Amazon SageMaker Lakehouse beschleunigen wir unsere Liefergeschwindigkeit durch den nahtlosen Zugriff auf Daten und Services, sodass unsere Techniker, Analysten und Wissenschaftler Einblicke gewinnen können, die für unser Unternehmen von erheblichem Wert sind.“
Lee Slezak, SVP of Data and Analytic, Lennar
Roche
Roche ist ein globaler Vorreiter in den Bereichen Pharma und Diagnostik, der sich auf die Weiterentwicklung der Wissenschaft konzentriert, um das Leben der Menschen zu verbessern.
„Wir haben Amazon Redshift verwendet, um Erkenntnisse aus strukturierten und halbstrukturierten Daten in all unseren Daten-Repositorys zu gewinnen. Ich bin begeistert von dem neuen Amazon SageMaker Lakehouse, das das Potenzial hat, den Zugriff auf Data Lakes oder andere Datenquellen mit Services wie Amazon Redshift, AWS-Glue-Datenkatalog und AWS Lake Formation zu verbessern und zu vereinheitlichen. Diese Innovation wird es unseren Daten- und Entwicklungsteams ermöglichen, den Datenzugriff zu vereinfachen und die Interoperabilität zwischen Daten-, Analytik- und Anwendungs-Workloads zu fördern. Ich rechne mit einer deutlichen Verringerung von Datenfehlern durch weniger Datenkopien, eine Verringerung der Verarbeitungszeit um 40 %, ein schnelleres Write-Back von Analytikdaten in Transaktionssysteme zur Verbesserung der Entscheidungsfindung und die Möglichkeit für unsere Teams, sich auf die Schaffung von Geschäftswerten zu konzentrieren.“
Yannick Misteli, Head of Engineering, Global Product Strategy, Roche
Idealista
Idealista unterstützt Immobilienmakler und Privatpersonen in ganz Südeuropa durch die Bereitstellung einer Online-Plattform für Immobilienkleinanzeigen.
„Unser Ziel ist es, den Zugriff auf Salesforce-Daten für eine verbesserte Analytik in unserem Data Lake zu optimieren. Durch die Nutzung der neuen Unterstützung von Amazon SageMaker Lakehouse für Null-ETL-Integrationen von Anwendungs-Features können wir unsere Prozesse zur Datenextraktion und -erfassung vereinfachen und die Notwendigkeit mehrerer ETLs für den direkten Zugriff auf Salesforce beseitigen. Dieser zentralisierte Ansatz reduziert die Komplexität und verbessert die Effizienz unseres Datenmanagements erheblich. Wir rechnen mit einer erheblichen Zeitersparnis bei der Entwicklung der Datenextraktion und -erfassung, sodass sich unser Team darauf konzentrieren kann, aus unseren Daten umsetzbare Erkenntnisse abzuleiten, anstatt deren Erfassung zu verwalten.“
Javier Monterrubio, Data Platform Engineer Manager bei Idealista
Carrier
„Bei Carrier transformiert die nächste Generation von Amazon SageMaker unsere Unternehmensdatenstrategie, indem sie die Art und Weise, wie wir Datenprodukte entwickeln und skalieren, optimiert. Der Ansatz von SageMaker Unified Studio zur Datenermittlung, -verarbeitung und Modellentwicklung hat unsere Lakehouse-Implementierung erheblich beschleunigt. Am beeindruckendsten ist, dass die nahtlose Integration in unseren bestehenden Datenkatalog und die integrierten Governance-Kontrollen es uns ermöglichen, den Datenzugriff zu demokratisieren und gleichzeitig die Sicherheitsstandards aufrechtzuerhalten, sodass unsere Teams schnell fortschrittliche Analytik- und KI-Lösungen im gesamten Unternehmen bereitstellen können.“
Partner
Tableau
Tableau verhilft Personen und Unternehmen zu einer stärker datengesteuerten Arbeitsweise.
„Die Partnerschaft zwischen Amazon und Salesforce Tableau steht für ein gemeinsames Engagement für Innovation und Kundenerfolg. Durch die neue Null-ETL-Integration von Amazon kombinieren wir die KI-gestützten Daten und Analytik von Tableau mit der leistungsstarken Dateninfrastruktur von Amazon, um die Art und Weise zu verändern, wie Unternehmen Erkenntnisse aus ihren Daten gewinnen. Diese nahtlose Integration ermöglicht es unseren Kunden, mithilfe der Leistung von Amazon SageMaker Lakehouse und Amazon Redshift Erkenntnisse aus all ihren strukturierten und unstrukturierten Daten zu gewinnen. Dadurch werden die technische Komplexität und die Bereitstellungszeit drastisch reduziert. Gemeinsam unterstützen Tableau und Amazon Kunden dabei, die digitale Transformation zu beschleunigen und den Geschäftswert in großem Maßstab zu steigern.“
Ali Tore, Senior VP, Advanced Analytics bei Tableau
dbt Labs
Die Aufgabe von dbt Labs besteht darin, Analysten bei der Erstellung und Verbreitung organisatorischen Wissens zu unterstützen.
„Wir sind seit Langem der Transformationsstandard auf Basis von Amazon Redshift und bieten Flexibilität, Zusammenarbeit und Vertrauen. Dank des neuen Amazon SageMaker Lakehouse können wir diesen Mehrwert auf mehr Kunden und noch mehr Daten in der AWS-Umgebung ausdehnen. Jetzt können Kunden auf alle ihre Daten im gesamten AWS-System zugreifen, einschließlich Data Warehouses und Data Lakes. Wir freuen uns darauf, unsere Fähigkeiten mit dem neuen Amazon SageMaker zu kombinieren, um unseren gemeinsamen Kunden Governance-, Katalogisierungs- und Datenoptimierungen anzubieten.“
Shawn Toldo, VP Partnerships bei dbt Labs
Informatica
Informatica, ein führendes Unternehmen im Bereich KI-gestütztes Cloud-Datenmanagement für Unternehmen, erweckt Daten und KI zum Leben, indem es Unternehmen die Möglichkeit gibt, das transformative Potenzial ihrer wichtigsten Ressourcen zu nutzen.
„Unsere Intelligent Data Management Cloud (IDMC)-Plattform und Amazon SageMaker helfen Unternehmen dabei, Datenpotenzial zu erschließen und Innovation und Effizienz voranzutreiben. Als Startpartner von Amazon SageMaker Lakehouse sind wir stolz darauf, eine Lösung auf Unternehmensebene bereitzustellen, die den hohen Standards moderner datengesteuerter Organisationen gerecht wird. Gemeinsam mit der Infrastruktur von AWS ermöglichen wir schnellere, fundierte Entscheidungen für wirkungsvolle Ergebnisse in allen Branchen.“
Pratik Parekh, SVP Product Management bei Informatica