Arsitektur lakehouse Amazon SageMaker
Sederhanakan analitik dan AI dengan arsitektur data yang terpadu, terbuka, dan aman
Gambaran Umum
Generasi berikutnya dari Amazon SageMaker dibangun di arsitektur lakehouse terbuka, sepenuhnya kompatibel dengan Apache Iceberg. Satukan semua data Anda di seluruh Amazon Simple Storage Service (Amazon S3), termasuk Tabel S3, dan gudang data Amazon Redshift, sehingga membantu Anda membangun analitik yang andal dan aplikasi AI/ML pada satu salinan data. Akses dan kueri data di tempat Anda secara fleksibel dengan semua alat dan mesin yang kompatibel dengan Apache Iceberg. Amankan data Anda dengan menentukan izin mendetail yang diberlakukan di semua alat dan mesin analitik dan machine learning (ML). Bawa data dari basis data operasional dan aplikasi ke lakehouse Anda hampir secara waktu nyata melalui integrasi nol-ETL. Selain itu, jalankan kueri gabungan pada data yang disimpan di beberapa sumber pihak ketiga untuk mengakses dan mengkueri data di tempat Anda.
Lihat cara kerjanya
Lihat bagaimana Anda dapat mengakses data terpadu dari danau data S3, Tabel S3, dan gudang data Redshift di lakehouse data yang terbuka dan aman.

Keuntungan
Satukan akses ke semua data Anda
Satukan semua data Anda dari seluruh danau data Amazon S3, termasuk Tabel S3, dan gudang data Amazon Redshift. Pindahkan data Anda dari aplikasi dan basis data operasional ke lakehouse hampir secara waktu nyata melalui integrasi nol-ETL. Anda dapat menggunakan ratusan konektor untuk mengintegrasikan data dari berbagai sumber. Selain itu, Anda dapat mengakses dan melakukan kueri data di tempat dengan kemampuan kueri gabungan di seluruh sumber data pihak ketiga.
Gunakan alat dan mesin pilihan Anda, yang kompatibel dengan standar terbuka Apache Iceberg
Dapatkan fleksibilitas untuk mengakses dan mengkueri data di tempat Anda dengan semua alat dan mesin analitik yang kompatibel dengan Apache Iceberg, seperti SQL, Apache Spark, business intelligence (BI), dan alat AI/ML untuk mengakses data terpadu di lakehouse Anda.
Lindungi data Anda dengan kontrol akses yang mendetail
Kasus penggunaan
Kelola satu salinan data di seluruh danau data dan gudang data
Satukan semua data Anda di danau data Amazon S3 dan gudang data Amazon Redshift untuk analitik dan inisiatif AI dengan satu salinan data. Dengan kontrol akses terintegrasi, Anda dapat menentukan izin yang mendetail dan membagikan satu salinan data secara aman ke seluruh bagian organisasi.
Jalankan analitik yang hampir waktu nyata pada data operasional melalui integrasi nol-ETL
Akses data secara hampir waktu nyata di seluruh basis data operasional dan aplikasi melalui integrasi nol-ETL. Akses dan kueri data Anda secara langsung, dari berbagai layanan AWS serta alat dan mesin sumber terbuka dan pihak ketiga yang mendukung Apache Iceberg.
Bangun arsitektur multi-gudang di Amazon Redshift
Pindahkan data yang ada dari beberapa gudang data Amazon Redshift ke lakehouse untuk mengkueri serta menggabungkan data yang disimpan di klaster dan kelompok kerja Amazon Redshift. Skalakan beban kerja Anda untuk proses extract, transform, and load (ETL), pelaporan BI, dan analisis sesuai kebutuhan tanpa mengelola beberapa pembagian data.
Pelanggan
Lennar
"Kami telah menghabiskan 18 bulan terakhir bekerja sama dengan AWS untuk mengubah fondasi data kami guna menggunakan solusi terbaik di kelasnya yang juga hemat biaya. Dengan kemajuan seperti Studio Terpadu Amazon SageMaker dan Amazon SageMaker Lakehouse, kami mempercepat laju pengiriman kami melalui akses tanpa hambatan ke data dan layanan sehingga memungkinkan para teknisi, analis, dan ilmuwan kami untuk memunculkan wawasan yang memberikan nilai penting bagi bisnis kami."
Lee Slezak, SVP of Data and Analytic, Lennar

Roche
Roche adalah pelopor global di bidang farmasi dan diagnostik yang berfokus pada kemajuan ilmu pengetahuan untuk meningkatkan kualitas kehidupan manusia.
“Kami telah menggunakan Amazon Redshift untuk mendapatkan wawasan dari data terstruktur dan semiterstruktur di seluruh repositori data kami. Amazon SageMaker Lakehouse yang baru membuat saya bersemangat dengan potensinya untuk meningkatkan dan menyatukan akses ke danau data atau sumber data lainnya di layanan seperti Amazon Redshift, Katalog Data AWS Glue, dan AWS Lake Formation. Inovasi ini membantu tim data dan tim teknik kami menyederhanakan akses data, mendorong interoperabilitas di seluruh data, analitik, dan beban kerja aplikasi. Saya memperkirakan pengurangan kesalahan data yang signifikan melalui penyalinan data yang lebih sedikit, pengurangan waktu pemrosesan sebanyak 40%, penulisan kembali data analitik yang lebih cepat ke sistem transaksional untuk pengambilan keputusan yang lebih baik, dan pemberdayaan tim kami untuk fokus menciptakan nilai bisnis."
Yannick Misteli, Head of Engineering, Global Product Strategy, Roche

Idealista
Idealista mendukung agen real estate dan perorangan di seluruh Eropa Selatan dengan menyediakan platform iklan baris real estate daring.
“Tujuan kami adalah menyederhanakan akses ke data Salesforce untuk peningkatan analitik di danau data kami. Dengan memanfaatkan dukungan Amazon SageMaker Lakehouse baru untuk integrasi nol-ETL dari fitur aplikasi, kami dapat menyederhanakan proses ekstraksi dan penyerapan data, sehingga menghilangkan kebutuhan akan banyak ETL untuk mengakses Salesforce secara langsung. Pendekatan terpusat ini mengurangi kompleksitas dan secara signifikan meningkatkan efisiensi manajemen data kami. Hasilnya, kami memperkirakan tercapainya penghematan waktu yang signifikan dalam ekstraksi data dan pengembangan penyerapan, yang memungkinkan tim kami untuk fokus pada perolehan wawasan yang dapat ditindaklanjuti dari data, bukan sekadar pengelolaan pengumpulan data saja."
Javier Monterrubio, Data Platform Engineer Manager, Idealista

Carrier
"Di Carrier, Amazon SageMaker generasi terbaru mentransformasi strategi data korporasi kami dengan menyederhanakan cara kami membangun dan menskalakan produk data. Pendekatan Studio Terpadu SageMaker untuk penemuan, pemrosesan, dan pengembangan model data telah secara signifikan mengakselerasi implementasi lakehouse kami. Hal yang paling mengesankan, integrasinya yang lancar dengan katalog data kami yang ada serta kontrol tata kelola bawaannya memungkinkan kami untuk mendemokratisasi akses data sambil mempertahankan standar keamanan, sehingga membantu tim kami dengan cepat memberikan analitik dan solusi AI canggih di seluruh korporasi."

Partner
Tableau
Tableau membantu orang dan organisasi menjadi lebih berbasis data.
“Kemitraan antara Amazon dan Salesforce Tableau merupakan komitmen bersama terhadap inovasi dan kesuksesan pelanggan. Melalui integrasi nol-ETL baru Amazon, kami menggabungkan data dan analitik bertenaga AI Tableau dengan infrastruktur data Amazon yang canggih untuk mengubah cara organisasi memperoleh wawasan dari data mereka. Integrasi yang mulus ini memungkinkan pelanggan kami memperoleh wawasan dari semua data terstruktur maupun tak terstruktur mereka menggunakan kekuatan Amazon SageMaker Lakehouse dan Amazon Redshift, yang secara drastis mengurangi kerumitan rekayasa dan waktu deployment. Bersama-sama, Tableau dan Amazon membantu pelanggan mempercepat transformasi digital dan meningkatkan nilai bisnis dalam skala besar.”
Ali Tore, Senior VP, Advanced Analytics, Tableau

dbt Labs
dbt Labs memiliki misi untuk membantu analis menciptakan dan menyebarluaskan pengetahuan organisasi.
"Kami telah lama menjadi standar transformasi setelah Amazon Redshift, dengan menawarkan fleksibilitas, kolaborasi, dan kepercayaan. Dengan Amazon SageMaker Lakehouse yang baru, kami gembira dapat memperluas nilai ini ke lebih banyak pelanggan dan lebih banyak data di lingkungan AWS. Sekarang, pelanggan dapat mengakses semua data mereka di seluruh sistem AWS, termasuk gudang data dan danau data. Kami senang dapat menggabungkan kemampuan kami dengan Amazon SageMaker baru untuk menyediakan tata kelola, pembuatan katalog, dan pengoptimalan data bagi pelanggan bersama kami.”
Shawn Toldo, VP Partnerships, dbt Labs

Informatica
Informatica, pemimpin dalam manajemen data cloud bertenaga AI korporasi, menghidupkan data dan AI dengan memberdayakan bisnis untuk mewujudkan kekuatan transformatif dari aset mereka yang paling penting.
“Platform Intelligent Data Management Cloud (IDMC) dan Amazon SageMaker kami membantu berbagai organisasi menggali potensi data sekaligus mendorong inovasi dan efisiensi. Sebagai partner peluncuran Amazon SageMaker Lakehouse, kami bangga dapat menghadirkan solusi tingkat perusahaan yang memenuhi standar tinggi organisasi modern berbasis data. Bersama infrastruktur AWS, kami bisa membuat keputusan yang lebih cepat dan tepat untuk hasil yang berdampak di seluruh industri.”
Pratik Parekh, SVP Product Management, Informatica
