Lewati ke Konten Utama

Arsitektur Lakehouse

Gambaran Umum

Generasi berikutnya dari Amazon SageMaker dibangun di arsitektur lakehouse terbuka, sepenuhnya kompatibel dengan Apache Iceberg. Satukan semua data Anda di seluruh Amazon Simple Storage Service (Amazon S3), termasuk Tabel S3, dan gudang data Amazon Redshift, sehingga membantu Anda membangun analitik yang andal dan aplikasi AI/ML pada satu salinan data. Akses dan kueri data di tempat Anda secara fleksibel dengan semua alat dan mesin yang kompatibel dengan Apache Iceberg. Amankan data Anda dengan menentukan izin mendetail yang diberlakukan di semua alat dan mesin analitik dan machine learning (ML). Bawa data dari basis data operasional dan aplikasi ke lakehouse Anda hampir secara waktu nyata melalui integrasi nol-ETL. Selain itu, jalankan kueri gabungan pada data yang disimpan di beberapa sumber pihak ketiga untuk mengakses dan mengkueri data di tempat Anda.

Lihat cara kerjanya

Lihat bagaimana Anda dapat mengakses data terpadu dari danau data S3, Tabel S3, dan gudang data Redshift di lakehouse data yang terbuka dan aman.

Missing alt text value

Keuntungan

Satukan semua data Anda dari seluruh danau data Amazon S3, termasuk Tabel S3, dan gudang data Amazon Redshift. Pindahkan data Anda dari aplikasi dan basis data operasional ke lakehouse hampir secara waktu nyata melalui integrasi nol-ETL. Anda dapat menggunakan ratusan konektor untuk mengintegrasikan data dari berbagai sumber. Selain itu, Anda dapat mengakses dan melakukan kueri data di tempat dengan kemampuan kueri gabungan di seluruh sumber data pihak ketiga.

Dapatkan fleksibilitas untuk mengakses dan mengkueri data di tempat Anda dengan semua alat dan mesin analitik yang kompatibel dengan Apache Iceberg, seperti SQL, Apache Spark, business intelligence (BI), dan alat AI/ML untuk mengakses data terpadu di lakehouse Anda.

Lindungi data Anda dengan kontrol akses terintegrasi dan mendetail yang diberlakukan di semua data di semua alat dan mesin analitik. Tentukan izin sekali saja dan bagikan data dengan percaya diri di seluruh bagian organisasi.

Kasus penggunaan

Satukan semua data Anda di danau data Amazon S3 dan gudang data Amazon Redshift untuk analitik dan inisiatif AI dengan satu salinan data. Dengan kontrol akses terintegrasi, Anda dapat menentukan izin yang mendetail dan membagikan satu salinan data secara aman ke seluruh bagian organisasi.

Akses data secara hampir waktu nyata di seluruh basis data operasional dan aplikasi melalui integrasi nol-ETL. Akses dan kueri data Anda secara langsung, dari berbagai layanan AWS serta alat dan mesin sumber terbuka dan pihak ketiga yang mendukung Apache Iceberg.

Pindahkan data yang ada dari beberapa gudang data Amazon Redshift ke lakehouse untuk mengkueri serta menggabungkan data yang disimpan di klaster dan kelompok kerja Amazon Redshift. Skalakan beban kerja Anda untuk proses extract, transform, and load (ETL), pelaporan BI, dan analisis sesuai kebutuhan tanpa mengelola beberapa pembagian data.

Pelanggan

Lennar

"Kami telah menghabiskan 18 bulan terakhir bekerja sama dengan AWS untuk mengubah fondasi data kami guna menggunakan solusi terbaik di kelasnya yang juga hemat biaya. Dengan kemajuan seperti Studio Terpadu Amazon SageMaker dan Amazon SageMaker Lakehouse, kami mempercepat laju pengiriman kami melalui akses tanpa hambatan ke data dan layanan sehingga memungkinkan para teknisi, analis, dan ilmuwan kami untuk memunculkan wawasan yang memberikan nilai penting bagi bisnis kami."

Lee Slezak, SVP of Data and Analytic, Lennar

Missing alt text value

Roche

Roche adalah pelopor global di bidang farmasi dan diagnostik yang berfokus pada kemajuan ilmu pengetahuan untuk meningkatkan kualitas kehidupan manusia.

“Kami telah menggunakan Amazon Redshift untuk mendapatkan wawasan dari data terstruktur dan semiterstruktur di seluruh repositori data kami. Amazon SageMaker Lakehouse yang baru membuat saya bersemangat dengan potensinya untuk meningkatkan dan menyatukan akses ke danau data atau sumber data lainnya di layanan seperti Amazon Redshift, Katalog Data AWS Glue, dan AWS Lake Formation. Inovasi ini membantu tim data dan tim teknik kami menyederhanakan akses data, mendorong interoperabilitas di seluruh data, analitik, dan beban kerja aplikasi. Saya memperkirakan pengurangan kesalahan data yang signifikan melalui penyalinan data yang lebih sedikit, pengurangan waktu pemrosesan sebanyak 40%, penulisan kembali data analitik yang lebih cepat ke sistem transaksional untuk pengambilan keputusan yang lebih baik, dan pemberdayaan tim kami untuk fokus menciptakan nilai bisnis."

Yannick Misteli, Head of Engineering, Global Product Strategy, Roche

Blue outline logo with the word 'Roche' in the center, displayed within a hexagonal border on a transparent background.

Idealista

Idealista mendukung agen real estate dan perorangan di seluruh Eropa Selatan dengan menyediakan platform iklan baris real estate daring.

“Tujuan kami adalah menyederhanakan akses ke data Salesforce untuk peningkatan analitik di danau data kami. Dengan memanfaatkan dukungan Amazon SageMaker Lakehouse baru untuk integrasi nol-ETL dari fitur aplikasi, kami dapat menyederhanakan proses ekstraksi dan penyerapan data, sehingga menghilangkan kebutuhan akan banyak ETL untuk mengakses Salesforce secara langsung. Pendekatan terpusat ini mengurangi kompleksitas dan secara signifikan meningkatkan efisiensi manajemen data kami. Hasilnya, kami memperkirakan tercapainya penghematan waktu yang signifikan dalam ekstraksi data dan pengembangan penyerapan, yang memungkinkan tim kami untuk fokus pada perolehan wawasan yang dapat ditindaklanjuti dari data, bukan sekadar pengelolaan pengumpulan data saja."

Javier Monterrubio, Data Platform Engineer Manager, Idealista

The word 'idealista' displayed in a pixel-style, black font on a white background.

Carrier

"Di Carrier, Amazon SageMaker generasi terbaru mentransformasi strategi data korporasi kami dengan menyederhanakan cara kami membangun dan menskalakan produk data. Pendekatan Studio Terpadu SageMaker untuk penemuan, pemrosesan, dan pengembangan model data telah secara signifikan mengakselerasi implementasi lakehouse kami. Hal yang paling mengesankan, integrasinya yang lancar dengan katalog data kami yang ada serta kontrol tata kelola bawaannya memungkinkan kami untuk mendemokratisasi akses data sambil mempertahankan standar keamanan, sehingga membantu tim kami dengan cepat memberikan analitik dan solusi AI canggih di seluruh korporasi."

Missing alt text value

Partner

Tableau

Tableau membantu orang dan organisasi menjadi lebih berbasis data.

“Kemitraan antara Amazon dan Salesforce Tableau merupakan komitmen bersama terhadap inovasi dan kesuksesan pelanggan. Melalui integrasi nol-ETL baru Amazon, kami menggabungkan data dan analitik bertenaga AI Tableau dengan infrastruktur data Amazon yang canggih untuk mengubah cara organisasi memperoleh wawasan dari data mereka. Integrasi yang mulus ini memungkinkan pelanggan kami memperoleh wawasan dari semua data terstruktur maupun tak terstruktur mereka menggunakan kekuatan Amazon SageMaker Lakehouse dan Amazon Redshift, yang secara drastis mengurangi kerumitan rekayasa dan waktu deployment. Bersama-sama, Tableau dan Amazon membantu pelanggan mempercepat transformasi digital dan meningkatkan nilai bisnis dalam skala besar.”

Ali Tore, Senior VP, Advanced Analytics, Tableau

The image shows the Tableau logo with a colorful, geometric icon followed by the word 'Tableau' in stylized blue text.

dbt Labs

dbt Labs memiliki misi untuk membantu analis menciptakan dan menyebarluaskan pengetahuan organisasi.

"Kami telah lama menjadi standar transformasi setelah Amazon Redshift, dengan menawarkan fleksibilitas, kolaborasi, dan kepercayaan. Dengan Amazon SageMaker Lakehouse yang baru, kami gembira dapat memperluas nilai ini ke lebih banyak pelanggan dan lebih banyak data di lingkungan AWS. Sekarang, pelanggan dapat mengakses semua data mereka di seluruh sistem AWS, termasuk gudang data dan danau data. Kami senang dapat menggabungkan kemampuan kami dengan Amazon SageMaker baru untuk menyediakan tata kelola, pembuatan katalog, dan pengoptimalan data bagi pelanggan bersama kami.”

Shawn Toldo, VP Partnerships, dbt Labs

The DataRobot company logo with a red and black design.

Informatica

Informatica, pemimpin dalam manajemen data cloud bertenaga AI korporasi, menghidupkan data dan AI dengan memberdayakan bisnis untuk mewujudkan kekuatan transformatif dari aset mereka yang paling penting.

“Platform Intelligent Data Management Cloud (IDMC) dan Amazon SageMaker kami membantu berbagai organisasi menggali potensi data sekaligus mendorong inovasi dan efisiensi. Sebagai partner peluncuran Amazon SageMaker Lakehouse, kami bangga dapat menghadirkan solusi tingkat perusahaan yang memenuhi standar tinggi organisasi modern berbasis data. Bersama infrastruktur AWS, kami bisa membuat keputusan yang lebih cepat dan tepat untuk hasil yang berdampak di seluruh industri.”

Pratik Parekh, SVP Product Management, Informatica

The logo for Informatica, featuring an orange geometric shape with a blue arrow and the company name 'Informatica' in modern font.