Amazon SageMaker generasi berikutnya dibangun menggunakan arsitektur lakehouse terbuka yang mengintegrasikan semua data Anda di berbagai danau data Amazon Simple Storage Service (Amazon S3), termasuk Tabel S3, dan gudang data Amazon Redshift, sehingga membantu Anda membangun analitik dan aplikasi AI/ML yang andal dengan satu salinan data. Anda hanya membayar sumber daya yang digunakan di lakehouse tersebut. Penyimpanan metadata dan permintaan API mengikuti harga Katalog Data AWS Glue, termasuk AWS Tingkat Free. Biaya penyimpanan dan komputasi data bergantung pada apakah Anda menggunakan Amazon S3 atau Amazon Redshift Managed Storage (RMS). Harga sumber daya dasar dijelaskan di bawah ini.

Metadata: Definisi data disusun dalam hierarki logis katalog, basis data, dan tabel menggunakan Katalog Data AWS Glue.

  • Katalog: Kontainer logis yang menampung objek dari penyimpanan data, seperti skema, tabel, tampilan, atau tampilan terwujud dari Amazon Redshift. Anda dapat menumpuk katalog di bawah katalog untuk mencocokkan tingkat hierarki dari sumber data yang Anda bawa ke lakehouse.
  • Basis Data: Basis data dapat digunakan untuk mengatur objek data, seperti tabel dan tampilan di lakehouse.
  • Tabel dan tampilan: Tabel dan tampilan: Tabel dan tampilan adalah objek data dalam basis data yang menjelaskan cara mengakses data dasar, seperti skema, partisi, lokasi penyimpanan, format penyimpanan, dan kueri SQL untuk mengakses data.

Metadata di lakehouse dapat diakses dari API AWS Glue. Untuk penyimpanan metadata dan permintaan API, harga metadata Katalog Data AWS Glue berlaku, termasuk AWS Tingkat Free. Untuk informasi lebih lanjut, kunjungi harga AWS Glue.

Penyimpanan dan akses data: Saat mengakses data di lakehouse, Anda dapat membaca dan menulis data ke Amazon S3 atau RMS. Berdasarkan jenis penyimpanan yang Anda pilih untuk menyimpan data di lakehouse, Anda akan dikenai biaya penyimpanan dan komputasi tambahan untuk mengakses penyimpanan yang mendasarinya. Kunjungi harga AWS Glue untuk detail lebih lanjut tentang harga penyimpanan dan komputasi untuk jenis penyimpanan.

Statistik dan pemeliharaan tabel Apache Iceberg: Anda dapat mengotomatiskan pengumpulan statistik pada tabel danau data di Amazon S3 untuk eksekusi kueri yang lebih cepat dan pemeliharaan tabel Apache Iceberg, seperti pemadatan, untuk mengoptimalkan tata letak penyimpanan tabel Apache Iceberg Anda. Anda akan dikenai biaya tambahan saat mengaktifkan fitur ini. Untuk informasi lebih lanjut, kunjungi harga AWS Glue.

Izin: Izin terperinci didukung oleh AWS Lake Formation dan disediakan tanpa biaya tambahan. Untuk detail lebih lanjut, kunjungi harga Lake Formation.

Biaya integrasi nol-ETL

SageMaker memiliki integrasi nol-ETL dengan aplikasi, menghilangkan kebutuhan untuk membangun dan mengelola pipeline extract, transform, and load (ETL). Aplikasi yang didukung termasuk Salesforce, ServiceNow, Zendesk, dan banyak lagi.

Integrasi ini memberi Anda fleksibilitas, sehingga Anda dapat memilih tabel data tertentu dalam aplikasi untuk direplikasi otomatis ke Amazon Redshift. Fleksibilitas ini memungkinkan Anda menjalankan analitik terpadu di berbagai aplikasi dan sumber data. AWS tidak mengenakan biaya tambahan untuk integrasi nol-ETL. Anda membayar sumber daya yang ada yang digunakan untuk membuat dan memproses data perubahan yang dibuat sebagai bagian dari integrasi nol-ETL. Ini termasuk penyimpanan Amazon Redshift tambahan untuk menyimpan data replikasi, sumber daya komputasi untuk memproses replikasi data (atau RPU di Amazon Redshift Nirserver), dan biaya transfer data lintas-AZ untuk memindahkan data dari sumber ke target. Pemrosesan perubahan data yang berkelanjutan melalui integrasi nol-ETL ditawarkan tanpa biaya tambahan. Untuk informasi lebih lanjut, kunjungi harga Amazon Aurora, harga Amazon Relational Database (Amazon RDS) untuk MySQL, harga Amazon DynamoDB, dan harga AWS Glue.