資料湖倉定價

新一代 Amazon SageMaker 在開放式資料湖架構上建置,可在 Amazon Simple Storage Service (Amazon S3) 資料湖中整合所有資料,包括 S3 Tables,以及 Amazon Redshift 資料倉儲,從而協助您在單一資料複本上建置強大的分析和 AI/ML 應用程式。您只需為在資料湖倉中使用的資源付費。中繼資料儲存和 API 請求遵循 AWS Glue Data Catalog 定價,包括 AWS 免費方案。資料儲存和運算成本取決於您選擇的 Amazon S3 或 Amazon Redshift Managed Storage (RMS)。基礎資源的定價如下所述。

中繼資料︰資料定義使用 AWS Glue Data Catalog 以型錄、資料庫和資料表的邏輯層次結構進行組織。

  • 型錄:一種邏輯容器,用於儲存資料存放區中的物件,例如來自 Amazon Redshift 的結構描述、資料表、檢視或具體化視觀表。您可以在型錄下方嵌套型錄,以使其與資料來源的層次結構相對應。
  • 資料庫:資料庫可用於組織資料湖倉中的資料物件 (例如資料表和檢視)。
  • 資料表與檢視:資料表與檢視是資料庫中的資料物件,描述如何存取底層資料,例如結構描述、分割區、儲存位置、儲存格式以及存取資料的 SQL 查詢。

資料湖倉的中繼資料可透過 AWS Glue API 進行存取。對於中繼資料儲存和 API 請求,適用 AWS Glue Data Catalog 中繼資料定價,包括 AWS 免費方案。如需詳細資訊,請參閱 AWS Glue 定價。

資料儲存與存取:您可在存取資料湖倉資料的同時,在 Amazon S3 或 RMS 中讀取和寫入資料。根據您選擇在資料湖倉中儲存資料的儲存類型,存取底層儲存將產生額外的儲存和運算費用。如需進一步了解各儲存類型的儲存和運算定價,請參閱 AWS Glue 定價。

統計和 Apache Iceberg 資料表維護:您可以自動收集 Amazon S3 中資料湖資料表的統計資訊,以加快查詢執行和 Apache Iceberg 資料表維護 (例如壓縮) 速度,以最佳化 Apache Iceberg 資料表的儲存配置。啟用這些功能將產生額外費用。如需詳細資訊,請參閱 AWS Glue 定價。

許可︰採用 AWS Lake Formation 技術的精細許可,並且無需額外付費。如需詳細資訊,請參閱 Lake Formation 定價。

零 ETL 整合費用

SageMaker 與應用程式實現零 ETL 整合,讓您無需建置和管理擷取、轉換和載入 (ETL) 管道。支援的應用程式包括 Salesforce、ServiceNow、Zendesk 等。

這些整合可為您提供靈活性,讓您可以選擇應用程式中的特定資料表,以自動複製到 Amazon Redshift。這種靈活性可讓您跨多個應用程式和資料來源執行統一分析。AWS 不會對零 ETL 整合收取額外費用。您需要為使用資源,建立和處理做為零 ETL 整合一部分而建立的變更資料付費。這包括用於存放覆寫資料的額外 Amazon Redshift 儲存體、處理資料複寫的運算資源 (或 RPUs on Amazon Redshift Serverless),以及將資料從來源移至目標的跨可用區域資料傳送成本。透過零 ETL 整合持續處理資料變更,而無需額外費用。如需詳細資訊,請參閱 Amazon Aurora 定價Amazon Relational Database (Amazon RDS) for MySQL 定價Amazon DynamoDB 定價AWS Glue 定價