Kiến trúc Lakehouse

Định giá Lakehouse

Tổng quan

Thế hệ Amazon SageMaker mới được xây dựng dựa trên kiến trúc lakehouse mở, thống nhất tất cả dữ liệu của bạn trên các hồ dữ liệu Amazon Simple Storage Service (Amazon S3), bao gồm Bảng S3, và kho dữ liệu Amazon Redshift, từ đó giúp bạn xây dựng các ứng dụng phân tích và AI/ML mạnh mẽ trên một bản sao dữ liệu duy nhất. Bạn chỉ phải trả tiền cho các tài nguyên bạn sử dụng trong lakehouse. Dung lượng lưu trữ siêu dữ liệu và yêu cầu API tuân theo mức giá của Danh mục dữ liệu AWS Glue, bao gồm Bậc miễn phí của AWS. Chi phí lưu trữ dữ liệu và điện toán phụ thuộc vào việc bạn chọn Amazon S3 hay Amazon Redshift Managed Storage (RMS). Cách định giá các tài nguyên cơ bản được mô tả dưới đây.

Giá cả

Siêu dữ liệu

Các định nghĩa dữ liệu được sắp xếp theo hệ thống phân cấp logic gồm danh mục, cơ sở dữ liệu và bảng bằng AWS Glue Data Catalog.

Danh mục: Một vùng chứa logic chứa các đối tượng từ kho dữ liệu như lược đồ, bảng, chế độ xem hoặc chế độ xem cụ thể hóa từ Amazon Redshift. Bạn có thể lồng nhiều danh mục trong một danh mục để khớp với các cấp độ phân cấp từ nguồn dữ liệu mà bạn mang đến lakehouse.
Cơ sở dữ liệu: Cơ sở dữ liệu có thể được sử dụng để tổ chức các đối tượng dữ liệu như bảng và chế độ xem trong hồ.
Bảng và chế độ xem: Bảng và chế độ xem là các đối tượng dữ liệu trong cơ sở dữ liệu mô tả cách truy cập dữ liệu cơ bản như lược đồ, phân vùng, vị trí lưu trữ, định dạng lưu trữ và truy vấn SQL để truy cập dữ liệu.

Bạn có thể truy cập siêu dữ liệu trong lakehouse bằng API của AWS Glue. Đối với dung lượng lưu trữ siêu dữ liệu và yêu cầu API, mức giá cho siêu dữ liệu của Danh mục dữ liệu AWS Glue sẽ được áp dụng, bao gồm Bậc miễn phí của AWS. Để biết thêm thông tin, vui lòng truy cập định giá AWS Glue.

Lưu trữ và truy cập dữ liệu

Trong khi truy cập dữ liệu trong hồ, bạn có thể đọc và ghi dữ liệu vào Amazon S3 hoặc RMS. Dựa trên hình thức lưu trữ bạn muốn sử dụng để lưu trữ dữ liệu trong lakehouse, bạn sẽ phải chịu thêm chi phí lưu trữ và điện toán để truy cập bộ nhớ cơ bản. Vui lòng truy cập định giá AWS Glue để biết thêm chi tiết về mức giá lưu trữ và điện toán cho các loại lưu trữ.

Thống kê và bảo trì bảng Apache Iceberg

Bạn có thể tự động hóa việc thu thập số liệu thống kê trên các bảng hồ dữ liệu trong Amazon S3 để thực thi truy vấn nhanh hơn và bảo trì bảng Apache Iceberg, chẳng hạn như nén, để tối ưu hóa bố cục lưu trữ của các bảng Apache Iceberg của bạn. Bạn sẽ phải chịu thêm phí khi bật các tính năng dưới đây. Để biết thêm thông tin, vui lòng truy cập định giá AWS Glue.

Quyền

Các quyền chi tiết được cung cấp bởi AWS Lake Formation và được cung cấp miễn phí. Để biết thêm chi tiết, vui lòng truy cập định giá Lake Formation.

Chi phí tích hợp không ETL

SageMaker tích hợp không ETL với các ứng dụng, loại bỏ nhu cầu xây dựng và quản lý các quy trình trích xuất, chuyển đổi và tải (ETL). Các ứng dụng được hỗ trợ bao gồm Salesforce, ServiceNow, Zendesk, v.v.

Các tích hợp này cung cấp cho bạn sự linh hoạt, vì vậy bạn có thể chọn các bảng dữ liệu cụ thể trong một ứng dụng để tự động sao chép vào Amazon Redshift. Sự linh hoạt này cho phép bạn chạy phân tích thống nhất trên nhiều ứng dụng và nguồn dữ liệu. AWS không tính thêm phí cho việc tích hợp không ETL. Bạn trả tiền cho các tài nguyên hiện tại được sử dụng để tạo và xử lý dữ liệu thay đổi được tạo trong quá trình tích hợp không ETL. Điều này bao gồm lưu trữ Amazon Redshift bổ sung để lưu trữ dữ liệu được sao chép, tài nguyên tính toán để xử lý sao chép dữ liệu (hoặc RPU trên Amazon Redshift Serverless) và chi phí truyền dữ liệu Cross-AZ để di chuyển dữ liệu từ nguồn sang mục tiêu. Dịch vụ xử lý liên tục các thay đổi dữ liệu bằng cách tích hợp không ETL được cung cấp mà không tính thêm phí. Để biết thêm thông tin, hãy truy cập Giá Amazon Aurora, Cơ sở dữ liệu Quan hệ Amazon (Amazon RDS) để biết giá MySQL, giá Amazon DynamoDB và định giá AWS Glue.