Amazon SageMaker Lakehouse รุ่นใหม่สร้างขึ้นบนสถาปัตยกรรม Lakehouse แบบเปิดที่รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon Simple Storage Service (Amazon S3) รวมถึง S3 Tables และคลังข้อมูล Amazon Redshift ซึ่งช่วยให้คุณสร้างการวิเคราะห์และแอปพลิเคชัน AI/ML ที่มีประสิทธิภาพบนสำเนาข้อมูลเดียว คุณชำระค่าบริการเฉพาะทรัพยากรที่คุณใช้ใน Lakehouse เท่านั้น การจัดเก็บข้อมูลเมตาและการร้องขอ API เป็นไปตามราคาแค็ตตาล็อกข้อมูลของ AWS Glue รวมถึง AWS Free Tier ค่าใช้จ่ายในการจัดเก็บและประมวลผลข้อมูลจะขึ้นอยู่กับตัวเลือกของ Amazon S3 หรือ Amazon Redshift Managed Storage (RMS) ราคาของทรัพยากรพื้นฐานอธิบายไว้ด้านล่าง

ข้อมูลเมตา: คำจำกัดความของข้อมูลจะได้รับการจัดระเบียบไว้ในลำดับชั้นเชิงตรรกะของแค็ตตาล็อก ฐานข้อมูล และตารางโดยใช้แค็ตตาล็อกข้อมูลของ AWS Glue

  • แค็ตตาล็อก: คอนเทนเนอร์เชิงตรรกะที่เก็บออบเจ็กต์จากที่เก็บข้อมูล เช่น สคีมา ตาราง มุมมอง หรือมุมมองผลการสืบค้นจาก Amazon Redshift คุณสามารถซ้อนแค็ตตาล็อกไว้ภายใต้แคตตาล็อกเพื่อให้ตรงกับระดับลำดับชั้นจากแหล่งที่มาของข้อมูลที่คุณนำไปที่ Lakehouse
  • ฐานข้อมูล: สามารถใช้ฐานข้อมูลในการจัดระเบียบออบเจ็กต์ข้อมูล เช่น ตารางและมุมมองใน Lakehouse
  • ตารางและมุมมอง: ตารางและมุมมอง: ตารางและมุมมองเป็นออบเจ็กต์ข้อมูลในฐานข้อมูลที่อธิบายวิธีเข้าถึงข้อมูลพื้นฐาน เช่น สคีมา พาร์ติชัน ตำแหน่งที่จัดเก็บข้อมูล รูปแบบการจัดเก็บ และการสืบค้น SQL เพื่อเข้าถึงข้อมูล

ข้อมูลเมตาใน Lakehouse สามารถเข้าถึงได้จาก AWS Glue API การจัดเก็บข้อมูลเมตาและคำขอ API จะเป็นไปตามราคาข้อมูลเมตาในแค็ตตาล็อกข้อมูลของ AWS Glue ซึ่งรวมถึง AWS Free Tier ด้วย ดูข้อมูลเพิ่มเติมได้ที่ราคาของ AWS Glue

การจัดเก็บและการเข้าถึงข้อมูล: ในขณะที่เข้าถึงข้อมูลใน Lakehouse คุณจะสามารถอ่านและเขียนข้อมูลลงใน Amazon S3 หรือ RMS ได้ โดยจะมีค่าใช้จ่ายในการประมวลผลและจัดเก็บข้อมูลเพิ่มเติมสำหรับการเข้าถึงพื้นที่เก็บข้อมูลพื้นฐาน ทั้งนี้จะขึ้นอยู่กับประเภทการจัดเก็บที่คุณเลือกจัดเก็บข้อมูลไว้ใน Lakehouse ดูรายละเอียดเพิ่มเติมเกี่ยวกับราคาพื้นที่เก็บข้อมูลและการประมวลผลสำหรับการจัดเก็บประเภทต่างๆ ได้ที่ราคาของ AWS Glue

การบำรุงรักษาตาราง Apache Iceberg และสถิติ: คุณสามารถทำให้การเก็บรวบรวมสถิติเกี่ยวกับตาราง Data Lake ใน Amazon S3 เป็นระบบอัตโนมัติ เพื่อให้การดำเนินการสืบค้นและการบำรุงรักษาตาราง Apache Iceberg เร็วขึ้น เช่น การบีบอัด ซึ่งจะช่วยเพิ่มประสิทธิภาพเค้าโครงการจัดเก็บของตาราง Apache Iceberg จะมีค่าบริการเพิ่มเติมเมื่อคุณเปิดใช้งานฟีเจอร์เหล่านี้ ดูข้อมูลเพิ่มเติมได้ที่ราคาของ AWS Glue

สิทธิ์: สิทธิ์แบบละเอียดได้รับการขับเคลื่อนโดย AWS Lake Formation และมีให้โดยไม่เสียค่าใช้จ่ายเพิ่มเติม ดูรายละเอียดเพิ่มเติมได้ที่ราคาของ Lake Formation

ค่าใช้จ่ายการบูรณาการ ETL แบบไร้รอยต่อ

SageMaker มีการบูรณาการ ETL แบบไร้รอยต่อกับแอปพลิเคชัน ซึ่งจะขจัดความจำเป็นในการสร้างและจัดการไปป์ไลน์กระบวนการ Extract, Transform and Load (ETL) แอปพลิเคชันที่รองรับ ได้แก่ Salesforce, ServiceNow, Zendesk และอื่น ๆ

การผสานรวมเหล่านี้ช่วยให้คุณมีความยืดหยุ่น คุณจึงสามารถเลือกตารางข้อมูลที่เฉพาะเจาะจงในแอปพลิเคชันเพื่อจำลองไปยัง Amazon Redshift โดยอัตโนมัติ ความยืดหยุ่นนี้ทำให้คุณสามารถเรียกใช้การวิเคราะห์แบบครบวงจรกับแอปพลิเคชันและแหล่งที่มาของข้อมูลต่าง ๆ ได้ AWS ไม่เรียกเก็บค่าธรรมเนียมเพิ่มเติมสำหรับการบูรณาการ ETL แบบไร้รอยต่อ คุณจะจ่ายค่าทรัพยากรที่มีอยู่ที่ใช้ในการสร้างและประมวลผลข้อมูลการเปลี่ยนแปลงที่สร้างขึ้นโดยเป็นส่วนหนึ่งของการบูรณาการ ETL แบบไร้รอยต่อ ซึ่งรวมถึงพื้นที่เก็บข้อมูล Amazon Redshift เพิ่มเติมสำหรับการจัดเก็บข้อมูลจำลอง ทรัพยากรการประมวลผลสำหรับการประมวลผลการจำลองข้อมูล (หรือ RPU บน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์) และค่าใช้จ่ายในการถ่ายโอนข้อมูล Cross-AZ สำหรับการย้ายข้อมูลจากต้นทางไปยังเป้าหมาย การประมวลผลการเปลี่ยนแปลงข้อมูลอย่างต่อเนื่องโดยการบูรณาการ ETL แบบไร้รอยต่อจะไม่มีค่าใช้จ่ายเพิ่มเติม ดูข้อมูลเพิ่มเติมได้ที่ราคาของ Amazon Aurora ราคา Amazon Relational Database (Amazon RDS) สำหรับ MySQL ราคาของ Amazon DynamoDB และ AWS Glue