- การวิเคราะห์›
- Amazon SageMaker›
- Lakehouse Architecture
สถาปัตยกรรมบ้านทะเลสาบของ Amazon SageMaker
ลดความซับซ้อนในการวิเคราะห์และ AI ด้วยสถาปัตยกรรมข้อมูลแบบครบวงจร เปิด และปลอดภัย
ภาพรวม
Amazon SageMaker รุ่นถัดไปสร้างขึ้นบนสถาปัตยกรรมบ้านทะเลสาบแบบเปิดซึ่งเข้ากันได้กับ Apache Iceberg อย่างสมบูรณ์ รวมข้อมูลทั้งหมดของคุณเข้าด้วยกันใน Amazon Simple Storage Service (Amazon S3) รวมถึง S3 Tables และ Amazon Redshift คลังข้อมูล ช่วยให้คุณสร้างการวิเคราะห์และแอปพลิเคชัน AI/ML ที่มีประสิทธิภาพบนสำเนาข้อมูลเดียว เข้าถึงและสืบค้นข้อมูลของคุณในสถานที่ได้อย่างยืดหยุ่นด้วยเครื่องมือและเครื่องมือที่รองรับ Apache Iceberg ทั้งหมด รักษาความปลอดภัยข้อมูลของคุณด้วยการกำหนดสิทธิ์แบบละเอียดซึ่งบังคับใช้ในเครื่องมือและเครื่องมือการวิเคราะห์และการเรียนรู้ของเครื่อง (ML) ทั้งหมด นำข้อมูลจากฐานข้อมูลการดำเนินงานและแอปพลิเคชันเข้าสู่ Lakehouse ของคุณแบบแทบจะเรียลไทม์ผ่านการบูรณาการ ETL แบบไร้รอยต่อ นอกจากนี้ ให้เรียกใช้แบบสอบถามแบบรวมกลุ่มกับข้อมูลที่เก็บไว้ในแหล่งที่มาของบุคคลที่สามหลายแหล่งเพื่อเข้าถึงและสอบถามข้อมูลของคุณในสถานที่
ดูการทำงาน
ดูวิธีที่คุณสามารถเข้าถึงข้อมูลแบบรวมจากคลังข้อมูล S3, S3 Tables และคลังข้อมูล Redshift ในบ้านทะเลสาบข้อมูลที่เปิดและปลอดภัย
ประโยชน์
รวมข้อมูลทั้งหมดของคุณในทะเลสาบข้อมูล Amazon S3 รวมถึง S3 Tables และคลังข้อมูล Amazon Redshift นำข้อมูลของคุณจากฐานข้อมูลการดำเนินงานและแอปพลิเคชันเข้าสู่ Lakehouse ได้แบบแทบจะเรียลไทม์ผ่านการผสานรวม ETL แบบไร้รอยต่อ คุณสามารถใช้ตัวเชื่อมต่อหลายร้อยตัวเพื่อผสานรวมข้อมูลจากแหล่งต่าง ๆ นอกจากนี้ คุณยังสามารถเข้าถึงและสืบค้นข้อมูลในตัวได้ด้วยความสามารถในการสืบค้นที่เชื่อมโยงกับส่วนกลางในแหล่งที่มาของข้อมูลจากภายนอก
รับความยืดหยุ่นในการเข้าถึงและสืบค้นข้อมูลของคุณในสถานที่ด้วยเครื่องมือวิเคราะห์และเครื่องมือวิเคราะห์ที่รองรับ Apache Iceberg ทั้งหมด เช่น SQL, Apache Spark, business intelligence (BI) และเครื่องมือ AI/ML เพื่อเข้าถึงข้อมูลแบบรวมในบ้านทะเลสาบของคุณ
กรณีการใช้งาน
รวมข้อมูลทั้งหมดของคุณใน Data Lake ของ Amazon S3 และคลังข้อมูล Amazon Redshift เพื่อการวิเคราะห์และการความคิดริเริ่มด้าน AI ด้วยสำเนาข้อมูลเดียว การควบคุมการเข้าถึงแบบบูรณาการช่วยให้คุณสามารถกำหนดสิทธิ์แบบละเอียดและแบ่งปันสำเนาข้อมูลเดียวได้อย่างปลอดภัยทั่วทั้งองค์กร
เข้าถึงข้อมูลแบบเรียลไทม์ในฐานข้อมูลและแอปพลิเคชันที่ใช้งานได้ผ่านการผสานรวม Zero-ETL เข้าถึงและสืบค้นข้อมูลของคุณในตัวจากบริการ AWS ที่หลากหลาย รวมถึงเครื่องมือและเอนจินแบบโอเพนซอร์สและจากภายนอกที่รองรับ Apache Iceberg
นำข้อมูลที่มีอยู่จากคลังข้อมูลของ Amazon Redshift หลายแห่งไปยังเลคเฮาส์เพื่อสืบค้นและรวมข้อมูลที่เก็บไว้ในคลัสเตอร์และเวิร์กกรุ๊ป Amazon Redshift ปรับขนาดเวิร์กโหลดของคุณสำหรับกระบวนการ Extract, Transform and Load (ETL), การรายงาน BI และการวิเคราะห์ตามความจำเป็นโดยไม่ต้องจัดการการแชร์ข้อมูลหลายรายการ
ลูกค้า
Lennar
"เราใช้เวลา 18 เดือนที่ผ่านมาทำงานร่วมกับ AWS เพื่อเปลี่ยนรากฐานข้อมูลของเราเป็นโซลูชันที่ดีที่สุดและคุ้มค่าด้วย ความก้าวหน้าอย่างสตูดิโอแบบครบวงจรของ Amazon SageMaker และ Amazon SageMaker Lakehouse เราเร่งความเร็วในการส่งมอบผ่านการเข้าถึงข้อมูลและบริการได้อย่างราบรื่น ซึ่งเปิดโอกาสให้วิศวกร นักวิเคราะห์ และนักวิทยาศาสตร์ของเราสามารถค้นหาข้อมูลเชิงลึกที่มอบค่านิยมทางวัตถุให้กับธุรกิจของเรา"
Lee Slezak รองประธานอาวุโสฝ่ายข้อมูลและการวิเคราะห์ของ Lennar
Roche
Roche เป็นผู้บุกเบิกระดับโลกด้านเภสัชกรรมและการวินิจฉัยที่มุ่งเน้นไปที่การพัฒนาวิทยาศาสตร์เพื่อปรับปรุงคุณภาพชีวิตของผู้คน
“เราใช้ Amazon Redshift เพื่อรับข้อมูลเชิงลึกจากข้อมูลทั้งแบบมีโครงสร้างและแบบกึ่งมีโครงสร้างในทั่วทุกที่เก็บข้อมูลของเรา Amazon SageMaker Lakehouse ใหม่ทำให้ผมรู้สึกตื่นเต้นไปกับศักยภาพในการปรับปรุงและรวมการเข้าถึง Data Lake หรือแหล่งที่มาของข้อมูลอื่น ๆ ให้เป็นหนึ่งเดียวด้วยบริการอย่าง Amazon Redshift, แค็ตตาล็อกข้อมูลของ AWS Glue และ AWS Lake Formation นวัตกรรมนี้จะช่วยให้ทีมข้อมูลและวิศวกรรมของเราสามารถลดความซับซ้อนในการเข้าถึงข้อมูล ส่งเสริมการทำงานร่วมกันระหว่างข้อมูล การวิเคราะห์ และเวิร์กโหลดแอปพลิเคชัน ฉันคาดการณ์ว่าข้อผิดพลาดของข้อมูลจะลดลงอย่างเห็นได้ชัดด้วยการคัดลอกข้อมูลน้อยลง โดยเวลาในการประมวลผลลดลงถึง 40% การเขียนข้อมูลการวิเคราะห์กลับไปยังระบบธุรกรรมได้เร็วขึ้นเพื่อการตัดสินใจที่ดียิ่งขึ้น และทำให้ทีมของเราสามารถโฟกัสไปที่การสร้างมูลค่าทางธุรกิจได้”
Yannick Misteli หัวหน้าฝ่ายวิศวกรรมประจำแผนกกลยุทธ์ผลิตภัณฑ์ระดับโลกของ Roche
Idealista
Idealista สนับสนุนตัวแทนอสังหาริมทรัพย์และบุคคลธรรมดาทั่วยุโรปตอนใต้โดยจัดหาแพลตฟอร์มโฆษณาอสังหาริมทรัพย์ออนไลน์
“เป้าหมายของเราคือการเพิ่มประสิทธิภาพการเข้าถึงข้อมูล Salesforce เพื่อการวิเคราะห์ที่ดียิ่งขึ้นใน Data Lake ของเรา เราใช้ประโยชน์จากการสนับสนุน Amazon SageMaker Lakehouse ใหม่สำหรับการบูรณาการ ETL แบบไร้รอยต่อจากฟีเจอร์แอปพลิเคชัน เราสามารถจะทำให้กระบวนการแยกข้อมูลและการนำข้อมูลเข้าง่ายขึ้นเพื่อขจัดความจำเป็นในการใช้ ETL หลายรายการในการเข้าถึง Salesforce โดยตรง แนวทางแบบรวมศูนย์นี้ไช่วยลดความซับซ้อนเท่านั้น และยังช่วยปรับปรุงประสิทธิภาพการจัดการข้อมูลของเราได้อย่างมีนัยสำคัญด้วย เราคาดว่าจะประหยัดเวลาในการดึงข้อมูลและการพัฒนาการนำข้อมูลเข้าได้เป็นอย่างมาก ซึ่งจะทำให้ทีมของเราสามารถมุ่งเน้นไปที่การรับข้อมูลเชิงลึกที่สามารถดำเนินการได้จากข้อมูลของเราแทนที่จะต้องจัดการกับการเก็บรวบรวมข้อมูล”
Javier Monterrubio ผู้จัดการวิศวกรแพลตฟอร์มข้อมูลของ Idealista
Carrier
"ที่ Carrier ซอฟต์แวร์ Amazon SageMaker รุ่นถัดไปกำลังเปลี่ยนแปลงกลยุทธ์ข้อมูลองค์กรของเราโดยปรับปรุงวิธีการสร้างและปรับขนาดผลิตภัณฑ์ข้อมูล" แนวทางของ SageMaker Unified Studio ในการค้นพบข้อมูล การประมวลผล และการพัฒนาแบบจำลองช่วยเร่งการใช้งาน Lakehouse ของเราได้อย่างมาก ที่น่าประทับใจที่สุดคือการผสานรวมที่ราบรื่นกับแคตตาล็อกข้อมูลที่มีอยู่และการควบคุมการกำกับดูแลในตัวช่วยให้เรากระจายการเข้าถึงข้อมูลได้อย่างเท่าเทียมกันในขณะที่ยังคงมาตรฐานความปลอดภัยไว้ ช่วยให้ทีมงานของเราส่งมอบการวิเคราะห์ขั้นสูงและโซลูชัน AI ทั่วทั้งองค์กรได้อย่างรวดเร็ว"
คู่ค้า
Tableau
Tableau ช่วยให้ผู้คนและองค์กรสามารถขับเคลื่อนด้วยข้อมูลได้มากขึ้น
“ความร่วมมือระหว่าง Amazon และ Salesforce Tableau แสดงถึงความมุ่งมั่นที่มีร่วมกันต่อนวัตกรรมและความสำเร็จของลูกค้า เรากำลังผสมผสานข้อมูลและการวิเคราะห์ที่ขับเคลื่อนด้วย AI ของ Tableau เข้ากับโครงสร้างพื้นฐานข้อมูลอันทรงพลังของ Amazon เพื่อเปลี่ยนวิธีที่องค์กรรับข้อมูลเชิงลึกจากข้อมูลของตนเอง โดยผ่านการบูรณาการ ETL แบบไร้รอยต่อใหม่ของ Amazon การบูรณาการที่ราบรื่นนี้จะช่วยให้ลูกค้าของเราได้รับข้อมูลเชิงลึกจากข้อมูลทั้งหมดของตนเองทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง โดยใช้ประสิทธิภาพของ Amazon SageMaker Lakehouse และ Amazon Redshift ซึ่งจะลดความซับซ้อนทางวิศวกรรมและเวลาในการนำไปใช้จริงได้อย่างมาก Tableau และ Amazon ร่วมกันช่วยให้ลูกค้าสามารถเร่งการเปลี่ยนผ่านสู่ระบบดิจิทัลและขับเคลื่อนมูลค่าทางธุรกิจได้ในวงกว้าง“
Ali Tore รองประธานอาวุโส ฝ่ายวิเคราะห์ขั้นสูงของ Tableau
dbt Labs
dbt Labs มีพันธกิจที่จะช่วยให้นักวิเคราะห์สามารถสร้างและเผยแพร่ความรู้ขององค์กรได้
"เราเป็นมาตรฐานการเปลี่ยนแปลงที่เพิ่มเติมจาก Amazon Redshift มานานแล้ว เรานำเสนอความยืดหยุ่น ความร่วมมือ และความน่าเชื่อถือ Amazon SageMaker Lakehouse ใหม่ ทำให้เรารู้สึกตื่นเต้นที่จะได้ขยายคุณค่านี้ให้กับลูกค้าจำนวนมากขึ้นหรือแม้แต่ข้อมูลปริมาณมากขึ้นในสภาพแวดล้อม AWS ตอนนี้ลูกค้าสามารถเข้าถึงข้อมูลทั้งหมดของตนเองในทั่วทั้งระบบ AWS รวมถึงคลังข้อมูลและ Data Lake เรารู้สึกตื่นเต้นที่จะได้นำความสามารถของเราเข้าร่วมกับ Amazon SageMaker ใหม่ เพื่อส่งมอบการกำกับดูแล การจัดแค็ตตาล็อก และการเพิ่มประสิทธิภาพข้อมูลให้กับลูกค้าร่วมของเรา”
Shawn Toldo รองประธานฝ่ายความร่วมมือของ dbt Labs
Informatica
Informatica ผู้นำด้านการจัดการข้อมูลบนคลาวด์ที่ขับเคลื่อนด้วย AI สำหรับองค์กรใช้ประโยชน์จากข้อมูลและ AI โดยการเสริมศักยภาพให้ธุรกิจตระหนักถึงพลังการเปลี่ยนแปลงของสินทรัพย์ที่สำคัญที่สุดของตน
“แพลตฟอร์ม Intelligent Data Management Cloud (IDMC) ของเราและ Amazon SageMaker ช่วยให้องค์กรสามารถปลดล็อกศักยภาพของข้อมูลและขับเคลื่อนนวัตกรรมและประสิทธิภาพ ในฐานะพาร์ทเนอร์เปิดตัว Amazon SageMaker Lakehouse เราภูมิใจที่ได้ส่งมอบโซลูชันระดับองค์กรที่ตรงตามมาตรฐานสูงขององค์กรที่ขับเคลื่อนด้วยข้อมูลที่ทันสมัย เมื่อทำงานร่วมกับโครงสร้างพื้นฐานของ AWS เราสามารถช่วยให้ตัดสินใจได้อย่างมีข้อมูลและรวดเร็วขึ้น เพื่อให้ได้ผลลัพธ์ที่ส่งผลทั่วทั้งอุตสาหกรรม”
Pratik Parekh รองประธานอาวุโส (SVP) ฝ่ายการจัดการผลิตภัณฑ์ของ Informatica