AWS Resilience Hub
จัดเตรียมและป้องกันแอปพลิเคชันของคุณไม่ให้มีการหยุดชะงัก
ประโยชน์
-
ตรวจสอบความถูกต้องและติดตามความยืดหยุ่นของแอปพลิเคชันอย่างต่อเนื่องเพื่อลดการหยุดทำงาน
-
ประเมินเป้าหมายด้านความยืดหยุ่น (ระยะเวลาที่ใช้ในการกู้คืนข้อมูลและจุดที่ย้อนกลับไปกู้คืนข้อมูลได้)
-
ระบุและแก้ไขปัญหาก่อนที่จะเกิดขึ้นในการทำงานจริง
-
ปรับความต่อเนื่องทางธุรกิจให้เหมาะสมไปพร้อมกับลดต้นทุนในการกู้คืน
วิธีการทำงาน
AWS Resilience Hub เป็นศูนย์กลางในคอนโซล AWS ให้คุณจัดการและปรับปรุงลักษณะความยืดหยุ่นของแอปพลิเคชันของคุณบน AWS AWS Resilience Hub ช่วยให้คุณสามารถกําหนดเป้าหมายความยืดหยุ่น ประเมินลักษณะความยืดหยุ่นของคุณเทียบกับเป้าหมายเหล่านั้น และใช้คําแนะนําสําหรับการปรับปรุงตามเฟรมเวิร์ก AWS Well-Architected ได้ ภายใน AWS Resilience Hub คุณยังสามารถสร้างและเรียกใช้การทดลองของบริการฉีดข้อผิดพลาดเพื่อทดสอบของ AWS (AWS FIS) ซึ่งเลียนแบบการหยุดชะงักในชีวิตจริงของแอปพลิเคชัน เพื่อช่วยให้คุณเข้าใจปพึ่งพาระบบได้ดีขึ้นและค้นพบจุดอ่อนที่อาจเกิดขึ้น
AWS Resilience Hub ให้บริการและเครื่องมือที่คุณต้องการเพื่อส่งเสริมความยืดหยุ่นของคุณอย่างต่อเนื่องและครบวงจร
ฟีเจอร์
อธิบายแอปพลิเคชันของคุณว่าเป็นชุดทรัพยากร เช่น CloudFormation stacks, Terraform state files, myApplications, หรือกลุ่มทรัพยากร หรือกำหนดแอปพลิเคชันสำหรับเวิร์กโหลด Kubernetes ที่จัดการบน Amazon EKS แอปพลิเคชันยังสามารถอธิบายโดยใช้ทั้งคอลเลกชันทรัพยากรและคลัสเตอร์ Amazon EKS ได้อีกด้วย
-
กำหนดนโยบายด้านความยืดหยุ่นให้กับแอปพลิเคชันของคุณ นโยบายเหล่านี้ประกอบด้วยเป้าหมายด้าน RTO และ RPO สำหรับแอปพลิเคชัน โครงสร้างพื้นฐาน Availability Zone และ การหยุดชะงักของภูมิภาค
การประเมินของ AWS Resilience Hub ใช้แนวทางปฏิบัติที่ดีที่สุดจากเฟรมเวิร์ก AWS Well-Architected เพื่อวิเคราะห์องค์ประกอบของแอปพลิเคชันและค้นหาจุดอ่อนด้านความยืดหยุ่นที่อาจเกิดขึ้น โดยจุดอ่อนเหล่านี้อาจเกิดจากการตั้งค่าโครงสร้างพื้นฐานที่ไม่สมบูรณ์ การกำหนดค่าที่ไม่ถูกต้อง หรือสถานการณ์ที่จำเป็นต้องได้รับการปรับปรุงการกำหนดค่าเพิ่มเติม
AWS Resilience Hub ให้คำแนะนำที่นำไปปฏิบัติได้จริงเพื่อปรับปรุงความยืดหยุ่น นอกจากนี้ การประเมินความยืดหยุ่นยังสร้างส่วนย่อยของโค้ดที่ช่วยให้คุณสร้างขั้นตอนการกู้คืนในรูปแบบเอกสารของ AWS Systems Manager สำหรับแอปพลิเคชันของคุณ ซึ่งเรียกว่าขั้นตอนมาตรฐานในการปฏิบัติงาน (Standard Operating Procedure - SOP) อีกด้วย AWS Resilience Hub จะสร้างรายการของการเฝ้าติดตามและการแจ้งเตือนของ Amazon CloudWatch ที่แนะนำ เพื่อช่วยให้ผู้ปฏิบัติงานสามารถระบุการเปลี่ยนแปลงใดๆ ต่อเสถียรภาพด้านความยืดหยุ่นของแอปพลิเคชันได้อย่างรวดเร็วเมื่อมีการปรับใช้แล้ว
หลังจากแอปพลิเคชันและ SOP ได้รับการอัปเดตเพื่อให้รวมสิ่งที่แนะนำจากการประเมินความยืดหยุ่นเรียบร้อยแล้ว คุณสามารถใช้ AWS Resilience Hub เพื่อทดสอบและยืนยันได้ว่าแอปพลิเคชันของคุณทำงานได้ตามเป้าหมายด้านความยืดหยุ่น ก่อนที่จะเผยแพร่เพื่อใช้งานจริง AWS Resilience Hub ผสานรวมบริการทดสอบความยืดหยุ่นของระบบต่อสถานการณ์รุนแรงอย่าง AWS Fault Injection Simulator (FIS) เพื่อป้อนความล้มเหลวในโลกแห่งความเป็นจริงลงในการจำลองสถานการณ์ที่มีการเพิ่มข้อผิดพลาดลงไป เพื่อตรวจสอบความถูกต้องว่าแอปพลิเคชันฟื้นตัวได้ภายในเป้าหมายด้านความสามารถในการกลับสู่สภาวะปกติตามที่กำหนดไว้ ข้อผิดพลาดที่ว่านี้อาจรวมถึงข้อผิดพลาดของเครือข่าย หรือการมีการเชื่อมต่อแบบเปิดจำนวนมากเกินไปยังฐานข้อมูลเพียงแห่งเดียว นอกจากนี้ AWS Resilience Hub ยังมี API ที่ช่วยให้คุณผสานรวมการประเมินและการทดสอบความยืดหยุ่นเข้ากับไปป์ไลน์ CI/CD เพื่อตรวจสอบความถูกต้องของความยืดหยุ่นอย่างต่อเนื่องได้อีกด้วย การผสานรวมการตรวจสอบความถูกต้องของความยืดหยุ่นเข้ากับไปป์ไลน์ CI/CD ช่วยให้มั่นใจได้ว่า การเปลี่ยนแปลงต่อโครงสร้างพื้นฐานที่จำเป็นของแอปพลิเคชันจะไม่ทำให้ความยืดหยุ่นต้องลดลง
กรณีการใช้งาน
ใช้การป้อนความล้มเหลวในโลกแห่งความเป็นจริงลงในการจำลองสถานการณ์ที่มีการเพิ่มข้อผิดพลาดลงไป เพื่อช่วยตรวจสอบประสิทธิภาพของขั้นตอนมาตรฐานในการปฏิบัติงาน (SOP) และการแจ้งเตือนสำหรับการกู้คืนข้อมูล
ให้คำแนะนำที่นำไปปฏิบัติได้เพื่อปรับปรุงความยืดหยุ่นและช่วยคุณสร้างขั้นตอนการกู้คืนข้อมูล
เก็บรักษาข้อมูลเส้นทางการตรวจสอบกิจกรรมระหว่างการหยุดทำงานทั้งตามแผนและนอกแผน เพื่อช่วยให้เป็นไปตามข้อกำหนดและการปฏิบัติตามกฎข้อบังคับ
ธนาคารอิคาโนะ
“ที่ Ikano Bank เราต้องการใช้ประโยชน์ของระบบคลาวด์ให้ได้อย่างเต็มที่ โดยเฉพาะความสามารถในกระบวนการกู้คืนจากความเสียหาย แต่ยังขาดความเชี่ยวชาญจากในองค์กรที่จะดำเนินการดังกล่าว AWS Resilience Hub ให้คำแนะนำที่ปรับแต่งโดยอิงจากเฟรมเวิร์ก AWS Well-Architected เพื่อให้แน่ใจว่าการดำเนินการของเราสอดคล้องกับแนวทางปฏิบัติที่ดีที่สุดเพื่อความเป็นเลิศในการดำเนินงานและความเสถียร ในฐานะสถาบันการเงิน สิ่งนี้ทำให้เรารู้สึกสบายใจว่าเรามีความยืดหยุ่นในระบบของเรา“
Carl Lundquist หัวหน้าฝ่ายปฏิบัติการและบริการด้านไอที ธนาคารอิคาโนะ
Pearson
Pearson ใช้ AWS Resilience Hub เพื่อปรับปรุงความยืดหยุ่นของแอปพลิเคชัน ดูวิดีโอ
“ด้วย AWS Resilience Hub เราสามารถดูว่าแอปพลิเคชันของเราทำอะไร... และถามตัวเองว่านี่เป็นแอปพลิเคชันที่สำคัญสำหรับภารกิจ หรือจะหยุดทำงานสักครู่ได้โดยไม่ส่งผลกระทบต่อการดำเนินงานของเรา' AWS Resilience Hub มีความสำคัญอย่างยิ่งต่อเรื่องนี้ เนื่องจากเราสามารถป้อนค่าข้อมูลเข้าไป และเข้าใจได้อย่างรวดเร็วว่าแอปพลิเคชันใดมีความสำคัญจริง ๆ ต่อ Pearson”
Ronnie Kendrick ผู้จัดการอาวุโส SRE ฝ่ายโครงสร้างพื้นฐานและการดำเนินงานของ Pearson
Aval Digital Labs
“ADL Digital Labs (ADL) ก่อตั้งขึ้นในปี 2017 และปัจจุบันเป็นหนึ่งในแพลตฟอร์มที่ดีที่สุดในการส่งเสริมผลิตภัณฑ์ดิจิทัลสำหรับอุตสาหกรรมบริการทางการเงินในลาตินอเมริกา ด้วยความตระหนักถึงความสำคัญของการส่งมอบโซลูชันที่มีความเชื่อถือได้สูงให้กับลูกค้า ADL จึงได้ร่วมใช้งาน AWS Resilience Hub เพื่อตรวจสอบและติดตามสถานะความยืดหยุ่นของแอปพลิเคชัน และรักษาการมองเห็นการปฏิบัติตามนโยบายและเป้าหมายความพร้อมใช้งานไปในขณะเดียวกัน การผสานการทำงานของ AWS Resilience Hub เข้ากับเฟรมเวิร์กความต่อเนื่องทางธุรกิจของ ADL ทำให้มีการตรวจสอบความยืดหยุ่นและความต่อเนื่องทางธุรกิจสำหรับช่องทางการทำธุรกรรม 8 ช่องทาง โดยให้บริการลูกค้าประมาณ 4 ล้านรายในองค์กรทางการเงินหลัก 4่ แห่งของโคลอมเบีย”
Alexander Chaparro หัวหน้าฝ่ายสถาปัตยกรรมของ Aval Digital Labs