ข้ามไปที่เนื้อหาหลัก

พื้นที่เก็บข้อมูลฐานข้อมูลคืออะไร

การจัดเก็บฐานข้อมูลคืออะไร

ข้อมูลสามารถจัดเก็บไว้ในฐานข้อมูลเพื่อดึงและวิเคราะห์ในอนาคต มีตัวเลือกการจัดเก็บฐานข้อมูลที่แตกต่างกันมากมายพร้อมการควบคุมและความยืดหยุ่น คู่มือนี้จะตรวจสอบรูปแบบการจัดเก็บข้อมูลต่าง ๆ บน AWS และให้คำแนะนำในการเลือกรูปแบบที่เหมาะสมที่สุดสำหรับกรณีการใช้งานเฉพาะของคุณ

ข้อมูลดิจิทัลทั้งหมดจะต้องถูกจัดเก็บไว้ในอุปกรณ์ทางกายภาพที่ไหนสักแห่ง เช่น RAM, แคช รีจิสเตอร์ หรือบนไดรฟ์โซลิดสเตต (SSD) หรือฮาร์ดดิสก์ไดรฟ์ (HDD) บนอุปกรณ์เก็บข้อมูลแบบเชื่อมต่อกับเครือข่าย (NAS) และเครือข่ายพื้นที่เก็บข้อมูล (SAN) หรือในพื้นที่เก็บข้อมูลทางกายภาพประเภทอื่น พื้นที่เก็บข้อมูลบนคลาวด์ขึ้นอยู่กับอุปกรณ์ทางกายภาพพื้นฐานที่เรียกใช้พื้นที่เก็บข้อมูลเชิงตรรกะโดยใช้การจำลองเสมือนทับซ้อนอยู่ด้านบน

เพื่อให้ข้อมูลองค์กรส่วนใหญ่มีประโยชน์คุณต้องเก็บข้อมูลไว้ในฐานข้อมูล ระบบการจัดการฐานข้อมูลเป็นเลเยอร์ซอฟต์แวร์ที่อยู่ด้านบนของข้อมูลที่เก็บไว้ เลเยอร์ซอฟต์แวร์นี้ช่วยให้คุณสามารถดำเนินการต่าง ๆ เช่น การสร้างฐานข้อมูล การสืบค้นและการวิเคราะห์ข้อมูล และการอัปเดตและการลบข้อมูล ซอฟต์แวร์ฐานข้อมูลสามารถจัดเก็บแยกต่างหากทางกายภาพจากตัวข้อมูลเองได้

พื้นที่เก็บฐานข้อมูลแบบเชิงสัมพันธ์ทำงานอย่างไร

ฐานข้อมูลแบบเชิงสัมพันธ์เก็บข้อมูลในรูปแบบตารางซึ่งประกอบด้วยแถวและคอลัมน์ โดยที่แต่ละแถวแสดงถึงระเบียนและแต่ละคอลัมน์ภายในบันทึกนั้นเป็นแอตทริบิวต์ โครงสร้างข้อมูลของตารางฐานข้อมูลเก็บระเบียนทั่วไป ระเบียนซ้ำ ๆ และระเบียนที่เกี่ยวข้อง เช่น รายละเอียดของลูกค้าหรือบันทึกการซื้อ แต่ละตารางสามารถเชื่อมโยงกับตารางอื่นเป็นความสัมพันธ์: ระเบียนการซื้ออาจมีความสัมพันธ์กับลูกค้าที่เกี่ยวข้อง

ซอฟต์แวร์ฐานข้อมูลแบบเชิงสัมพันธ์ที่ทำงานด้านบนของตารางเหล่านี้จัดการการเชื่อมโยงผ่านคีย์หลักและคีย์นอก ช่วยให้ผู้ใช้สามารถดำเนินการสร้าง อ่าน อัปเดต ลบ และเขียนและสืบค้นข้อมูลภายในตารางโดยใช้ Structured Query Language (SQL)

การจัดเก็บฐานข้อมูลแบบเชิงสัมพันธ์และข้อมูลที่มีโครงสร้างพื้นฐานขึ้นอยู่กับระบบการจัดการฐานข้อมูลแบบเชิงสัมพันธ์ (RDBMS) ที่ใช้ในการสร้างฐานข้อมูล เนื่องจากผลิตภัณฑ์ซอฟต์แวร์ที่แตกต่างกันเข้าใกล้พื้นที่เก็บข้อมูลแตกต่างกัน ตัวอย่าง ได้แก่ SQL Server, MySQL, PostgreSQL, Oracle และ MariaDB

พื้นที่เก็บฐานข้อมูลแบบเชิงสัมพันธ์ที่มีการจัดการ

AWS นำเสนอพื้นที่เก็บฐานข้อมูลแบบเชิงสัมพันธ์ที่จัดการและระบบปฏิบัติการสำหรับระบบการจัดการฐานข้อมูลแบบเชิงสัมพันธ์ต่าง ๆ ประโยชน์ของการใช้บริการที่มีการจัดการรวมถึงการลดเวลาที่ใช้ในการจัดการและบำรุงรักษาโครงสร้างพื้นฐาน และการเพิ่มความปลอดภัยให้สูงขึ้น

บริการฐานข้อมูลแบบเชิงสัมพันธ์ของ Amazon

Amazon Relational Database Service (RDS) เป็นบริการที่มีการจัดการสำหรับระบบเช่น PostgreSQL, MySQL, MariaDB, SQL Server, Oracle และ Db2 Amazon RDS จัดการงานการจัดการฐานข้อมูล เช่น การจัดเตรียม การ การแพตช์ การสำรองข้อมูล การกู้คืน การตรวจจับความล้มเหลว และการซ่อมแซม และสามารถตั้งค่าและปรับใช้ได้อย่างง่ายดาย

สำหรับพื้นที่เก็บข้อมูล Amazon RDS เสนอ ประเภทโวลุ่ม Amazon Elastic Block Store (Amazon EBS) ที่แตกต่างกันสามประเภท

  • พื้นที่เก็บข้อมูลที่รองรับ SSD เอนกประสงค์สำหรับเวิร์กโหลดฐานข้อมูลส่วนใหญ่
  • พื้นที่เก็บข้อมูลที่รองรับ IOPS SSD ที่จัดสรรไว้ที่มีประสิทธิภาพสูงและ 
  • พื้นที่เก็บข้อมูลแม่เหล็กเพื่อความเข้ากันได้ย้อนหลัง

Amazon Aurora

Amazon Aurora เป็นบริการที่มีการจัดการ Cloud-Native สำหรับฐานข้อมูลแบบเชิงสัมพันธ์ PostgreSQL, MySQL และ DSQL Aurora ได้รับการออกแบบมาเพื่อเพิ่มประสิทธิภาพสูงสุดจากรูปแบบการตั้งค่าบนคลาวด์ ซึ่งรวมถึงการทำคลัสเตอร์และการกระจายตัวของข้อมูล ทำให้มีประสิทธิภาพที่สูงขึ้น มีความพร้อมใช้งานสูง และมีความสามารถในการทนต่อความเสียหาย (Fault tolerance) เมื่อเปรียบเทียบกับบริการ RDBMS บนคลาวด์แบบดั้งเดิม

สำหรับพื้นที่เก็บข้อมูล ข้อมูล Amazon Aurora จะถูกเก็บไว้ในโวลุ่มคลัสเตอร์ ซึ่งเป็นโวลุ่มเสมือนเดี่ยวที่ปรับแต่งขึ้นมาเป็นพิเศษและขับเคลื่อนด้วย SSD โดยข้อมูลนี้จะถูกทำแบบจำลองไปยัง Availability Zone สามแห่งที่แตกต่างกันภายใน AWS Region เพื่อให้เกิดความสมบูรณ์ของข้อมูลและความซ้ำซ้อนของข้อมูลสูงสุด Amazon Aurora DSQL มอบความซ้ำซ้อนของข้อมูลแบบหลายภูมิภาค เพื่อรักษาการเข้าถึงข้อมูลเมื่อตำแหน่งข้อมูลของภูมิภาคไม่สามารถใช้งานได้ เนื่องจากพื้นที่เก็บข้อมูลของ Aurora เป็นกรรมสิทธิ์เฉพาะ จึงมีการกำหนดค่าที่ปรับแต่งมาเป็นพิเศษพร้อมการปรับขนาดอัตโนมัติอย่างเต็มรูปแบบ และได้รับการจัดการโดย AWS อย่างสมบูรณ์ ทำให้ไม่จำเป็นต้องมีการปรับแต่งพื้นที่จเก็บข้อมูลโดยผู้ใช้อีกต่อไป

พื้นที่เก็บฐานข้อมูลแบบเชิงสัมพันธ์ที่มีการจัดการด้วยตนเอง

RDBMS และพื้นที่เก็บข้อมูลที่จัดการด้วยตนเองบน AWS เกี่ยวข้องกับการบริหารระบบและการจัดการฐานข้อมูลแบบดั้งเดิม แทนที่จะทำงานเหล่านี้บนโครงสร้างพื้นฐานทางกายภาพของคุณ คุณต้องทำงานบนโครงสร้างพื้นฐานในระบบคลาวด์

Amazon EC2 อนุญาตให้คุณสามารถตั้งค่าและกำหนดค่าอินสแตนซ์สำหรับระบบการจัดการฐานข้อมูลแบบเชิงสัมพันธ์ประเภทใดก็ได้ การกำหนดค่าและเรียกใช้อินสแตนซ์ EC2 ต้องใช้งานต่าง ๆ เช่น การจัดการการรักษาความปลอดภัย การกำหนดค่าประสิทธิภาพ การตรวจสอบและการบำรุงรักษา 

สำหรับพื้นที่เก็บข้อมูลพื้นฐาน คุณสามารถเลือกจาก Amazon EBS, Amazon Elastic File System (EFS) สำหรับพื้นที่เก็บข้อมูลแบบยืดหยุ่นเต็มรูปแบบและพื้นที่เก็บอินสแตนซ์ชั่วคราว คุณสามารถเลือกระหว่างโวลุ่มขนาดใหญ่และโวลุ่มขนาดเล็กสำหรับพื้นที่เก็บข้อมูลขึ้นอยู่กับความต้องการของฐานข้อมูลของคุณ

พื้นที่เก็บฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์ทำงานอย่างไร

ฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์หรือที่เรียกว่าฐานข้อมูล NoSQL จัดเก็บ เข้าถึง และสร้างแบบจำลองข้อมูลที่แตกต่างจากฐานข้อมูลแบบเชิงสัมพันธ์ โดยใช้โครงสร้างข้อมูลที่แตกต่างกัน ฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์ที่หลากหลายรองรับกรณีการใช้งานที่แตกต่างกัน โดยที่จัดเก็บข้อมูลแต่ละแห่งได้รับการออกแบบด้วยโครงสร้างฐานข้อมูลที่แตกต่างกัน

ฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์ประกอบด้วย: ฐานข้อมูลที่เก็บคีย์-ค่า ฐานข้อมูลแบบโครงสร้างเอกสาร ฐานข้อมูลแบบคอลัมน์กว้าง ฐานข้อมูลแบบกราฟ ฐานข้อมูลแบบใช้หน่วยความจำ และฐานข้อมูลการค้นหา

ฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์ที่มีการจัดการ

AWS นำเสนอบริการที่มีการจัดการที่หลากหลายสำหรับฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์แต่ละประเภท

  • Amazon DynamoDB เป็นบริการฐานข้อมูลแบบโครงสร้างเอกสารและพื้นที่จัดเก็บข้อมูลแบบคีย์-ค่าที่มีการจัดการ ซึ่งใช้หน่วยจัดเก็บข้อมูลแบบ SSD แบบกระจายที่ปรับแต่งขึ้นมาเองเป็นพื้นฐานการทำงานหลักภายใน
  • Amazon DocumentDB (พร้อมฟังก์ชันการทำงานร่วมกับ MongoDB) เป็นบริการจัดการฐานข้อมูลแบบโครงสร้างเอกสาร JSON ดั้งเดิมที่ใช้พื้นที่เก็บข้อมูลแบบกำหนดเองแบบกระจายที่ใช้ SSD
  • Amazon Keyspaces (สำหรับ Apache Cassandra) เป็นบริการจัดการฐานข้อมูลคอลัมน์กว้างที่เข้ากันได้กับ Apache Cassandra ซึ่งใช้พื้นที่เก็บข้อมูลแบบกำหนดเองแบบกระจายที่ใช้ SSD
  • Amazon Neptune เป็นบริการจัดการฐานข้อมูลแบบกราฟพร้อมพื้นที่เก็บข้อมูลแบบกำหนดเองแบบกระจายแบบ SSD  
  • Amazon MemoryDB เป็นบริการฐานข้อมูลแบบใช้หน่วยความจำที่เข้ากันได้กับ Valkey และ Redis OS พร้อมที่เก็บข้อมูลแบบกำหนดเองแบบกระจายที่ใช้ SSD 
  • Amazon ElastiCache เป็นบริการแคชแบบใช้หน่วยความจำที่เข้ากันได้กับแคชแบบใช้หน่วยความจำ Valkey, Redis และ Memcached ซึ่งได้รับการสนับสนุนโดยพื้นที่เก็บข้อมูล RAM และ EBS  

Amazon DynamoDB, Amazon DocumentDB, Amazon Keyspaces, Amazon Neptune และ Amazon MemoryDB ทั้งหมดใช้ SSD ที่เป็นกรรมสิทธิ์เฉพาะและได้รับการปรับแต่งมาเป็นพิเศษทุกบริการ

แม้ว่า Amazon ElastiCache จะใช้ประโยชน์จากที่เก็บข้อมูล EBS แต่ก็ไม่ได้เสนอตัวเลือกตามที่เก็บข้อมูลหรือผู้ใช้เข้าถึงที่เก็บข้อมูลระดับไฟล์ ElasticAche เป็นฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์ประเภทแคช

ฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์ที่มีการจัดการด้วยตนเอง

การกำหนดค่าและจัดเก็บฐานข้อมูลแบบไม่ใช่เชิงสัมพันธ์บน AWS เป็นไปตามรูปแบบโครงสร้างพื้นฐานที่คล้ายคลึงกับที่ใช้สำหรับฐานข้อมูลแบบเชิงสัมพันธ์ 

คุณสามารถใช้อินสแตนซ์ EC2 เพื่อเรียกใช้ฐานข้อมูล NoSQL ทุกประเภท รวมถึง MongoDB, Redis และ hBase ข้อมูลพื้นฐานสามารถจัดเก็บไว้ใน Amazon EBS, Amazon Elastic File System (EFS) เพื่อการจัดเก็บข้อมูลที่ยืดหยุ่นเต็มรูปแบบและพื้นที่เก็บอินสแตนซ์ชั่วคราวขึ้นอยู่กับกรณีการใช้งานของคุณ

พื้นที่เก็บข้อมูลฐานข้อมูลประเภทอื่น ๆ คืออะไร

ข้อมูลระดับองค์กรบางส่วนไม่ได้เหมาะสมกับรูปแบบฐานข้อมูลเชิงสัมพันธ์หรือฐานข้อมูลที่ไม่ใช่เชิงสัมพันธ์เสมอไป และการวิเคราะห์สมัยใหม่มักจะรองรับประเภทข้อมูลแบบกึ่งมีโครงสร้างและข้อมูลที่ไม่มีโครงสร้างอื่น ๆ ได้ด้วย 

ตัวอย่างเช่น คุณสามารถจัดเก็บข้อมูลแบบกึ่งมีโครงสร้างในไฟล์ข้อมูล Apache Avro บน Amazon S3 และวิเคราะห์ข้อมูลตามที่เป็นอยู่แทนที่จะปรับโครงสร้างข้อมูลให้เหมาะสมกับฐานข้อมูล คุณสามารถใช้ S3 เป็นโซลูชันพื้นที่เก็บข้อมูลทุกประเภท

จะเลือกประเภทพื้นที่เก็บข้อมูลของฐานข้อมูลอย่างไร

การตัดสินใจระหว่างการใช้บริการฐานข้อมูลที่มีการจัดการกับบริการที่จัดการด้วยตนเองจะเป็นตัวกำหนดตัวเลือกที่คุณมีในพื้นที่เก็บข้อมูล

การควบคุมสภาพแวดล้อมเต็มรูปแบบ

องค์กรที่ต้องการควบคุมสภาพแวดล้อมฐานข้อมูลอย่างเต็มที่ต้องเลือกใช้โซลูชันฐานข้อมูลที่มีการจัดการด้วยตนเองบน AWS คุณสามารถใช้ฐานข้อมูลและพื้นที่เก็บข้อมูลที่มีการจัดการด้วยตนเองสำหรับทั้งฐานข้อมูลแบบเชิงสัมพันธ์และแบบไม่ใช่เชิงสัมพันธ์ การใช้โซลูชัน EC2 ที่มีการจัดการด้วยตนเอง คุณสามารถเข้าถึงข้อมูลพื้นฐานในพื้นที่เก็บข้อมูลในระบบไฟล์ของคุณได้โดยตรง ไม่ว่าจะจัดเก็บไว้ใน EBS, EFS หรือพื้นที่เก็บอินสแตนซ์

ค่าใช้จ่ายทั่วไปลง

บริการที่มีการจัดการให้การปรับแต่งที่น้อยมากหรือแทบไม่มีเลยในแง่ของสถานที่และวิธีการเก็บข้อมูล แต่สิ่งที่จะได้กลับมาคือค่าใช้จ่ายทั่วไปที่ลดลงซึ่งเกี่ยวข้องกับการจัดการและการบำรุงรักษาโครงสร้างพื้นฐาน โดยทั่วไปแล้วองค์กรต่าง ๆ จะย้ายไปสู่คลาวด์เพื่อเข้าถึงบริการที่มีการจัดการ ซึ่งช่วยลดความจำเป็นในการจัดการและบำรุงรักษาโครงสร้างพื้นฐาน 

อย่างไรก็ตาม มีบางกรณีการใช้งานที่องค์กรต่าง ๆ จำเป็นต้องเข้าถึงข้อมูลในระดับไฟล์ของข้อมูลพื้นฐานในฐานข้อมูล ตัวอย่างเช่น แอปพลิเคชันที่มีอยู่อาจเข้าถึงข้อมูลโดยตรงจากไฟล์ ระบบที่ถูกแยกออกจากเครือข่ายภายนอกอาจจำเป็นต้องใช้การตั้งค่านี้ หรือข้อผูกพันด้านความสมบูรณ์ของข้อมูลตามการปฏิบัติตามข้อกำหนดอาจต้องมีการเข้าถึงในระดับไฟล์

การเลือกระหว่างบริการฐานข้อมูลที่มีการจัดการกับการกำหนดค่าฐานข้อมูลที่มีการจัดการด้วยตนเองนั้น ขึ้นอยู่กับกรณีการใช้งานเฉพาะตัวของแต่ละฐานข้อมูล การพิจารณาแต่ละฐานข้อมูลภายในองค์กรของคุณอย่างระมัดระวังรวมถึงการกำหนดค่าและข้อกำหนดที่มีอยู่ จะช่วยแนะนำกระบวนการตัดสินใจของคุณ 

โซลูชันของคุณต้องมีระบบสำรองข้อมูลที่ตรงตามข้อกำหนดความซ้ำซ้อนของข้อมูลในกรณีที่ระบบสำหรับความล้มเหลว

AWS สามารถรองรับความต้องการพื้นที่เก็บฐานข้อมูลของคุณได้อย่างไร

พื้นที่เก็บฐานข้อมูลบน AWS นั้นตรงไปตรงไปกว่าหากคุณเลือกบริการฐานข้อมูลที่มีการจัดการ บริการที่มีการจัดการแต่ละบริการจะดูแลเรื่องการจัดเก็บข้อมูลให้คุณ โดยจัดการข้อมูลอย่างมีประสิทธิภาพโดยไม่ต้องมีการกำหนดค่าเพิ่มเติมจากผู้ดูแลระบบของคุณ การใช้บริการที่มีการจัดการหมายความว่า AWS เป็นผู้จัดการพื้นที่เก็บข้อมูลแบบที่คุณไม่ต้องเข้าไปแตะต้อง

หากคุณเลือกใช้วิธีการจัดการฐานข้อมูลด้วยตนเองบน AWS คุณจะมีอำนาจในการควบคุมรูปแบบที่คุณต้องการจัดเก็บข้อมูลได้อย่างเต็มที่ แนวทางการจัดการด้วยตนเองช่วยให้สามารถเข้าถึงและดึงข้อมูลได้โดยตรงจากหน่วยจัดเก็บข้อมูลทางกายภาพ

ไม่ว่าคุณจะทำการย้าย MySQL หรือสร้างที่เก็บค่าคีย์ใหม่ ให้สำรวจตัวเลือกฐานข้อมูลของคุณบน AWS 

เริ่มต้นด้วยการสร้างโครงสร้างพื้นฐานฐานข้อมูลที่ทันสมัยที่เหมาะกับความต้องการของคุณโดยการสร้างบัญชีฟรีบน AWS วันนี้