Lewati ke Konten Utama

Apa itu Penyimpanan Basis Data?

Apa itu Penyimpanan Basis Data?

Data dapat disimpan dalam basis data untuk pengambilan dan analisis di masa mendatang. Ada banyak opsi penyimpanan basis data yang berbeda dengan kompromi kontrol dan fleksibilitas. Panduan ini membahas berbagai model penyimpanan di AWS dan menawarkan panduan untuk memilih model yang paling cocok untuk kasus penggunaan khusus Anda.

Semua data digital harus disimpan pada perangkat fisik di suatu tempat, seperti di RAM, cache, register, atau pada solid-state drive (SSD) atau hard disk drive (HDD), pada penyimpanan yang terhubung ke jaringan (NAS) dan jaringan area penyimpanan (SAN), atau dalam tipe penyimpanan fisik lainnya. Penyimpanan data cloud bergantung pada perangkat fisik yang mendasarinya yang menjalankan penyimpanan logis menggunakan virtualisasi di atasnya.

Agar sebagian besar data korporasi berguna, Anda harus menyimpannya dalam basis data. Sistem manajemen basis data adalah lapisan perangkat lunak yang berada di atas data yang disimpan. Lapisan perangkat lunak ini memungkinkan Anda untuk melakukan operasi, seperti membuat basis data, melakukan kueri dan menganalisis data, dan memperbarui serta menghapus data. Perangkat lunak basis data dapat disimpan secara fisik terpisah dari data itu sendiri.

Bagaimana cara kerja penyimpanan basis data relasional?

Basis data relasional menyimpan data dalam format tabel, terdiri dari baris dan kolom, di mana setiap baris mewakili catatan dan setiap kolom dalam catatan tersebut adalah atribut. Struktur data tabel basis data menyimpan catatan umum, berulang, dan yang terkait, seperti detail pelanggan atau catatan pembelian. Setiap tabel dapat dikaitkan dengan tabel lain sebagai relasi: catatan pembelian dapat memiliki hubungan dengan pelanggan terkait.

Perangkat lunak basis data relasional yang berjalan di atas tabel ini mengelola kaitan melalui kunci primer dan asing. Hal ini memungkinkan pengguna untuk melakukan operasi pembuatan, baca, pembaruan, penghapusan, dan tulis, serta melakukan kueri data dalam tabel menggunakan Structured Query Language (SQL).

Menyimpan basis data relasional dan data terstruktur yang mendasarinya bergantung pada sistem manajemen basis data relasional (RDBMS) mana yang digunakan untuk membuat basis data, karena produk perangkat lunak yang berbeda menangani penyimpanan data secara berbeda. Contohnya termasuk SQL Server, MySQL, PostgreSQL, Oracle, dan MariaDB.

Penyimpanan basis data relasional terkelola

AWS menawarkan penyimpanan basis data relasional terkelola dan sistem operasi untuk berbagai sistem manajemen basis data relasional. Manfaat menggunakan layanan terkelola termasuk mengurangi waktu yang dihabiskan untuk manajemen dan pemeliharaan infrastruktur, serta meningkatkan keamanan.

Amazon Relational Database Service

Amazon Relational Database Service (RDS) adalah layanan terkelola untuk sistem, seperti PostgreSQL, MySQL, MariaDB, SQL Server, Oracle, dan Db2. Amazon RDS menangani tugas manajemen basis data, seperti penyediaan, patching, pencadangan, pemulihan, deteksi kegagalan, dan perbaikan, serta mudah diatur dan di-deploy.

Untuk penyimpanan, Amazon RDS menawarkan tiga pilihan tipe volume Amazon Elastic Block Store (Amazon EBS) yang mendasarinya.

  • Penyimpanan yang didukung SSD tujuan umum untuk sebagian besar beban kerja basis data,
  • Penyimpanan yang didukung SSD IOPS yang disediakan beperforma tinggi, dan 
  • Penyimpanan data magnetik untuk kompatibilitas mundur.

Amazon Aurora

Amazon Aurora adalah layanan terkelola cloud-native untuk basis data relasional PostgreSQL, MySQL, dan DSQL. Aurora didesain untuk memaksimalkan manfaat penuh dari konfigurasi cloud, termasuk pengelompokan dan distribusi, sehingga menghadirkan performa yang lebih tinggi, ketersediaan tinggi, dan toleransi kesalahan dibandingkan dengan layanan RDBMS berbasis cloud tradisional.

Untuk penyimpanan, data Amazon Aurora disimpan dalam volume klaster, volume virtual kustom tunggal yang didukung oleh SSD, dengan data ini direplikasi di tiga Zona Ketersediaan yang berbeda dalam wilayah AWS untuk integritas data maksimum dan redundansi data. Amazon Aurora DSQL menawarkan redundansi multiwilayah untuk mempertahankan akses ke data saat titik akhir regional tidak tersedia. Karena penyimpanan Aurora bersifat eksklusif, penyimpanan ini menyediakan konfigurasi kustom dengan penskalaan otomatis penuh dan dikelola sepenuhnya oleh AWS, sehingga menghilangkan kebutuhan untuk kustomisasi penyimpanan berbasis pengguna.

Penyimpanan basis data relasional yang dikelola sendiri

RDBMS dan penyimpanan yang dikelola sendiri di AWS melibatkan tugas administrasi sistem tradisional serta tugas manajemen basis data. Alih-alih melakukan tugas ini pada infrastruktur fisik, Anda perlu melakukan tugas di infrastruktur cloud.

Amazon EC2 memungkinkan Anda mengatur dan mengonfigurasikan instans untuk semua tipe sistem manajemen basis data relasional. Mengkonfigurasikan dan menjalankan instans EC2 memerlukan tugas seperti manajemen keamanan, konfigurasi performa, pemantauan, serta pemeliharaan. 

Untuk penyimpanan yang mendasarinya, Anda dapat memilih dari Amazon EBS, Amazon Elastic File System (EFS) untuk penyimpanan yang sepenuhnya elastis, dan penyimpanan instans sementara. Anda dapat memilih antara volume besar dan kecil untuk penyimpanan, tergantung pada kebutuhan basis data Anda.

Bagaimana cara kerja penyimpanan basis data nonrelasional?

Basis data nonrelasional, juga dikenal sebagai basis data NoSQL, menyimpan, mengakses, dan memodelkan data dengan cara yang berbeda dari basis data relasional, memanfaatkan struktur data yang berbeda. Berbagai basis data nonrelasional mendukung kasus penggunaan yang berbeda, dengan setiap penyimpanan data didesain dengan struktur basis data yang berbeda.

Basis data nonrelasional meliputi: basis data nilai-kunci, basis data dokumen, basis data kolom lebar, basis data grafik, basis data dalam memori, dan basis data pencarian.

Basis data nonrelasional terkelola

AWS menawarkan berbagai layanan terkelola untuk setiap tipe basis data nonrelasional.

  • Amazon DynamoDB adalah penyimpanan nilai kunci terkelola dan layanan basis data dokumen yang memanfaatkan penyimpanan kustom berbasis SSD terdistribusi di balik layar.
  • Amazon DocumentDB (dengan kompatibilitas MongoDB) adalah layanan terkelola basis data dokumen JSON native yang menggunakan penyimpanan kustom berbasis SSD terdistribusi.
  • Amazon Keyspaces (untuk Apache Cassandra) adalah layanan terkelola basis data kolom lebar yang kompatibel dengan Apache Cassandra yang menggunakan penyimpanan kustom berbasis SSD terdistribusi.
  • Amazon Neptune adalah layanan terkelola basis data grafik dengan penyimpanan kustom berbasis SSD terdistribusi.  
  • Amazon MemoryDB adalah layanan basis data dalam memori yang kompatibel dengan Valkey dan Redis OSS dengan penyimpanan kustom berbasis SSD terdistribusi. 
  • Amazon ElastiCache adalah layanan caching dalam memori yang kompatibel dengan cache dalam memori Valkey, Redis, dan Memcached, didukung oleh RAM serta penyimpanan data EBS.  

Amazon DynamoDB, Amazon DocumentDB, Amazon Keyspaces, Amazon Neptune, dan Amazon MemoryDB semuanya menggunakan tipe penyimpanan kustom berpemilik yang didukung SSD.

Meskipun Amazon ElastiCache memanfaatkan penyimpanan EBS, Amazon ElastiCache tidak menawarkan pilihan berbasis penyimpanan atau akses pengguna ke penyimpanan tingkat file. ElastiCache adalah basis data nonrelasional tipe cache.

Basis data nonrelasional yang dikelola sendiri

Mengkonfigurasikan dan menyimpan basis data nonrelasional di AWS mengikuti pola infrastruktur yang mirip dengan yang digunakan untuk basis data relasional. 

Anda dapat menggunakan instans EC2 untuk menjalankan semua tipe basis data NoSQL, termasuk MongoDB, Redis, dan HBase. Data yang mendasarinya dapat disimpan di Amazon EBS, Amazon Elastic File System (EFS) untuk penyimpanan yang sepenuhnya elastis, dan penyimpanan instans sementara, tergantung pada kasus penggunaan Anda.

Apa tipe penyimpanan basis data lainnya?

Tidak semua data korporasi cocok dengan format basis data relasional atau nonrelasional, dan analitik modern sering dapat mengakomodasi tipe data semiterstruktur dan tidak terstruktur lainnya. 

Misalnya, Anda dapat menyimpan data semiterstruktur dalam file data Apache Avro di Amazon S3 dan menganalisis data apa adanya, daripada merestrukturisasi data agar sesuai dengan basis data. Anda dapat menggunakan S3 sebagai solusi penyimpanan untuk tipe data apa pun.

Bagaimana cara memilih antara tipe penyimpanan basis data?

Memutuskan antara menggunakan layanan basis data terkelola versus layanan yang dikelola sendiri menentukan pilihan Anda dalam penyimpanan data.

Kontrol lingkungan penuh

Organisasi yang mencari kontrol penuh atas lingkungan basis data mereka harus memilih solusi basis data yang dikelola sendiri di AWS. Anda dapat menggunakan basis data dan penyimpanan yang dikelola sendiri untuk basis data relasional serta nonrelasional. Menggunakan solusi yang dikelola sendiri berbasis EC2, Anda dapat langsung mengakses data yang mendasarinya di penyimpanan sistem file, baik data disimpan di EBS, EFS, atau penyimpanan instans.

Mengurangi overhead

Layanan terkelola menawarkan sedikit atau tanpa kustomisasi dalam hal tempat dan cara data disimpan, tetapi sebagai gantinya overhead yang terkait dengan manajemen infrastruktur mengalami pengurangan. Organisasi biasanya bermigrasi ke cloud untuk mendapatkan akses ke layanan terkelola, sehingga mengurangi kebutuhan untuk manajemen dan pemeliharaan infrastruktur. 

Namun, ada kasus penggunaan di mana organisasi memerlukan akses tingkat file ke data basis data yang mendasarinya. Misalnya, aplikasi yang sudah ada mungkin mengakses data langsung dari file, sistem yang terisolasi mungkin memerlukan konfigurasi ini, atau kewajiban integritas data kepatuhan mungkin menuntut akses tingkat file.

Memilih layanan basis data terkelola versus konfigurasi basis data yang dikelola sendiri tergantung pada kasus penggunaan unik dari setiap basis data. Mempertimbangkan dengan cermat setiap basis data dalam organisasi Anda, termasuk konfigurasi dan persyaratan yang sudah ada, membantu memandu proses pengambilan keputusan. 

Solusi Anda harus menyertakan sistem cadangan yang memenuhi persyaratan redundansi data jika terjadi kegagalan sistem.

Bagaimana AWS dapat mendukung kebutuhan penyimpanan basis data Anda?

Penyimpanan basis data di AWS lebih mudah jika Anda memilih layanan basis data terkelola. Setiap layanan terkelola menangani penyimpanan untuk Anda, menangani data secara efisien tanpa konfigurasi tambahan dari administrator. Menggunakan layanan terkelola berarti AWS adalah manajer penyimpanan tanpa keterlibatan Anda.

Jika mengambil pendekatan yang dikelola sendiri untuk basis data di AWS, Anda memiliki kontrol atas cara Anda ingin menyimpan data. Pendekatan yang dikelola sendiri memungkinkan akses dan pengambilan data langsung dari penyimpanan fisik.

Baik melakukan migrasi MySQL atau membuat penyimpanan nilai kunci baru, jelajahi opsi basis data Anda di AWS

Mulailah membangun infrastruktur basis data modern yang sesuai dengan kebutuhan Anda dengan membuat akun gratis di AWS sekarang juga.