Passer au contenu principal

Qu’est-ce que le stockage de base de données ?

Qu’est-ce que le stockage de base de données ?

Les données peuvent être stockées dans une base de données pour être récupérées et analysées ultérieurement. Il existe de nombreuses options de stockage de base de données avec des compromis entre contrôle et flexibilité. Ce guide examine différents modèles de stockage sur AWS et propose des conseils pour sélectionner celui qui convient le mieux à votre cas d’utilisation spécifique.

Toutes les données numériques doivent être stockées quelque part sur un périphérique physique, tel que dans la RAM, le cache, les registres, ou sur des disques SSD ou des disques durs, sur un stockage en réseau (NAS) et des réseaux de stockage (SAN), ou dans d’autres types de stockage physique. Le stockage des données dans le cloud repose sur des appareils physiques sous-jacents qui exécutent un stockage logique en utilisant la virtualisation par le haut.

Pour que la plupart des données d’entreprise soient utiles, vous devez les stocker dans des bases de données. Un système de gestion de base de données est une couche logicielle qui se trouve au-dessus des données stockées. Cette couche logicielle vous permet d’effectuer des opérations telles que la création de bases de données, l’interrogation et l’analyse de données, ainsi que la mise à jour et la suppression de données. Le logiciel de base de données peut être stocké physiquement séparément des données elles-mêmes.

Comment fonctionne le stockage des bases de données relationnelles ?

Les bases de données relationnelles stockent les données dans un format de tableau, composé de lignes et de colonnes, où chaque ligne représente un enregistrement et chaque colonne de cet enregistrement est un attribut. La structure de données de la table de base de données stocke les enregistrements courants, répétés et connexes, tels que les informations sur les clients ou les enregistrements d’achats. Chaque table peut être associée à une autre table en tant que relation : un enregistrement d’achat peut avoir une relation avec un client associé.

Le logiciel de base de données relationnelle qui s’exécute au-dessus de ces tables gère les associations par le biais de clés primaires et étrangères. Il permet aux utilisateurs d’effectuer des opérations de création, de lecture, de mise à jour, de suppression et d’écriture, et d’interroger les données des tables à l’aide du langage SQL (Structured Query Language).

Le stockage des bases de données relationnelles et de leurs données structurées sous-jacentes dépend du système de gestion de base de données relationnelle (SGBDR) utilisé pour créer la base de données, car les différents produits logiciels abordent le stockage des données différemment. Les exemples incluent SQL Server, MySQL, PostgreSQL, Oracle et MariaDB.

Stockage de base de données relationnelle géré

AWS propose des systèmes d’exploitation et de stockage de bases de données relationnelles gérés pour différents systèmes de gestion de bases de données relationnelles. Les avantages de l’utilisation d’un service géré incluent la réduction du temps consacré à la gestion et à la maintenance de l’infrastructure, ainsi qu’une sécurité accrue.

Service de base de données relationnelle Amazon

Service de base de données relationnelle Amazon (RDS) est un service géré pour des systèmes tels que PostgreSQL, MySQL, MariaDB, SQL Server, Oracle et Db2. Amazon RDS gère les tâches de gestion des bases de données, telles que le provisionnement, l’application de correctifs, la sauvegarde, la restauration, la détection des pannes et la réparation, et est simple à configurer et à déployer.

Pour le stockage, Amazon RDS propose trois types de volumes Amazon Elastic Block Store (Amazon EBS) sous-jacents différents.

  • Stockage à usage général sur SSD pour la plupart des charges de travail de base de données,
  • Stockage IOPS provisionnées à hautes performances soutenu par SSD, et 
  • Stockage magnétique des données pour une rétrocompatibilité.

Amazon Aurora

Amazon Aurora est un service géré natif cloud pour les bases de données relationnelles PostgreSQL, MySQL et DSQL. Aurora est conçu pour optimiser tous les avantages des configurations cloud, notamment le clustering et la distribution, en offrant des performances, une disponibilité et une tolérance aux pannes supérieures à celles des services SGBDR traditionnels basés sur le cloud.

Pour le stockage, les données Amazon Aurora sont stockées dans un volume de cluster, un volume virtuel unique personnalisé soutenu par des SSD, et ces données sont répliquées dans trois zones de disponibilité différentes au sein dune région AWS pour une intégrité et une redondance des données maximales. Amazon Aurora DSQ L offre une redondance multirégionale afin de préserver l’accès aux données lorsqu’un point de terminaison régional n’est pas disponible. Le stockage Aurora étant propriétaire, il fournit des configurations personnalisées avec autoscaling complet et est entièrement géré par AWS, ce qui élimine le besoin de personnalisation du stockage en fonction de l’utilisateur.

Stockage de base de données relationnelle autogéré

Le SGBDR et le stockage autogérés sur AWS impliquent des tâches traditionnelles d’administration du système et de gestion de base de données. Au lieu d’effectuer ces tâches sur votre infrastructure physique, vous devez les exécuter sur l’infrastructure cloud.

Amazon EC2 vous permet d’installer et de configurer une instance pour tout type de système de gestion de base de données relationnelle. La configuration et l’exécution d’instances EC2 nécessitent des tâches telles que la gestion de la sécurité, la configuration des performances, la surveillance et la maintenance. 

Pour le stockage sous-jacent, vous pouvez choisir entre Amazon EBS, Amazon Elastic File System (EFS) pour un stockage entièrement élastique, et des magasins d’instances temporaires. Vous pouvez choisir entre de grands et de petits volumes de stockage, en fonction des besoins de votre base de données.

Comment fonctionne le stockage de bases de données non relationnelles ?

Les bases de données non relationnelles, également appelées bases de données NoSQL, stockent, accèdent et modélisent les données différemment des bases de données relationnelles, en utilisant des structures de données distinctes. De nombreuses bases de données non relationnelles prennent en charge différents cas d’utilisation, chaque magasin de données étant conçu avec une structure de base de données différente.

Les bases de données non relationnelles incluent : les bases de données de stockage de valeurs clés, les bases de données documentaires, les bases de données à colonnes larges, les bases de données orientées graphe, les bases de données en mémoire et les bases de données de recherche.

Bases de données non relationnelles gérées

AWS propose une gamme de services gérés pour chaque type de base de données non relationnelle.

  • Amazon DynamoDB est un service géré de stockage de valeurs clés et de base de données documentaire qui utilise un stockage personnalisé et distribué sur SSD sous le capot.
  • Amazon DocumentDB (compatible avec MongoDB) est un service de gestion de base de données documentaire JSON natif qui utilise un stockage personnalisé et distribué sur SSD.
  • Amazon Keyspaces (pour Apache Cassandra) est un service géré de base de données à colonnes étendues compatible avec Apache Cassandra qui utilise un stockage personnalisé et distribué sur SSD.
  • Amazon Neptune est un service géré de base de données orientée graphe doté d’un stockage personnalisé et distribué sur SSD.  
  • Amazon MemoryDB est un service de base de données en mémoire compatible avec Valkey et Redis OSS avec un stockage personnalisé et distribué sur SSD. 
  • Amazon ElastiCache est un service de mise en cache en mémoire compatible avec le cache en mémoire Valkey, Redis et Memcached, soutenu par de la RAM et un stockage de données EBS.  

Amazon DynamoDB, Amazon DocumentDB, Amazon Keyspaces, Amazon Neptune et Amazon MemoryDB utilisent tous des types de stockage personnalisés et propriétaires soutenus par des disques SSD.

Bien qu’Amazon ElastiCache exploite le stockage EBS, il ne propose pas de choix basés sur le stockage ni d’accès utilisateur au stockage au niveau des fichiers. ElastiCache est une base de données non relationnelle de type cache.

Bases de données non relationnelles autogérées

La configuration et le stockage de bases de données non relationnelles sur AWS suivent un modèle d’infrastructure similaire à celui utilisé pour les bases de données relationnelles. 

Vous pouvez utiliser les instances EC2 pour exécuter n’importe quel type de base de données NoSQL, notamment MongoDB, Redis et HBase. Les données sous-jacentes peuvent être stockées sur Amazon EBS, Amazon Elastic File System (EFS) pour un stockage entièrement élastique, et des magasins d’instance temporaires, en fonction de votre cas d’utilisation.

Quels sont les autres types de stockage de base de données ?

Les données d’entreprise ne s’intègrent pas toutes parfaitement aux formats de base de données relationnels ou non relationnels, et les analytiques modernes peuvent souvent prendre en charge d’autres types de données semi-structurées et non structurées. 

Par exemple, vous pouvez stocker des données semi-structurées dans des fichiers de données Apache Avro sur Amazon S3 et analyser les données telles quelles, plutôt que de les restructurer pour les intégrer dans une base de données. Vous pouvez utiliser S3 comme solution de stockage pour tout type de données.

Comment choisir entre les types de stockage de base de données ?

Le choix entre l’utilisation d’un service de base de données géré et un service autogéré détermine les choix qui s’offrent à vous en matière de stockage des données.

Contrôle total de l’environnement

Les organisations qui souhaitent contrôler totalement leur environnement de base de données doivent opter pour des solutions de base de données autogérées sur AWS. Vous pouvez utiliser des bases de données et un stockage autogérés pour les bases de données relationnelles et non relationnelles. À l’aide d’une solution autogérée EC2, vous pouvez accéder directement aux données sous-jacentes du stockage de votre système de fichiers, qu’elles soient stockées dans EBS, EFS ou dans des magasins d’instance.

Frais généraux réduits

Les services gérés offrent peu ou pas de personnalisation en termes de lieu et de mode de stockage des données, mais le compromis consiste à réduire les frais généraux associés à la gestion de l’infrastructure. Les entreprises migrent généralement vers le cloud pour accéder à des services gérés, réduisant ainsi les besoins en matière de gestion et de maintenance de l’infrastructure. 

Cependant, dans certains cas d’utilisation, les organisations ont besoin d’un accès au niveau des fichiers aux données sous-jacentes des bases de données. Par exemple, une application existante peut accéder aux données directement à partir d’un fichier, des systèmes isolés peuvent avoir besoin de cette configuration ou des obligations de conformité en matière d’intégrité des données peuvent exiger un accès au niveau des fichiers.

Le choix d’un service de base de données géré par rapport à une configuration de base de données autogérée dépend du cas d’utilisation unique de chaque base de données. Un examen attentif de chaque base de données de votre organisation, y compris sa configuration et ses exigences existantes, vous aidera à orienter votre processus de prise de décision. 

Votre solution doit inclure un système de sauvegarde qui répond aux exigences de redondance des données en cas de défaillance du système.

Comment AWS peut-il répondre à vos besoins de stockage de base de données ?

Le stockage de base de données sur AWS est plus simple si vous optez pour des services de base de données gérés. Chaque service géré prend en charge le stockage pour vous et gère les données de manière efficace sans aucune configuration supplémentaire de la part de vos administrateurs. L’utilisation de services gérés signifie qu’AWS est votre gestionnaire de stockage sans contact.

Si vous adoptez une approche autogérée des bases de données sur AWS, vous pouvez contrôler la manière dont vous souhaitez stocker les données. Une approche autogérée permet d’accéder aux données et de les récupérer directement depuis le stockage physique.

Que vous effectuiez une migration MySQL ou que vous créiez un nouveau magasin de valeurs clés, explorez les options de votre base de données sur AWS

Commencez à créer une infrastructure de base de données moderne qui répond à vos besoins en créant un compte gratuit sur AWS dès aujourd’hui.