- ¿Qué es la computación en la nube?›
- Centro de conceptos de computación en la nube›
- Bases de datos›
- ¿Qué es el almacenamiento de bases de datos?
¿Qué es el almacenamiento de bases de datos?
Temas de la página
- ¿Qué es el almacenamiento de bases de datos?
- ¿Cómo funciona el almacenamiento de bases de datos relacionales?
- ¿Cómo funciona el almacenamiento de bases de datos no relacionales?
- ¿Qué otros tipos de almacenamiento de bases de datos hay?
- ¿Cómo elegir entre los tipos de almacenamiento de bases de datos?
- ¿Cómo puede AWS satisfacer sus necesidades de almacenamiento de bases de datos?
¿Qué es el almacenamiento de bases de datos?
Los datos se pueden almacenar en una base de datos para recuperarlos y analizarlos en el futuro. Hay muchas opciones diferentes de almacenamiento de bases de datos con ventajas y desventajas en cuanto a control y flexibilidad. En esta guía se examinan varios modelos de almacenamiento en AWS y se ofrece orientación sobre cómo seleccionar el más adecuado para su caso de uso específico.
Todos los datos digitales deben almacenarse en un dispositivo físico en algún lugar, como en la RAM, la memoria caché, los registros, las unidades de estado sólido (SSD) o las unidades de disco duro (HDD), en el almacenamiento conectado a la red (NAS) y en las redes de área de almacenamiento (SAN) o en otros tipos de almacenamiento físico. El almacenamiento de datos en la nube se basa en dispositivos físicos subyacentes que ejecutan el almacenamiento lógico mediante la virtualización directa.
Para que la mayoría de los datos empresariales sean útiles, debe almacenarlos en bases de datos. Un sistema de administración de bases de datos es una capa de software que se encuentra sobre los datos almacenados. Esta capa de software le permite realizar operaciones como crear bases de datos, consultar y analizar datos y actualizar y eliminar datos. El software de la base de datos se puede almacenar físicamente por separado de los datos en sí.
¿Cómo funciona el almacenamiento de bases de datos relacionales?
Las bases de datos relacionales almacenan los datos en un formato de tabla, que consta de filas y columnas, donde cada fila representa un registro y cada columna de ese registro es un atributo. La estructura de datos de la tabla de la base de datos almacena registros comunes, repetidos y relacionados, como detalles de clientes o registros de compras. Cada tabla se puede asociar a otra tabla como una relación: un registro de compra puede tener una relación con un cliente asociado.
El software de base de datos relacional que se ejecuta sobre estas tablas administra las asociaciones a través de claves principales y externas. Permite a los usuarios realizar operaciones de creación, lectura, actualización, eliminación y escritura, y consultar los datos de las tablas mediante el lenguaje de consulta estructurado (SQL).
El almacenamiento de las bases de datos relacionales y sus datos estructurados subyacentes depende del sistema de administración de bases de datos relacionales (RDBMS) que se haya utilizado para crear la base de datos, ya que los diferentes productos de software abordan el almacenamiento de datos de manera diferente. Algunos ejemplos son SQL Server, MySQL, PostgreSQL, Oracle y MariaDB.
Almacenamiento de bases de datos relacionales administradas
AWS ofrece almacenamiento administrado de bases de datos relacionales y sistemas operativos para varios sistemas de administración de bases de datos relacionales. Algunas de las ventajas de usar un servicio administrado son la reducción del tiempo dedicado a la administración y el mantenimiento de la infraestructura y el aumento de la seguridad.
Amazon Relational Database Service
Amazon Relational Database Service (RDS) es un servicio administrado para sistemas como PostgreSQL, MySQL, MariaDB, SQL Server, Oracle y Db2. Amazon RDS gestiona las tareas de administración de bases de datos, como el aprovisionamiento, la aplicación de parches, la copia de seguridad, la recuperación, la detección de errores y la reparación, y es fácil de configurar e implementar.
Para el almacenamiento, Amazon RDS ofrece tres tipos de volúmenes subyacentes diferentes de Amazon Elastic Block Store (Amazon EBS).
- Almacenamiento de uso general respaldado por SSD para la mayoría de las cargas de trabajo de bases de datos.
- Almacenamiento de IOPS aprovisionadas de alto rendimiento y respaldado por SSD.
- Almacenamiento de datos magnético para tener compatibilidad con versiones anteriores.
Amazon Aurora
Amazon Aurora es un servicio administrado nativo en la nube para bases de datos relacionales PostgreSQL, MySQL y DSQL. Aurora está diseñada para maximizar todas las ventajas de las configuraciones en la nube, como la agrupación en clústeres y la distribución, y proporciona un mayor rendimiento, alta disponibilidad y tolerancia a errores en comparación con los servicios de RDBMS tradicionales basados en la nube.
Para el almacenamiento, los datos de Amazon Aurora se almacenan en un volumen de clúster, un volumen virtual único y personalizado respaldado por SSD, y estos datos se replican en tres zonas de disponibilidad diferentes dentro de una región de AWS para lograr la máxima integridad y redundancia de los datos. Amazon Aurora DSQL ofrece redundancia multirregional para preservar el acceso a los datos cuando un punto de conexión regional no está disponible. Como el almacenamiento de Aurora es propietario, proporciona configuraciones personalizadas con escalado automático completo y AWS lo administra por completo, lo que elimina la necesidad de personalizar el almacenamiento según el usuario.
Almacenamiento de bases de datos relacionales autoadministrado
RDBMS autoadministrado y el almacenamiento en AWS implican tareas tradicionales de administración de sistemas y bases de datos. En lugar de realizar estas tareas en su infraestructura física, debe realizar las tareas en la infraestructura en la nube.
Amazon EC2 le permite configurar una instancia para cualquier tipo de sistema de administración de bases de datos relacionales. La configuración y ejecución de instancias de EC2 requiere tareas como la administración de la seguridad, la configuración del rendimiento, la supervisión y el mantenimiento.
Para el almacenamiento subyacente, puede elegir entre Amazon EBS, Amazon Elastic File System (EFS) para un almacenamiento totalmente elástico y almacenes de instancias temporales. Puede elegir entre volúmenes grandes y pequeños para el almacenamiento, según las necesidades de su base de datos.
¿Cómo funciona el almacenamiento de bases de datos no relacionales?
Las bases de datos no relacionales, también conocidas como bases de datos NoSQL, almacenan y modelan los datos y acceden a ellos de manera diferente a las bases de datos relacionales, utilizando estructuras de datos distintas. Una variedad de bases de datos no relacionales admiten diferentes casos de uso, y cada almacén de datos está diseñado con una estructura de base de datos diferente.
Las bases de datos no relacionales incluyen bases de datos de almacenamiento de clave-valor, bases de datos de documentos, bases de datos de columnas anchas, bases de datos de grafos, bases de datos en memoria y bases de datos de búsqueda.
Bases de datos no relacionales administradas
AWS ofrece una gama de servicios administrados para cada tipo de base de datos no relacional.
- Amazon DynamoDB es un servicio administrado de almacenamiento de clave-valor y bases de datos de documentos que utiliza almacenamiento personalizado, distribuido y basado en SSD de forma interna.
- Amazon DocumentDB (compatible con MongoDB) es un servicio administrado de bases de datos de documentos JSON nativo que utiliza almacenamiento personalizado, distribuido y basado en SSD.
- Amazon Keyspaces (para Apache Cassandra) es un servicio administrado de bases de datos de columnas anchas compatible con Apache Cassandra que utiliza almacenamiento personalizado, distribuido y basado en SSD.
- Amazon Neptune es un servicio administrado de bases de datos de gráficos con almacenamiento personalizado, distribuido y basado en SSD.
- Amazon MemoryDB es un servicio de bases de datos en memoria compatible con Valkey y Redis OSS con almacenamiento personalizado, distribuido y basado en SSD.
- Amazon ElastiCache es un servicio de almacenamiento en caché compatible con la caché en memoria de Valkey, Redis y Memcached, respaldado por el almacenamiento de datos de RAM y EBS.
Amazon DynamoDB, Amazon DocumentDB, Amazon Keyspaces, Amazon Neptune y Amazon MemoryDB utilizan tipos de almacenamiento personalizados y patentados respaldados por SSD.
Si bien Amazon ElastiCache aprovecha el almacenamiento de EBS, no ofrece opciones basadas en el almacenamiento ni acceso de los usuarios al almacenamiento a nivel de archivos. ElastiCache es una base de datos no relacional de tipo caché.
Bases de datos no relacionales autoadministradas
La configuración y el almacenamiento de bases de datos no relacionales en AWS siguen un patrón de infraestructura similar al que se utiliza para las bases de datos relacionales.
Puede usar instancias de EC2 para ejecutar cualquier tipo de base de datos NoSQL, como MongoDB, Redis y HBase. Los datos subyacentes se pueden almacenar en Amazon EBS, Amazon Elastic File System (EFS) para un almacenamiento totalmente elástico y en almacenes de instancias temporales, según su caso de uso.
¿Qué otros tipos de almacenamiento de bases de datos hay?
No todos los datos empresariales se adaptan perfectamente a los formatos de bases de datos relacionales o no relacionales, y los análisis modernos a menudo pueden adaptarse a otros tipos de datos semiestructurados y no estructurados.
Por ejemplo, puede almacenar datos semiestructurados en archivos de datos de Apache Avro en Amazon S3 y analizar los datos tal cual, en lugar de reestructurarlos para que quepan en una base de datos. Puede usar S3 como solución de almacenamiento para cualquier tipo de datos.
¿Cómo elegir entre los tipos de almacenamiento de bases de datos?
La decisión entre usar un servicio de base de datos administrado o un servicio autoadministrado determina las opciones que tiene en cuanto al almacenamiento de datos.
Control total del entorno
Las organizaciones que buscan un control total sobre su entorno de bases de datos deben optar por soluciones de bases de datos autoadministradas en AWS. Puede usar bases de datos autoadministradas y almacenamiento para bases de datos relacionales y no relacionales. Con una solución autoadministrada de EC2, puede acceder directamente a los datos subyacentes del almacenamiento del sistema de archivos, ya sea que estén almacenados en EBS, EFS o en almacenes de instancias.
Reducción de los gastos generales
Los servicios administrados ofrecen poca o ninguna personalización en términos de dónde y cómo se almacenan los datos, pero a cambio se reducen los gastos generales asociados a la administración de la infraestructura. Las organizaciones suelen migrar a la nube para acceder a los servicios administrados, lo que reduce la necesidad de administrar y mantener la infraestructura.
Sin embargo, hay casos de uso en los que las organizaciones necesitan acceso a nivel de archivo a los datos subyacentes de las bases de datos. Por ejemplo, una aplicación existente puede acceder a los datos directamente desde un archivo, los sistemas aislados pueden necesitar esta configuración o las obligaciones de integridad de los datos de cumplimiento pueden exigir el acceso a nivel de archivo.
La elección de un servicio de base de datos administrado en lugar de una configuración de base de datos autoadministrada depende del caso de uso único de cada base de datos. Considerar detenidamente cada base de datos de su organización, junto con su configuración y requisitos existentes, ayuda a guiar el proceso de toma de decisiones.
La solución debe incluir un sistema de copia de seguridad que cumpla con los requisitos de redundancia de datos en caso de que se produzcan errores en el sistema.
¿Cómo puede AWS satisfacer sus necesidades de almacenamiento de bases de datos?
El almacenamiento de bases de datos en AWS es más sencillo si elige servicios de bases de datos administrados. Cada servicio administrado se ocupa del almacenamiento por usted y gestiona los datos de forma eficiente sin necesidad de que los administradores realicen ninguna configuración adicional. El uso de servicios administrados significa que AWS es su administrador de almacenamiento sin contacto.
Si adopta un enfoque autoadministrado para las bases de datos en AWS, tiene el control sobre cómo desea almacenar los datos. Un enfoque autoadministrado permite acceder a los datos y recuperarlos directamente desde el almacenamiento físico.
Ya sea que esté realizando una migración de MySQL o creando un nuevo almacén de clave-valor, explore las opciones de bases de datos en AWS.
Para comenzar a crear una infraestructura de base de datos moderna que se adapte a sus necesidades, cree una cuenta gratuita en AWS hoy mismo.