- Análisis›
- Amazon EMR›
- Apache HBase en EMR
Apache HBase en Amazon EMR
¿Por qué Apache HBase en EMR?
Características y beneficios
HFiles) en Amazon S3.
y volúmenes de Amazon EBS, por lo que puede personalizar el hardware de su clúster para optimizar el costo y el rendimiento.
para obtener más información sobre las funciones de Amazon EMR.
mediante el sistema de archivos EMR. Utilizar Amazon S3 como almacén de datos permite separar los nodos de almacenamiento y de cómputo del clúster, lo que ofrece varias ventajas respecto al sistema de archivos distribuido de Hadoop (HDFS) en el clúster. Permite ajustar el tamaño del clúster según los requisitos de cómputo en lugar del almacenamiento de datos HDFS para ahorrar costos, obtener la disponibilidad y durabilidad del almacenamiento S3, escalar los nodos de cómputo sin afectar al almacenamiento subyacente, y terminar el clúster para ahorrar costos y restaurarlo rápidamente. También puede crear y configurar un clúster de réplica de lectura en otra zona de disponibilidad de Amazon EC2 que proporciona acceso de solo lectura a los mismos datos que el clúster principal, lo que garantiza un acceso ininterrumpido a los datos aunque el clúster principal no esté disponible.
Historias de éxito de los clientes con HBase y EMR
Historia de éxito de FINRA
FINRA usa Amazon EMR para ejecutar Apache HBase en Amazon S3 para acceder rápidamente a billones de registros comerciales y ahorrar más de un 60 % de costos.
Historia de éxito de Monster
Monster usa Apache HBase en Amazon EMR para almacenar datos de campañas publicitarias y de secuencias de clics y ejecutar consultas SQL con Apache Hive.