Apache HBase en Amazon EMR

¿Por qué Apache HBase en EMR?

Amazon EMR admite de forma nativa Apache HBase para proporcionarle acceso en tiempo real a tablas que pueden escalarse a miles de millones de filas y millones de columnas. Amazon EMR combina las ventajas de Apache HBase de código abierto (almacenamiento de datos orientado a columnas en sistemas distribuidos) con las capacidades de durabilidad, rendimiento, integración y herramientas de Amazon EMR. Puede obtener escrituras y lecturas muy coherentes y consultar los resultados en petabytes de datos en cuestión de milisegundos para impulsar las cargas de trabajo esenciales en los servicios financieros, la tecnología publicitaria, el análisis web y las aplicaciones mediante datos de series temporales. Sus aplicaciones Apache HBase existentes funcionarán en Amazon EMR sin ningún cambio de código. Más información sobre Apache HBase en Amazon EMR.

Características y beneficios

HFiles) en Amazon S3.

y volúmenes de Amazon EBS, por lo que puede personalizar el hardware de su clúster para optimizar el costo y el rendimiento.

para obtener más información sobre las funciones de Amazon EMR.

mediante el sistema de archivos EMR. Utilizar Amazon S3 como almacén de datos permite separar los nodos de almacenamiento y de cómputo del clúster, lo que ofrece varias ventajas respecto al sistema de archivos distribuido de Hadoop (HDFS) en el clúster. Permite ajustar el tamaño del clúster según los requisitos de cómputo en lugar del almacenamiento de datos HDFS para ahorrar costos, obtener la disponibilidad y durabilidad del almacenamiento S3, escalar los nodos de cómputo sin afectar al almacenamiento subyacente, y terminar el clúster para ahorrar costos y restaurarlo rápidamente. También puede crear y configurar un clúster de réplica de lectura en otra zona de disponibilidad de Amazon EC2 que proporciona acceso de solo lectura a los mismos datos que el clúster principal, lo que garantiza un acceso ininterrumpido a los datos aunque el clúster principal no esté disponible.

Historias de éxito de los clientes con HBase y EMR

Historia de éxito de FINRA

FINRA usa Amazon EMR para ejecutar Apache HBase en Amazon S3 para acceder rápidamente a billones de registros comerciales y ahorrar más de un 60 % de costos.

Ver FINRA

Historia de éxito de Monster

Monster usa Apache HBase en Amazon EMR para almacenar datos de campañas publicitarias y de secuencias de clics y ejecutar consultas SQL con Apache Hive.

Ver Monster