Saltar al contenido principal

Amazon EMR

Amazon EMR sin servidor

Ejecute aplicaciones de big data mediante marcos de código abierto sin necesidad de administrar clústeres ni servidores

¿Por qué utilizar EMR sin servidor?

Amazon EMR sin servidor es una opción sin servidor en Amazon EMR que facilita a los ingenieros y los analistas de datos la ejecución de marcos de análisis de big data de código abierto sin la necesidad de configurar, administrar y escalar clústeres o servidores. Obtendrá todas las funciones y ventajas de Amazon EMR sin la necesidad de expertos que planifiquen y administren los clústeres.

Beneficios

Seleccione el marco de código abierto que desea ejecutar para su aplicación, como Apache Spark y Apache Hive, y EMR sin servidor aprovisionará y administrará de manera automática los recursos de computación y memoria subyacentes.

Ejecute cargas de trabajo de análisis a cualquier escala con un escalado automático bajo demanda que cambia el tamaño de los recursos en segundos para cumplir con los cambiantes requisitos de procesamiento y volúmenes de datos.

EMR sin servidor escala y reduce verticalmente de forma automática los recursos para proporcionar la capacidad justa para su aplicación. Solo paga por lo que usa y no tendrá que preocuparse tanto de si el aprovisionamiento es excesivo o insuficiente.

Con el agente de actualización de Apache Spark, las actualizaciones de Apache Spark, que solían durar meses, se transforman en proyectos eficientes de una semana de duración gracias a la automatización inteligente. El agente de actualización de Spark agiliza las migraciones empresariales al gestionar automáticamente los complejos cambios de API en toda la base de código, lo que reduce drásticamente los costes y el esfuerzo.

Amazon EMR sin servidor elimina el aprovisionamiento de almacenamiento local para las cargas de trabajo de Apache Spark, lo que reduce los costos de procesamiento de datos hasta en un 20 % y evita que se produzcan errores en los trabajos debido a las restricciones de capacidad del disco. EMR sin servidor gestiona automáticamente las operaciones de datos intermedias, como la distribución aleatoria, sin cargos de almacenamiento; solo paga por los recursos de computación y memoria.

Funcionamiento

1

Cree su aplicación

Elija el marco de código abierto y la versión que quiere usar.

2

Envíe trabajos

Envíe trabajos a la aplicación a través de API o EMR Studio. También puede enviar trabajos mediante servicios de orquestación de flujos de trabajo como Apache Airflow o Amazon Managed Workflows para Apache Airflow.

3

Depure trabajos

Use herramientas conocidas de código abierto, como la interfaz de usuario de Spark y la interfaz de usuario de Tez, para supervisar y depurar los trabajos.

Casos de uso

A medida que cambien las exigencias de la carga de trabajo, escale los recursos de las aplicaciones con facilidad, sin tener que preconfigurar la cantidad de potencia de procesamiento y memoria que necesita.

Elija la opción para preinicializar los recursos de la aplicación y habilitar el tiempo de respuesta en segundos para las canalizaciones de datos confidenciales a los SLA.

Ponga en marcha con rapidez y de forma fácil entornos de desarrollo y pruebas, escale de manera automática según el uso impredecible y entregue productos al mercado de manera más rápida.