Amazon EKS

Introducción a Amazon EKS

Elija su propio camino

Amazon EKS es un servicio de Kubernetes completamente administrado que facilita la ejecución de contenedores a escala en AWS. Independientemente de si moderniza con microservicios, ejecuta cargas de trabajo de machine learning a gran escala o crea con tecnologías emergentes como la IA generativa, Amazon EKS ayuda a los clientes a ejecutar sus aplicaciones críticas en contenedores mientras reduce la sobrecarga operativa y acelera la innovación. Elija su ruta para aprender cómo EKS puede permitirle operar de manera eficiente entornos de Kubernetes de producción y siga los pasos seleccionados para comenzar con su caso de uso específico.

Ruta 1-0: IA agéntica
1
Ruta 1-1: implementación de agentes
4
Ruta 1-2: operaciones agénticas para Amazon EKS
4
Ruta 2-0: IA generativa
1
Ruta 2-1: implementación e inferencia de modelos
4
Ruta 3-0: ¿no tiene ningún caso de uso en mente?
4

Ruta 1-0: IA agéntica

Abrir todo

Amazon EKS permite dos enfoques distintos para la IA agéntica. En primer lugar, puede implementar y escalar agentes autónomos como aplicaciones en contenedores, lo que le permite controlar la infraestructura de sus agentes. En segundo lugar, puede optimizar las operaciones de Kubernetes y el desarrollo de aplicaciones para que los agentes y los asistentes de IA puedan simplificar las operaciones y solucionar problemas mediante interacciones en lenguaje natural mediante el protocolo Agent2Agent (A2A) y el protocolo de contexto para modelos (MCP). Esta ruta lo guía a través de ambos enfoques: la implementación de agentes en Amazon EKS y el uso de la IA agéntica para mejorar la experiencia de los desarrolladores y operadores de Amazon EKS.

Ruta 1-1: implementación de agentes

Abrir todo

Implemente y escale agentes de IA autónomos en Amazon EKS mediante el SDK de Strands Agents de código abierto o su marco de agentes preferido. Este enfoque le ofrece un control total sobre la infraestructura de sus agentes, lo que le permite usar cualquier modelo y personalizar su implementación. EKS proporciona capacidades de producción para ejecutar agentes de IA en contenedores con alta disponibilidad y escalabilidad.

Explore los aspectos básicos de la creación y la implementación de agentes de IA en EKS. Obtenga más información sobre el SDK de Strands Agents y cómo simplifica el desarrollo de agentes, o aplique estos conceptos a su marco preferido. Estudie un ejemplo real sobre la previsión meteorológica para comprender cómo un agente sencillo puede integrarse con las API externas, gestionar las respuestas de transmisiones y procesar las consultas en lenguaje natural. En este ejemplo se muestran los conceptos clave, como las peticiones del sistema, la integración de herramientas y los flujos de trabajo de API, que necesitará para implementar agentes en EKS.

Siga nuestra guía paso a paso para implementar los agentes del SDK de Strands Agents en Amazon EKS. Comience por aprender a contenedorizar el agente y configure los puntos de conexión de FastAPI, implemente respuestas de transmisiones y empaquete la aplicación con Docker. Utilice nuestro proyecto de muestra para comprender conceptos esenciales como la configuración del Modo automático de EKS, las implementaciones de Helm y las pruebas básicas. Si bien esta guía utiliza el SDK de Strands, los principios se aplican a la implementación de cualquier agente en contenedores en EKS.

Aprenda a escalar y operar las implementaciones de sus agentes de manera fiable en producción. Implemente el escalado automático para gestionar cargas de trabajo variables, lograr una alta disponibilidad mediante configuraciones de copias de seguridad y conmutación por error y configurar una supervisión integral con Información de contenedores de CloudWatch. Siga nuestra guía de prácticas recomendadas de EKS para ejecutar cargas de trabajo de IA y ML para garantizar que la infraestructura de sus agentes sea segura y observable. Lleve a cabo nuestro taller autodidacta sobre IA agéntica en EKS para obtener orientación paso a paso sobre cómo implementar agentes de IA a escala.

Ruta 1-2: operaciones agénticas para Amazon EKS

Abrir todo

Para transformar sus operaciones de Kubernetes, proporcione a los asistentes de codificación de IA herramientas y recursos en tiempo real a través del servidor MCP de Amazon EKS. Esto permite a los agentes de IA interactuar directamente con sus clústeres de EKS, con orientación contextual y automatización a través de interacciones en lenguaje natural. Desde la creación de clústeres hasta la resolución de problemas, estos agentes de IA ayudan a optimizar las operaciones de Kubernetes y, al mismo tiempo, mantener las prácticas recomendadas de AWS.

Descubra cómo los diferentes servidores MCP de AWS facilitan la interacción entre los modelos de IA y los servicios y recursos de AWS. Explore la guía de servidores MCP de EKS para comprender cómo los agentes de IA pueden ayudar a automatizar las tareas operativas comunes, desde la administración de clústeres hasta la resolución de problemas. Configure su entorno de desarrollo para configurar asistentes de IA como la CLI de Amazon Q Developer o Cline con la integración del servidor MCP de EKS.

Siga nuestra guía paso a paso para simplificar las operaciones de Kubernetes con el servidor MCP de Amazon EKS. Aprenda a usar comandos de lenguaje natural para contenedorizar e implementar aplicaciones en EKS. Consulte esta demostración para obtener más información sobre cómo los agentes de IA pueden ayudar a generar manifiestos de Kubernetes, administrar los recursos del clúster y automatizar los flujos de trabajo de implementación mediante las herramientas del servidor MCP de EKS.

Siga nuestro tutorial de solución de problemas asistido por IA con el servidor MCP de Amazon EKS para ver cómo los agentes de IA pueden ayudar a supervisar el estado de las aplicaciones y resolver problemas comunes. Con ejemplos prácticos de depuración de fallos de pods y problemas de infraestructura, aprenda a utilizar las consultas en lenguaje natural para comprobar las métricas de CloudWatch, analizar los registros y diagnosticar problemas. Esta guía práctica demuestra cómo la asistencia de IA puede permitirle aprovechar Amazon CloudWatch y otros servicios de AWS para mantener las aplicaciones en buen estado en EKS.

Ruta 2-0: IA generativa

Abrir todo

El panorama de la IA generativa está evolucionando rápidamente, y las organizaciones crean, implementan y escalan diversas cargas de trabajo de IA y ML para casos de uso que van desde el entrenamiento de modelos distribuidos hasta el refinamiento y las implementaciones de inferencia a gran escala. Los clientes, incluidos Anthropic y Adobe, eligen Amazon EKS para obtener un control detallado de los recursos de computación y, al mismo tiempo, mantener la eficiencia operativa. Consulte esta guía para obtener información general sobre por qué los clientes eligen EKS para IA y ML en casos de uso comunes, como el entrenamiento y la implementación de modelos, la generación aumentada por recuperación (RAG) y la inferencia.

Ruta 2-1: implementación e inferencia de modelos

Abrir todo

Amazon EKS permite implementaciones de inferencia de producción con soporte para la optimización de GPU, el servicio multimodelo y el escalado automático. Las organizaciones pueden aprovechar su experiencia y prácticas operativas actuales en EKS para implementar y administrar rápidamente las cargas de trabajo de inferencia junto con otras aplicaciones. Gracias a la integración con herramientas de código abierto y una amplia gama de aceleradores en AWS, empresas como Vannevar Labs y Omi han logrado importantes reducciones de costos y mejoras de rendimiento mientras mantienen la coherencia operativa en toda su infraestructura.

Conozca los fundamentos de la infraestructura y la arquitectura para implementar cargas de trabajo de inferencia en EKS en esta guía de soluciones que cubre temas clave como el soporte de GPU, los patrones de servicio de modelos y la optimización de recursos. Explore el proyecto de IA en EKS de código abierto, que proporciona esquemas listos para su implementación, como la configuración de un servicio de inferencia de LLM escalable con plantillas de infraestructura como código para la implementación en producción.

Comience con nuestra guía de prácticas recomendadas de configuración de clústeres para la inferencia en tiempo real a fin de crear un clúster de EKS optimizado para las cargas de trabajo de inferencia de producción. Implemente modelos con nuestra IA lista para la producción en gráficos de inferencia de EKS, que proporcionan gráficos de Helm y plantillas de infraestructura como código para marcos populares como vLLM y NVIDIA Triton. Para las cargas de trabajo de ML tradicionales, consulte la guía para desarrolladores de contenedores de aprendizaje profundo de AWS para obtener información sobre inferencias basadas en CPU y GPU para conocer los patrones de implementación.

Siga nuestros talleres prácticos para implementar cargas de trabajo de inferencia en EKS con el acelerador que prefiera: el taller basado en NVIDIA para inferencias basadas en GPU y el taller basado en AWS Neuron sobre el uso de aceleradores Inferentia y Trainium. En ambos talleres se tratan tareas esenciales como la configuración de complementos de dispositivos, la administración de recursos y la supervisión. Consulte la completa guía de prácticas recomendadas de EKS para cargas de trabajo de IA y ML para asegurarse de que sus implementaciones de inferencia sigan patrones comprobados de computación, redes, almacenamiento y observabilidad. Estas guías sirven como referencias continuas a medida que opera y desarrolla su arquitectura de inferencia en EKS.

Ruta 3-0: ¿no tiene ningún caso de uso en mente?

Abrir todo

¿Es la primera vez que utiliza Amazon EKS? Siga los pasos de esta ruta y configure su primer clúster de Kubernetes en solo unos minutos.

Con Amazon EKS, puede configurar y lanzar contenedores en cuestión de minutos al iniciar sesión en la Consola de administración de AWS.

Descubra cómo funciona Amazon EKS a través de la serie de videos de Containers from the Couch y el canal del blog sobre contenedores.

Aprenda a implementar cargas de trabajo y complementos en Amazon EKS con implementaciones de muestra en Linux y Windows.

Conceptos básicos

¿Qué es un contenedor?

¿Qué es Kubernetes?

Pods e implementaciones de Kubernetes

Explicación de los esquemas de EKS para Terraform

Amazon EKS Anywhere frente a EKS en AWS Outposts

Recursos

Orientación

Implemente una aplicación de Kubernetes con Amazon EKS

Configure un clúster de Kubernetes administrado por Amazon EKS e implemente una aplicación de muestra. Amazon EKS, EC2, Elastic Load Balancing, kubectl

Comience a crear

Taller