Amazon EKS

Mise en route avec Amazon EKS

Choisissez votre propre parcours

Amazon EKS est un service Kubernetes entièrement géré qui facilite l’exécution de conteneurs à grande échelle sur AWS. Que vous modernisiez vos systèmes avec des microservices, que vous exécutiez des charges de travail de machine learning à grande échelle ou que vous développiez des solutions à l’aide de technologies émergentes telles que l’IA générative, Amazon EKS aide les clients à exécuter leurs applications conteneurisées stratégiques tout en réduisant les coûts d’exploitation et en accélérant l’innovation. Choisissez votre parcours pour découvrir comment EKS peut vous aider à exploiter efficacement des environnements Kubernetes de niveau production et suivez les étapes sélectionnées pour vous lancer dans votre cas d’utilisation spécifique.

Parcours 1-0 : IA agentique
1
Parcours 1-1 : Déploiement d’agents
4
Parcours 1-2 : Opérations agentiques pour Amazon EKS
4
Parcours 2-0 : IA générative
1
Parcours 2-1 : Déploiement de modèles et inférence
4
Parcours 3-0 : aucun cas d’utilisation en vue ?
4

Parcours 1-0 : IA agentique

Ouvrir tout

Amazon EKS propose deux approches distinctes de l’IA agentique. Tout d’abord, vous pouvez déployer et faire évoluer des agents autonomes sous forme d’applications conteneurisées, ce qui vous permet de contrôler votre infrastructure d’agents. Ensuite, vous pouvez rationaliser les opérations Kubernetes et le développement d’applications afin de permettre aux agents et aux assistants IA de simplifier les opérations et de résoudre les problèmes grâce à des interactions en langage naturel, en utilisant le protocole Agent2Agent (A2A) et le protocole de contextualisation des modèles (MCP). Ce guide vous présente ces deux approches : le déploiement d’agents sur Amazon EKS et l’utilisation de l’IA agentique pour améliorer l’expérience des développeurs et des opérateurs Amazon EKS.

Parcours 1-1 : Déploiement d’agents

Ouvrir tout

Déployez et faites évoluer des agents d’IA autonomes sur Amazon EKS à l’aide du kit SDK open source Strands Agents ou de votre cadre d’agents préféré. Cette approche vous offre un contrôle total sur votre infrastructure d’agents, vous permettant d’utiliser n’importe quel modèle et de personnaliser votre implémentation. EKS fournit des capacités de niveau production pour l’exécution d’agents d’IA conteneurisés avec une haute disponibilité et une grande capacité de mise à l’échelle.

Découvrez les principes fondamentaux de la création et du déploiement d’agents d’IA sur EKS. Découvrez le kit SDK Strands Agents et comment il simplifie le développement d’agents, ou appliquez ces concepts à votre cadre préféré. Étudiez un exemple concret de prévisions météorologiques pour comprendre comment un agent simple peut s’intégrer à des API externes, gérer les réponses en continu et traiter les requêtes en langage naturel. Cet exemple illustre des concepts clés tels que les invites système, l’intégration d’outils et les flux de travail API dont vous aurez besoin lors du déploiement d’agents sur EKS.

Suivez notre guide étape par étape pour déployer le agents du kit SDK Strands Agents sur Amazon EKS. Commencez par apprendre à conteneuriser votre agent, à configurer des points de terminaison FastAPI, à implémenter des réponses en continu et à packagez votre application à l’aide de Docker. Utilisez notre exemple de projet pour comprendre les concepts essentiels tels que la configuration du mode automatique EKS, les déploiements Helm et les tests de base. Bien que ce guide utilise le kit SDK Strands, les principes s’appliquent au déploiement de tout agent conteneurisé sur EKS.

Apprenez à faire évoluer et à exploiter vos déploiements d’agents de manière fiable en production. Mettez en œuvre une évolutivité automatisée pour gérer des charges de travail variables, assurez une haute disponibilité grâce à des configurations de sauvegarde et de basculement, et configurez une surveillance complète à l’aide de CloudWatch Container Insights. Suivez notre Guide des bonnes pratiques EKS pour l’exécution de charges de travail IA/ML afin de garantir que votre infrastructure d’agents est sécurisée et observable. Suivez notre atelier « IA agentique sur Amazon EKS » à votre rythme pour obtenir des conseils étape par étape sur le déploiement d’agents d’IA à grande échelle.

Parcours 1-2 : Opérations agentiques pour Amazon EKS

Ouvrir tout

Transformez vos opérations Kubernetes en fournissant aux assistants de codage IA des outils et des ressources en temps réel via le serveur MCP pour Amazon EKS. Cela permet aux agents d’IA d’interagir directement avec vos clusters EKS, avec des conseils contextuels et une automatisation via des interactions en langage naturel. De la création de clusters au dépannage, ces agents d’IA vous aident à rationaliser vos opérations Kubernetes tout en respectant les bonnes pratiques AWS.

Découvrez comment les différents serveurs AWS MCP facilitent l’interaction entre les modèles d’IA et les services AWS et les ressources. Consultez le Guide du serveur MCP EKS pour comprendre comment les agents d’IA peuvent aider à automatiser les tâches opérationnelles courantes, de la gestion des clusters au dépannage. Configurez votre environnement de développement pour intégrer des assistants IA tels que Amazon Q Developer CLI ou Cline avec l’intégration du serveur MCP EKS.

Suivez notre guide étape par étape pour rationaliser les opérations Kubernetes avec le serveur MCP pour Amazon EKS. Apprenez à utiliser des commandes en langage naturel pour conteneuriser et déployer des applications sur EKS. Consultez cette démonstration pour en savoir plus sur la manière dont les agents d’IA peuvent aider à générer des manifestes Kubernetes, à gérer les ressources du cluster et à automatiser les flux de travail de déploiement à l’aide des outils du serveur MCP pour EKS.

Suivez notre démonstration pas à pas de dépannage assisté par l’IA avec le serveur MCP pour Amazon EKS pour découvrir comment les agents d’IA peuvent vous aider à surveiller l’état de santé des applications et à résoudre les problèmes courants. À travers des exemples pratiques de débogage de pannes de pods et de problèmes d’infrastructure, apprenez à utiliser des requêtes en langage naturel pour vérifier les métriques CloudWatch, analyser les journaux et diagnostiquer les problèmes. Cette démonstration pratique démontre comment l’assistance IA peut vous aider à tirer parti d’Amazon CloudWatch et d’autres services AWS pour maintenir des applications en bon état de fonctionnement sur Amazon EKS.

Parcours 2-0 : IA générative

Ouvrir tout

Le paysage de l’IA générative évolue rapidement, les organisations créant, déployant et faisant évoluer diverses charges de travail IA/ML pour des cas d’utilisation allant de l’entraînement des modèles distribués au peaufinage, en passant par les déploiements d’inférence à grande échelle. Des clients tels que Anthropic et Adobe choisissent Amazon EKS pour bénéficier d’un contrôle précis sur les ressources de calcul tout en maintenant leur efficacité opérationnelle. Consultez ce guide pour découvrir pourquoi les clients choisissent EKS pour l’IA/ML dans le cadre de cas d’utilisation courants tels que l’entraînement et le déploiement des modèles, la génération à enrichissement contextuel (RAG) et l’inférence.

Parcours 2-1 : Déploiement de modèles et inférence

Ouvrir tout

Amazon EKS permet des déploiements d’inférence de niveau production grâce à la prise en charge de l’optimisation GPU, de la mise en service multimodèle et de la mise à l’échelle automatisée. Les entreprises peuvent tirer parti de leur expertise EKS existante et de leurs pratiques opérationnelles pour déployer et gérer rapidement des charges de travail d’inférence parallèlement à d’autres applications. Grâce à l’intégration avec des outils open source et à la vaste gamme d’accélérateurs sur AWS, des entreprises telles que Vannevar Labs et Omi ont réalisé d’importantes réductions de coûts et améliorations de performances tout en maintenant la cohérence opérationnelle à travers leur infrastructure.

Découvrez les principes fondamentaux de l’infrastructure et de l’architecture pour le déploiement de charges de travail d’inférence sur EKS dans ce guide de solution couvrant des rubriques clés telles que la prise en charge des GPU, les modèles de service de modèles et l’optimisation des ressources. Découvrez le projet open source AI on EKS, qui fournit des plans prêts à déployer, tels que la mise en place d’un service d’inférence LLM évolutif avec des modèles d’infrastructure en tant que code pour le déploiement en production.

Commencez par consulter notre Guide des bonnes pratiques pour la configuration de clusters d’inférence en temps réel afin de créer un cluster EKS optimisé pour les charges de travail d’inférence en production. Déployez des modèles à l’aide de nos charts d’inférence AI sur EKS prêts pour la production, qui fournissent des Charts de Helm et des modèles d’infrastructure en tant que code pour des cadres populaires tels que vLLM et NVIDIA Triton. Pour les charges de travail ML traditionnelles, consultez le guide du développeur AWS Deep Learning Containers pour l’inférence sur CPU et l’inférence sur GPU afin de découvrir les modèles de déploiement.

Suivez nos ateliers pratiques pour déployer des charges de travail d’inférence sur EKS en utilisant l’accélérateur de votre choix : l’atelier basé sur NVIDIA pour l’inférence sur GPU et l’atelier basé sur AWS Neuron utilisant les accélérateurs Inferentia et Trainium. Ces deux ateliers couvrent des tâches essentielles telles que la configuration des plugins de périphériques, la gestion des ressources et la surveillance. Consultez le Guide complet des bonnes pratiques EKS pour les charges de travail IA/ML afin de vous assurer que vos déploiements d’inférence suivent des modèles éprouvés en matière de calcul, de mise en réseau, de stockage et d’observabilité. Ces guides vous serviront de référence tout au long de l’exploitation et de l’évolution de votre architecture d’inférence sur EKS.