Amazon EKS

Guida introduttiva ad Amazon EKS

Scegli il tuo percorso

Amazon EKS è un servizio Kubernetes completamente gestito che semplifica l’esecuzione di contenitori su larga scala su AWS. Che tu stia modernizzando con microservizi, eseguendo carichi di lavoro di machine learning su larga scala o utilizzando tecnologie emergenti come l’IA generativa, Amazon EKS aiuta i clienti a eseguire le loro applicazioni containerizzate mission-critical riducendo al contempo i costi operativi e accelerando l’innovazione. Scegli il tuo percorso per scoprire come EKS può aiutarti a gestire in modo efficiente ambienti Kubernetes di livello di produzione e segui passaggi curati per iniziare con il tuo caso d’uso specifico.

Percorso 1-0: IA agentica
1
Percorso 1-1: Distribuzione degli agenti
4
Percorso 1-2: Operazioni agentiche per Amazon EKS
4
Percorso 2-0: IA generativa
1
Percorso 2-1: Distribuzione e inferenza del modello
4
Percorso 3-0: Nessun caso d’uso in mente?
4

Percorso 1-0: IA agentica

Apri tutto

Amazon EKS consente due approcci distinti all’IA agentica. Innanzitutto, puoi implementare e scalare agenti autonomi come applicazioni containerizzate, dandoti il controllo sull’infrastruttura degli agenti. In secondo luogo, puoi semplificare le operazioni e lo sviluppo di applicazioni Kubernetes per consentire agli agenti e agli assistenti IA di semplificare le operazioni e risolvere i problemi attraverso interazioni in linguaggio naturale utilizzando il protocollo Agent2Agent (A2A) e il Model Context Protocol (MCP). Questo percorso ti guida attraverso entrambi gli approcci: distribuzione di agenti su Amazon EKS e utilizzo dell’IA agentica per migliorare l’esperienza degli sviluppatori e degli operatori di Amazon EKS.

Percorso 1-1: Distribuzione degli agenti

Apri tutto

Distribuisci e scala agenti IA autonomi su Amazon EKS utilizzando l’SDK Strands Agents open source o il tuo framework di agenti preferito. Questo approccio offre il controllo completo sull’infrastruttura degli agenti, consentendoti di utilizzare qualsiasi modello e personalizzare la distribuzione. EKS offre funzionalità di livello di produzione per l’esecuzione di agenti IA containerizzati con elevata disponibilità e scalabilità.

Esplora i fondamenti della creazione e della distribuzione di agenti IA su EKS. Scopri l’SDK di Strands Agents e come semplifica lo sviluppo degli agenti oppure applica questi concetti al tuo framework preferito. Studia un esempio reale sulle previsioni meteorologiche per capire come un semplice agente può integrarsi con API esterne, gestire le risposte in streaming ed elaborare le query in linguaggio naturale. Questo esempio dimostra concetti chiave come prompt di sistema, integrazione degli strumenti e flussi di lavoro API di cui avrai bisogno quando distribuisci agenti su EKS.

Segui la nostra guida dettagliata per distribuire gli agenti SDK di Strands Agents su Amazon EKS. A partire dall’apprendimento di come containerizzare il tuo agente, configurare gli endpoint FastAPI, implementare le risposte in streaming e impacchettare la tua applicazione utilizzando Docker. Usa il nostro progetto di esempio per comprendere concetti essenziali come la configurazione EKS Auto Mode, le distribuzioni di Helm e i test di base. Sebbene questa guida utilizzi Strands SDK, i principi si applicano alla distribuzione di qualsiasi agente containerizzato su EKS.

Impara a scalare e gestire le distribuzioni degli agenti in modo affidabile in produzione. Distribuisci il dimensionamento automatico per gestire carichi di lavoro variabili, ottenere un’elevata disponibilità tramite configurazioni di backup e failover e configura un monitoraggio completo utilizzando CloudWatch Container Insights. Segui la nostra guida alle best practice EKS per l’esecuzione di carichi di lavoro AI/ML per assicurarti che la tua infrastruttura di agenti sia sicura e osservabile. Segui il nostro workshop personalizzato di IA agentica su EKS per ottenere una guida dettagliata per la distribuzione di agenti IA su larga scala.

Percorso 1-2: Operazioni agentiche per Amazon EKS

Apri tutto

Trasforma le tue operazioni Kubernetes fornendo agli assistenti di codifica IA strumenti e risorse in tempo reale tramite il server MCP per Amazon EKS. Ciò consente agli agenti dIA di interagire direttamente con i tuoi cluster EKS, con guida contestuale e automazione attraverso interazioni in linguaggio naturale. Dalla creazione di cluster alla risoluzione dei problemi, questi agenti IA aiutano a semplificare le operazioni Kubernetes mantenendo le best practice di AWS.

Scopri come i diversi server MCP AWS facilitano l’interazione tra modelli di IA e servizi e risorse AWS. Esplora la guida ai server MCP EKS per capire come gli agenti IA possono aiutare ad automatizzare le attività operative più comuni, dalla gestione dei cluster alla risoluzione dei problemi. Configura il tuo ambiente di sviluppo per configurare assistenti IA come Amazon Q Developer CLI o Cline con l’integrazione del server MCP EKS.

Segui la nostra guida dettagliata per semplificare le operazioni Kubernetes con il server MCP per Amazon EKS. Impara a usare i comandi in linguaggio naturale per containerizzare e distribuire applicazioni su EKS. Guarda questa demo per saperne di più su come gli agenti IA possono aiutare a generare manifesti Kubernetes, gestire le risorse del cluster e automatizzare i flussi di lavoro di distribuzione utilizzando gli strumenti del server MCP EKS.

Segui la nostra procedura dettagliata per la risoluzione dei problemi assistita dall’IA con il server MCP per Amazon EKS per scoprire come gli agenti dIA possono aiutare a monitorare lo stato delle applicazioni e risolvere i problemi più comuni. Attraverso esempi pratici di debugging dei guasti dei pod e dei problemi di infrastruttura, impara a utilizzare le query in linguaggio naturale per controllare le metriche di CloudWatch, analizzare i log e diagnosticare i problemi. Questa guida pratica dimostra come l’assistenza basata sull’IA può aiutarti a sfruttare Amazon CloudWatch e altri servizi AWS per mantenere le applicazioni integre su EKS.

Percorso 2-0: IA generativa

Apri tutto

Il panorama dell’IA generativa si sta evolvendo rapidamente, con le organizzazioni che creano, distribuiscono e scalano diversi carichi di lavoro IA/ML per casi d’uso che vanno dall’addestramento dei modelli distribuiti, alla messa a punto e alle distribuzioni di inferenze su larga scala. Clienti come Anthropic e Adobe stanno scegliendo Amazon EKS per ottenere un controllo granulare sulle risorse di calcolo mantenendo al contempo l’efficienza operativa. Dai un’occhiata a questa guida per avere una panoramica sul motivo per cui i clienti scelgono EKS for AI/ML per casi d’uso comuni come l’addestramento e la distribuzione di modelli, la generazione potenziata da recupero dati (RAG) e l’inferenza.

Percorso 2-1: Distribuzione e inferenza del modello

Apri tutto

Amazon EKS consente distribuzioni di inferenza di livello di produzione con supporto per l’ottimizzazione della GPU, il servizio multimodello e il dimensionamento automatico. Le organizzazioni possono sfruttare le competenze e le pratiche operative di EKS esistenti per distribuire e gestire rapidamente i carichi di lavoro di inferenza insieme ad altre applicazioni. Grazie all’integrazione con strumenti open source e alla vasta gamma di acceleratori su AWS, aziende come Vannevar Labs e Omi hanno ottenuto una significativa riduzione dei costi e miglioramenti delle prestazioni mantenendo al contempo la coerenza operativa in tutta la loro infrastruttura.

Scopri i fondamenti dell’infrastruttura e dell’architettura per l’implementazione dei carichi di lavoro di inferenza su EKS in questa guida alla soluzione che tratta argomenti chiave come il supporto delle GPU, i modelli di servizio dei modelli e l’ottimizzazione delle risorse. Esplora il progetto IA su EKS open source, che fornisce modelli pronti per la distribuzione, come la configurazione di un servizio di inferenza LLM scalabile con modelli infrastructure-as-code per la distribuzione in produzione.

Inizia con la nostra Guida alle mbest practice per la configurazione di cluster per l’inferenza in tempo reale per creare un cluster EKS ottimizzato per i carichi di lavoro di inferenza di produzione. Distribuisci modelli utilizzando la nostra IA pronta per la produzione su grafici di inferenza EKS, che fornisce grafici Helm e modelli infrastructure-as-code per framework popolari come vLLM e NVIDIA Triton. Per i carichi di lavoro ML tradizionali, consulta la guida per sviluppatori di AWS Deep Learning Containers per l’inferenza basata su CPU e GPU per i modelli di distribuzione.

Segui i nostri workshop pratici per distribuire carichi di lavoro di inferenza su EKS utilizzando l’acceleratore che preferisci: il workshop basato su NVIDIA per l’inferenza basata su GPU e il workshop basato su AWS Neuron che utilizza gli acceleratori Inferentia e Trainium. Entrambi i workshop coprono attività essenziali come la configurazione dei plug-in dei dispositivi, la gestione delle risorse e il monitoraggio. Fai riferimento alla guida completa alle best practice di EKS per i carichi di lavoro AI/ML per assicurarti che le distribuzioni di inferenza seguano modelli comprovati di elaborazione, rete, archiviazione e osservabilità. Queste guide servono come riferimenti continui mentre gestisci ed evolvi la tua architettura di inferenza su EKS.