Le Blog Amazon Web Services
Automatisez la gestion des ressources cloud pour les événements planifiés
Les organisations de tous secteurs font face à des défis opérationnels lors de la gestion d’événements planifiés à fort trafic. Les équipes métier doivent créer des tickets au support IT pour chaque événement, nécessitant que les équipes DevOps provisionnent et dimensionnent manuellement les ressources. Ce processus crée des goulots d’étranglement qui impactent l’expérience client et l’efficacité opérationnelle.
L’exemple d’implémentation « Event Scheduling on AWS » répond à ces défis en automatisant le provisionnement et le dimensionnement des ressources pour les événements planifiés. Cet exemple permet aux organisations de délivrer des expériences client exceptionnelles pendant les périodes de forte demande tout en réduisant les coûts opérationnels et en éliminant la coordination manuelle entre les équipes métier et techniques.
Comprendre le défi
Les entreprises de multiples secteurs font face à des obstacles opérationnels similaires lors de la gestion d’événements planifiés. Une entreprise de médias planifiant une diffusion sportive en direct doit se coordonner avec les équipes DevOps des semaines à l’avance, créant des tickets de support et nécessitant la présence du personnel technique pendant les événements pour les opérations de dimensionnement manuel.
Les organisations de vente au détail préparant des ventes flash rencontrent des défis comparables. Les plateformes e-commerce doivent provisionner une capacité de calcul supplémentaire, configurer des réseaux de diffusion de contenu (CDN) et dimensionner les ressources de base de données pour gérer les pics de trafic soudains, pendant les événements promotionnels. La coordination manuelle entre les équipes marketing et techniques crée des retards et augmente le risque de défaillances.
Les entreprises de jeux vidéo lançant de nouveaux titres ou organisant des tournois d’e-sport font face à des complexités de dimensionnement d’infrastructure. Elles doivent coordonner le provisionnement de serveurs dans plusieurs régions, configurer les services de matchmaking et s’assurer que les systèmes backend peuvent gérer les charges de joueurs simultanés. La nature manuelle de ces opérations résulte souvent en de mauvaises expériences joueur pendant les événements de jeu de pointe.
Les organisations de services financiers gérant les événements de plateformes de trading rencontrent des goulots d’étranglement opérationnels similaires. Les événements de marché, les annonces de résultats et les changements réglementaires nécessitent des ajustements rapides d’infrastructure pour gérer l’augmentation des volumes de trading. Les processus de provisionnement manuel créent des retards qui peuvent impacter les performances de trading et la satisfaction client.
Ces approches manuelles augmentent les frais opérationnels et prolonge les délais de planification dans tous les secteurs. Les risques d’erreur humaine augmentent, l’utilisation des ressources IT devient inefficace et les organisations peinent à dimensionner leurs opérations efficacement. Ces facteurs impactent directement la qualité de service pendant les moments critiques pour l’entreprise.
Architecture de la solution
L’exemple d’implémentation « Event Scheduling on AWS » utilise une architecture événementielle construite sur les technologies serverless AWS. AWS Step Functions orchestre les workflows à travers les phases de préparation, provisionnement, configuration et nettoyage. Amazon EventBridge gère la planification des événements et la coordination des messages.
Le workflow Step Functions implémente un cycle de vie d’événement complet à travers les phases preroll
et postroll
. La phase preroll
s’exécute avant l’événement, gérant le provisionnement des ressources, la validation de configuration et les tâches de préparation système. Pendant cette phase, la plateforme déploie des produits AWS Service Catalog, exécute les documents Systems Manager pour le dimensionnement d’infrastructure et effectue des vérifications pour assurer la préparation.
La phase postroll
s’active après la fin de l’événement, gérant le nettoyage des ressources, l’optimisation des coûts et les rapports opérationnels. Cette phase termine les ressources temporaires, réduit l’infrastructure aux niveaux de base et génère des rapports de performance d’événement. L’approche preroll
et postroll
assurent une exécution d’événement cohérente tout en optimisant l’utilisation des ressources et les coûts opérationnels.
AWS Service Catalog gère les déploiements d’infrastructure tandis qu’AWS Systems Manager exécute les workflows d’automatisation. AWS AppSync fournit la couche API GraphQL et Amazon CloudWatch délivre des capacités complètes de surveillance et d’alerte.
La plateforme s’intègre avec les services AWS existants à travers des tags standardisés et des politiques IAM. Les ressources étiquetées avec application=event-scheduling-platform
deviennent disponibles pour l’orchestration, permettant une intégration transparente avec l’infrastructure actuelle.
Avantages clés pour les organisations
Les équipes métier obtiennent des capacités en libre-service pour planifier des événements sans dépendances avec les équipes IT. Elles travaillent avec des métriques métier familières comme la taille de l’audience et les objectifs de performance tout en suivant le statut des événements en temps réel. Cette approche supprime les goulots d’étranglement et accélère les cycles de planification d’événements.
Les équipes opérationnelles maintiennent la visibilité et le contrôle malgré l’indépendance accrue des équipes métier. L’intégration avec AWS Chatbot délivre des notifications en temps réel vers les canaux Microsoft Teams et Slack, s’assurant que le personnel opérationnel reste informé de toutes les activités d’événements. Les équipes reçoivent des alertes pour la planification d’événements, le statut de provisionnement des ressources, le progrès d’exécution et les notifications de fin.
Ce système de notification permet aux équipes opérationnelles de surveiller les événements initiés par les équipes métier sans nécessiter d’implication directe dans les opérations de routine. Elles peuvent répondre rapidement aux problèmes tout en permettant aux équipes métier d’opérer indépendamment pour les scénarios d’événements standards. L’intégration préserve la supervision opérationnelle tout en éliminant les goulots d’étranglement de coordination manuelle.
Les équipes DevOps créent des modèles d’infrastructure réutilisables à travers les produits AWS Service Catalog et les documents Systems Manager. L’automatisation réduit l’intervention manuelle, permettant au personnel technique de se concentrer sur les améliorations de plateforme plutôt que sur les tâches opérationnelles de routine.
L’exemple d’implémentation optimise les coûts grâce au nettoyage automatique des ressources après les événements.
Architecture ouverte avec intégration des services AWS
L’exemple d’implémentation « Event Scheduling » fournit un framework ouvert qui package les cas d’usage spécifiques à l’industrie à travers les services AWS établis. Cette approche assure que les organisations peuvent tirer parti des capacités AWS existantes tout en maintenant la cohérence opérationnelle et les standards de sécurité.
Intégration AWS Systems Manager
Les documents AWS Systems Manager encapsulent les procédures opérationnelles pour différentes industries. Les entreprises de jeux vidéo peuvent créer des documents qui dimensionnent les groupes Amazon EC2 Auto Scaling et configurent les clusters Amazon ElastiCache pour les événements de tournois. Les organisations de services financiers peuvent développer des documents qui ajustent les réplicas Amazon RDS et modifient les limites de concurrence AWS Lambda pendant les événements de trading.
Chaque document Systems Manager inclut des capacités d’audit intégrées à travers l’intégration AWS CloudTrail. L’historique d’exécution, les changements de paramètres et les modifications de ressources sont automatiquement enregistrés, fournissant une traçabilité complète pour les exigences de conformité. Le service gère le versioning des documents, les capacités de rollback et l’exécution cross-région, assurant une automatisation fiable à travers les environnements distribués.
Intégration Kubernetes pour les charges de travail conteneurisées
Les organisations exécutant des applications conteneurisées peuvent implémenter des documents SSM qui s’intègrent avec les clusters Amazon EKS. Ce genre de documents adressent le défi technique d’authentification avec les clusters EKS et d’interaction avec l’API Kubernetes depuis les workflows d’automatisation SSM.
Le document SSM permettrait le pré-chauffage des ressources via Kubernetes Horizontal Pod Autoscaler (HPA)
ou Deployment
pour les clusters EKS existants. Ce document supporterait à la fois les actions pre-roll qui dimensionnent les déploiements avant les événements et les actions post-roll qui réduisent les ressources après. L’intégration tire parti des fonctions AWS Lambda dans le document SSM pour exécuter les opérations client Kubernetes, assurant une authentification sécurisée et des interactions API fiables.
Packaging de produits AWS Service Catalog
Les produits AWS Service Catalog packagent des solutions d’infrastructure complètes pour des types d’événements spécifiques. Service Catalog fournit la gouvernance à travers les contraintes de lancement, les contraintes de template et les contraintes de notification. Les portfolios de produits permettent à différentes unités organisationnelles d’accéder aux modèles d’infrastructure appropriés tout en prévenant la création de ressources non autorisées.
Streaming vidéo en direct avec source SRT
Les organisations média pourraient déployer une infrastructure complète de streaming vidéo en utilisant un produit Service Catalog qui provisionne les services AWS Media. Ce produit adresserait le défi technique de provisionnement de workflows vidéo en direct avec des endpoints d’entrée SRT et de sortie HLS/DASH prédéfinis qui s’intègrent avec les systèmes d’information existants.
Le produit inclurait MediaConnect pour l’ingestion de source SRT, MediaLive pour le traitement vidéo, MediaPackage pour le packaging de contenu et CloudFront pour la diffusion de contenu. Route 53 fournirait des noms de domaine prévisibles tandis que AWS Certificate Manager gèrerait les certificats TLS liés aux distributions CloudFront. Cette approche complète pourrait assurer une diffusion vidéo fiable avec une configuration manuelle minimale.
Intégration de solutions AWS
Les organisations peuvent tirer parti des architectures AWS existantes en intégrant les templates CloudFormation ou Terraform dans les produits Service Catalog,
Cette approche permet aux organisations de construire sur des architectures AWS éprouvées tout en ajoutant des configurations personnalisées et des contrôles de gouvernance. L’intégration maintient les bénéfices des architectures AWS tout en fournissant les capacités d’automatisation et de planification de la l’exemple d’implémentation « Event Scheduling ».
Fiabilité opérationnelle
AWS Step Functions fournit une orchestration de workflow fiable avec gestion d’erreur intégrée, logique de « retry » et gestion d’état. Le service gère automatiquement les défaillances transitoires et fournit un historique d’exécution détaillé pour le dépannage. L’intégration avec Amazon EventBridge assure que la planification d’événements reste précise même pendant les interruptions de service.
Amazon CloudWatch surveille tous les composants de la plateforme avec des métriques personnalisées, des alarmes et des tableaux de bord. Les organisations peuvent suivre les taux de succès d’événements, les temps de provisionnement des ressources et les métriques d’optimisation des coûts. AWS X-Ray fournit des capacités de traçage distribué pour les workflows d’événements multi-services complexes.
Commencer
Suivez le README.md dans le projet GitHub
Intégration des ressources
Les produits AWS Service Catalog et les documents Systems Manager existants s’intègrent avec la plateforme à travers un étiquetage approprié. Les ressources doivent inclure l’étiquette application=event-scheduling-platform
pour devenir découvrables par le système d’orchestration.
La plateforme fournit des scripts d’enregistrement automatisés qui découvrent et enregistrent les ressources correctement étiquetées. Cela élimine les exigences d’enregistrement manuel et assure une intégration cohérente à travers l’infrastructure existante.
Un outil d’audit valide la configuration et identifie les problèmes d’intégration communs. L’outil vérifie les permissions IAM, la configuration Service Catalog, la configuration Systems Manager et l’étiquetage des ressources pour assurer le bon fonctionnement de la plateforme.
Considérations de coûts
La solution utilise des services AWS pay-per-use incluant DynamoDB, Lambda, Step Functions, AppSync et CloudWatch. Les coûts évoluent avec les modèles d’utilisation et la fréquence des événements plutôt que de nécessiter des investissements d’infrastructure fixes.
Le nettoyage automatique des ressources après les événements prévient les charges inutiles des ressources orphelines. La conception de l’architecture minimise les transitions d’état et optimise l’utilisation des services pour contrôler les dépenses opérationnelles.
Prochaines étapes
L’exemple d’implémentation « Event Scheduling » permet aux organisations de transformer leurs opérations de gestion d’événements en éliminant les processus manuels et en réduisant les frais généraux opérationnels. Les organisations bénéficient de cycles de déploiement d’événements plus rapides, d’une meilleure utilisation des ressources et d’expériences client améliorées pendant les moments critiques pour l’entreprise.
Explorez l’implémentation open-source pour comprendre les modèles d’intégration et les décisions architecturales. La documentation complète inclut des guides de déploiement, des ressources de dépannage et des exemples d’extension.
Commencez avec les ressources d’exemple pour comprendre les capacités de la plateforme, puis intégrez progressivement l’infrastructure existante à travers les processus d’étiquetage et d’enregistrement appropriés. Les outils d’audit aident à assurer une intégration réussie et identifient les opportunités d’optimisation.