Le Blog Amazon Web Services
Nomalab automatise la détection de coupures publicitaires dans les flux média avec AWS
L’industrie du Media & Entertainment traverse une transformation sans précédent. Face a l’explosion du volume et diversité de contenu, les diffuseurs et éditeurs doivent innover pour rester compétitif. L’optimisation des flux de travail média, de l’ingestion à la livraison, constitue aujourd’hui un enjeu stratégique majeur.
Face à ce défi, Nomalab, une plateforme de gestion média basée sur le cloud disponible sur Amazon Web Services (AWS) Marketplace, a exploité la puissance de l’IA et de l’IA générative grâce au framework Guidance for Media2Cloud on AWS (Media2Cloud). Ce framework, open source et serverless, démontre comment l’adoption des dernières technologies cloud et d’IA permet d’accroître l’efficacité et positionner les organisations médias pour un succès à long terme.
Nous explorerons comment l’utilisation innovante des services AWS et de l’IA générative par Nomalab transforme les flux de travail médias et établit une nouvelle norme en matière d’efficacité du traitement de contenu.
Le cas d’usage de Nomalab
Les clients de Nomalab font face à une demande croissante pour diffuser de plus en plus de contenus vers la télévision linéaire et les plateformes Over-the-Top (OTT). Dans ce contexte, l’automatisation devient non seulement souhaitable, mais essentielle pour maintenir un avantage concurrentiel en termes d’expérience des téléspectateurs et d’efficacité opérationnelle.
Un point particulièrement critique dans les pipelines de livraison de contenu est la génération de métadonnées de segmentation pour les longs contenus. Plus précisément, l’identification précise des séquences de titre, des génériques de fin et des points d’insertion publicitaire qui respectent l’expérience narrative du spectateur.
L’objectif était ambitieux : créer un système capable de générer automatiquement des métadonnées précises, sans intervention humaine ultérieure. Y parvenir permettrait d’accélérer considérablement le flux de travail de préparation du contenu et réduirait significativement les coûts. Cet impératif d’automatisation est devenu la force motrice derrière la solution innovante de Nomalab, transformant ce qui était autrefois un processus humain chronophage en une opération rationalisée et automatisée.
«Nos clients doivent pouvoir insérer des publicités de manière fluide dans leur programmation, mais examiner manuellement des heures de séquences pour identifier les coupures publicitaires appropriées prend énormément de temps», explique Romane Lafon, CTO des Médias Digitaux chez Nomalab. «Nous savions que l’IA pouvait être la réponse, mais nous voulions une solution performante et précise et rentable à exécuter à grande échelle.»
Le succès de cette solution automatisée a été mesuré selon des normes de qualité rigoureuses. Ils se sont fixés pour objectif d’atteindre un taux de précision supérieur à 90 % pour les points de segmentation identifiés, par rapport à l’identification manuelle par des experts humains. Ce seuil élevé garantit que le système automatisé fonctionne à un niveau qui correspond aux processus manuels traditionnels. Ce niveau a donné aux clients de Nomalab la confiance dont ils avaient besoin pour adopter pleinement le flux de travail automatisé dans leurs pipelines de livraison de contenu.
Intégration de Media2Cloud et de l’IA générative
Pour répondre au défi de l’automatisation de la détection des coupures publicitaires dans le contenu vidéo, Nomalab s’est tourné vers Media2Cloud. Le Guidance pour Media2Cloud on AWS facilite non seulement la migration des actifs vidéo et des métadonnées vers AWS, mais génère aussi des informations plus approfondies sur le contenu. Il permet l’extraction automatique de métadonnées précises à partir de plusieurs types de contenu en exploitant les services d’IA d’AWS.
«En intégrant Media2Cloud et des capacités d’IA avancées, nous avons pu développer une solution particulièrement puissante qui automatise les tâches clés et délivre des résultats mesurables pour nos clients », déclare Romane Lafon.
L’une des fonctionnalités de Media2Cloud est la détection des opportunités de coupure publicitaire. Son approche combine l’intelligence artificielle traditionnelle et l’apprentissage automatique (IA/ML) avec l’IA générative pour détecter les ruptures naturelles dans le contenu, appelées de points de chapitre. Ces points représentent des transitions logiques où le contexte visuel et le contexte narratif changent simultanément. Par exemple, la transition d’une conversation en intérieur vers une scène en extérieur peut être considérée comme une coupure. Identifier ces points efficacement nécessite d’analyser simultanément les composantes visuelles et sonores.
Le processus commence avec l’API Segment d’Amazon Rekognition, qui fournit une détection de prises de caméra à l’image près (frame-accurate) et une identification des repères techniques (comme les barres de couleur, les images noires (black frames) et les génériques de fin).
Figure 1 : Prises de caméra à l’image près (shot)- API Segment d’Amazon Rekognition.
L’étape suivante regroupe des prises caméra similaires en scènes. Pour ce faire, la solution utilise le modèle Amazon Titan Multimodal Embedding via Amazon Bedrock. Le processus implique la conversion d’images en embeddings vectoriels qui capturent des caractéristiques sémantiques. Les embeddings sont stockés dans Amazon OpenSearch Service avec un plugin K-NN, puis analyse les modèles de similarité pour regrouper les prises connexes en scènes cohérentes.
Figure 2 : Regroupement de prises similaires en scènes logiques.
L’étape finale combine la détection de scène avec l’analyse de conversation pour créer des ruptures de chapitre significatives. Media2Cloud utilise Amazon Transcribe pour convertir les voix en texte avec des horodatages précis, ainsi que les modèles de fondation d’Amazon Bedrock pour analyser le flux de conversation et identifier les transitions de sujets.
Figure 3 : Analyse de la transcription pour les changements de sujet.
En conséquence, ce flux de travail intelligent génère des points de transition naturels où les coupures publicitaires seraient les moins perturbatrices pour l’expérience de visionnage. Ce procédé définit les bases de stratégies de placement publicitaire avancées.
Figure 4 : Alignement des éléments visuels et de l’audio permettant d’identifier des coupures non intrusives.
Placement des coupures publicitaires
S’appuyant sur cette base, la fonctionnalité de détection des coupures publicitaires de Media2Cloud porte l’analyse du contenu vidéo au niveau supérieur. Le système identifie avec précision les opportunités de placement publicitaire au niveau des images tout en fournissant de informations contextuelles riches grâce à des classifications standard de l’industrie comme IAB Content Taxonomy V3 et GARM Taxonomy. Cette connaissance contextuelle est cruciale, elle permet d’aiguiller les Ad Decision Servers (ADS) à proposer des publicités en rapport avec le contenu.
Figure 5 : Génération de la réponse contextuelle.
Intégration
L’intelligence de la solution de Nomalab s’étend au-delà de la détection initiale par Media2Cloud pour inclure une phase sophistiquée de post-évaluation. Cette étape indispensable emploie des algorithmes développés par Nomalab qui reflètent les processus de prise de décision humaine pour affiner et ainsi optimiser la sélection des coupures publicitaires. En appliquant des règles commerciales personnalisées, le système filtre et hiérarchise intelligemment les opportunités potentielles de coupures publicitaires. Il garantit que seules les coupures les plus stratégiques et appropriées sont retenues dans la version finale. Ce processus curatif intelligent transforme les données brutes de détection en informations exploitables en production, en fournissant précisément le nombre de coupures publicitaires souhaitées et en maintenant l’intégrité de l’expérience de visionnage.
Figure 6 : Flux de travail d’analyse de Nomalab.
«L’intégration avec Media2Cloud a été décisive», explique Romane Lafon. «Media2Cloud nous a fourni une base évolutive et native du cloud sur laquelle construire, nous permettant de nous concentrer sur les fonctionnalités basées sur l’IA qui apporteraient une réelle valeur à nos clients et sur notre propre algorithme de post-évaluation. De plus, les capacités d’IA générative d’Amazon Bedrock ont été un véritable accélérateur. En combinant l’analyse de signal conventionnelle, l’analyse visuelle, la conversion des voix en texte, la compréhension du langage naturel en combinaison des règles métier, nous avons pu créer un système de détection de coupures publicitaires incroyablement précis qui s’approche des décisions qu’un expert humain prendrait.»
Avantages et résultats
En automatisant la détection des opportunités de coupure publicitaire, Nomalab a transformé radicalement son flux de travail. L’analyse d’une bibliothèque de contenu qui prenait habituellement plusieurs jours (environ 25 programmes par jour ouvrable pour un spécialiste qualifié) peut désormais être traitée en quelques heures, à une échelle pratiquement illimitée, sans compromettre la précision de détection.
«Notre objectif global était d’atteindre un taux de précision d’au moins 90 % , par rapport à l’évaluation manuelle, et nous sommes presque et même plus, selon la typologie du contenu», déclare Romane Lafon. «Le plus appréciable, c’est que nos clients n’ont pas à se soucier de la complexité sous-jacente — ils obtiennent simplement un actif média entièrement enrichi prêt pour la distribution.»
L’évolutivité de l’infrastructure AWS est un moteur pour Nomalab. «Nous traitons des dizaines de milliers de contenus par an, tout en gardant nos coûts sous contrôle», ajoute Romane Lafon. «C’est gagnant-gagnant pour nous et nos clients.»
Regard vers le futur
Alors que l’industrie des médias poursuit sa transformation, la solution de Nomalab illustre parfaitement le potentiel transformateur des services AWS et de l’IA générative.
«Ce n’est que le début», dit Romane. «Nous explorons déjà comment nous pouvons utiliser ces technologies pour automatiser des tâches comme la classification de contenu, l’enrichissement des métadonnées, et même le contrôle qualité des médias. Les possibilités semblent infinies.»
L’intégration des capacités d’IA générative au cœur des solutions, alimentées par Amazon Bedrock (combinée avec des services comme Amazon Rekognition et Amazon Transcribe) montre le potentiel transformateur de la convergence des technologies d’IA et du cloud. En intégrant de façon transparente l’analyse visuelle, la transcription de la voix en texte, les grands modèles de langage et leurs propres algorithmes, Nomalab a su développer un système de détection d’opportunités de coupures publicitaires très précis, rivalisant avec des performances humaine.
Cette synergie des services cœur d’IA/ML et du raisonnement avancé de l’IA générative débloque la création de nouvelles données, établissant une nouvelle référence pour l’analyse de contenu et l’automatisation dans l’industrie des médias.
Pour l’avenir, l’industrie des médias peut s’attendre à voir ces technologies continuer à converger, conduisant à des pipelines de traitement de contenu de plus en plus intelligents et automatisés. Sans aucun doute, la capacité à exploiter l’IA basée sur le cloud et l’apprentissage automatique sera un différenciateur concurrentiel clé pour les organisations médiatiques cherchant à rester à la pointe du progrès.
Pour les entreprises médias cherchant à préparer leurs opérations pour le futur, le succès de la solution de Nomalab sur AWS constitue un puissant exemple de ce qui est possible. En adoptant les dernières avancées en matière de cloud, d’IA et d’IA générative, les leaders de l’industrie peuvent débloquer de nouveaux niveaux d’efficacité, de précision et d’innovation, transformant leurs flux de travail médias pour l’ère numérique.
Contactez un représentant AWS pour savoir comment nous pouvons aider à accélérer votre entreprise.
Lectures complémentaires
- Commencer à utiliser Amazon Bedrock
- Media2Cloud on AWS Guidance : Détection de scènes et de pauses publicitaires et compréhension contextuelle pour la publicité à l’aide de l’IA générative (Anglais)
- Compréhension vidéo avec l’IA générative sur AWS (Anglais)
- La nouvelle génération d’intelligence media avec le Guidance on Media2Cloud sur AWS en version 4.0 (Anglais)