Passer au contenu principal

Amazon OpenSearch Service

Amazon OpenSearch Service en tant que base de données vectorielles

Créez des applications de recherche vectorielle et d’IA d’entreprise avec une base de données vectorielles évolutive, sécurisée et performante.

Présentation

Le moteur vectoriel d’OpenSearch Service offre une base de données vectorielles évolutive, sécurisée et performante pour les applications d’IA générative modernes. Stockez et recherchez facilement des milliards de vecteurs de grande dimension en quelques millisecondes à l’aide d’algorithmes avancés k-Nearest Neighbors (k-NN) et Approximate Nearest Neighbors (ANN) avec des implémentations Hierarchical Navigable Small World (HNSW) et Inverted File (IVF). Combinez de manière fluide des vectorisations avec des mots clés textuels pour des fonctionnalités de recherche vectorielle (sémantique, multimodale, conversationnelle, etc.), des systèmes de recommandation, des chatbots et d’autres applications modernes d’IA générative. Créez des applications de génération augmentée de récupération (RAG) qui connectent en toute sécurité les modèles de fondation (FM) aux données de votre entreprise pour des réponses précises et contextuelles, éliminant ainsi le besoin de peaufinage et de réentraînement. Optimisez les coûts grâce à une gestion intelligente du cycle de vie des données tout en maintenant des performances de requêtes rapides sur tous les niveaux de stockage. La base de données vectorielles est disponible dans une configuration entièrement gérée ou sans serveur.

Avantages

Améliorez la qualité de la recherche en combinant de manière fluide des vectorisations avec des requêtes de mots clés textuelles dans une seule demande de recherche et utilisez des algorithmes avancés de voisin le plus proche tels qu’ANN (pour HNSW et IVF) et la recherche vectorielle k-NN exacte avec mise à l’échelle automatique pour fournir des recherches de similarité à faible latence. Créez des bases de données vectorielles de plusieurs milliards d’entrées en moins d’une heure grâce à l’accélération GPU et accélérez la mise sur le marché d’applications de recherche basées sur l’IA, de systèmes de recommandation et d’autres applications d’IA agentique.

Tirez parti de la gestion intelligente du cycle de vie des données pour optimiser les coûts à mesure que vos charges de travail augmentent.  Simplifiez les opérations de bases de données vectorielles grâce à une interface facile à utiliser pour les configurations entièrement gérées et sans serveur. Utilisez la Console de gestion AWS et les API intuitives pour déployer, gérer et mettre à l’échelle facilement votre base de données vectorielles, sans complexité opérationnelle. Optimisez automatiquement pour améliorer la qualité et la rapidité des recherches et réaliser des économies au lieu de passer des semaines à configurer manuellement les paramètres des algorithmes, de la compression et des paramètres de performance.

Ajoutez, mettez à jour ou supprimez des vectorisations en temps réel sans réindexer ou affecter les performances des requêtes. Cette fonctionnalité garantit que les modèles d’IA et les applications de recherche restent réactifs aux modifications dynamiques des données, ce qui en fait la solution idéale pour des cas d’utilisation tels que la personnalisation du commerce électronique ou la détection d’anomalies lorsque les données évoluent fréquemment.

Amazon OpenSearch Service s’intègre aux services AWS et à des plateformes d’IA tierces pour prendre en charge des applications modernes d’IA générative. L’intégration zéro ETL avec Amazon DynamoDB et Amazon DocumentDB vous permet d’améliorer vos applications d’IA générative grâce à la recherche vectorielle dans des données opérationnelles sans créer de pipelines complexes. L’intégration bidirectionnelle native avec Amazon Bedrock rationalise les flux de travail d’IA générative, vous permettant de connecter des modèles de base à votre base de connaissances pour des applications de génération de vectorisation et de génération augmentée de récupération (RAG) efficaces. OpenSearch Service est la base de données vectorielles recommandée par AWS pour Amazon Bedrock. Les développeurs peuvent exploiter la puissance d’Amazon SageMaker pour l’entraînement et le déploiement de modèles, ou se connecter facilement à Amazon Titan ou à des modèles tiers tels qu’OpenAI, Cohere, DeepSeek et d’autres via des connecteurs prédéfinis. Cela permet un développement sécurisé, efficace et évolutif tout en maximisant la valeur de vos investissements existants en matière de données et d’infrastructure.

Un service entièrement géré qui dirige OpenSearch en garantissant la fiabilité de l’entreprise tout en tirant parti de l’innovation open source. La communauté open source mondiale contribue activement à OpenSearch (qui fait désormais partie de la Linux Foundation) et l’améliore, favorisant ainsi une évolution continue tandis que le service géré élimine les frais de gestion de l’infrastructure. Cette approche assure une haute disponibilité (99,99 % de SLA), une mise à l’échelle, des correctifs et des mises à jour automatisés, ainsi que la flexibilité et la neutralité vis-à-vis des fournisseurs de la technologie sous licence Apache 2.0. La communauté open source aide également à guider l’orientation du projet, garantissant une innovation continue qui profite à tous les utilisateurs.

Cas d’utilisation

Améliorez les expériences de recherche en associant la recherche par mot clé traditionnelle à la similarité vectorielle pour une pertinence accrue. Favorisez la compréhension du langage naturel, les requêtes multimodales (texte, images, audio) et les fonctionnalités de recherche hybrides pour fournir des résultats contextuellement pertinents pour divers types de contenu.

Générez des recommandations personnalisées à grande échelle en utilisant la similarité vectorielle pour faire correspondre les préférences des utilisateurs sur des milliards d’articles, fournissant ainsi des suggestions pertinentes en temps quasi réel.

Créez des chatbots, des assistants et des applications d’IA fiables en connectant des modèles de base aux données de votre entreprise, afin de permettre des réponses précises et contextuelles, ainsi que l’exécution des tâches. Éliminez les hallucinations et renforcez la précision grâce à la récupération d’informations vectorielles tout en maintenant des temps de réponse rapides pour les requêtes simples et les interactions complexes.

Identifiez les motifs et les anomalies à grande échelle en comparant les similitudes vectorielles entre de grands jeux de données, ce qui permet de détecter en temps réel les fraudes potentielles, les contrefaçons ou les activités suspectes.

Clients et partenaires

Évaluation client de riskCanvas

riskCanvas est une filiale de Genpact. Il s’agit d’un produit SaaS qui offre une solution de conformité en matière de criminalité financière et met en œuvre des technologies de pointe en matière de big data, d’automatisation et de machine learning afin de fournir conformité, efficacité et automatisation à ses clients.

« riskCanvas s’intègre directement au moteur vectoriel pour Amazon OpenSearch sans serveur, nous permettant ainsi d’exploiter nos données opérationnelles clients existantes via les capacités d’IA générative d’AWS. Il s’agit là d’un véritable tournant, car nous pouvons désormais tirer parti de la synthèse pour accélérer l’analyse des enquêtes, rédiger des récits initiaux pour les rapports de crimes financiers et formuler des recommandations sur les escalades, le tout en utilisant des données réelles gardées à l’intérieur de l’enclave sécurisée de riskCanvas. Grâce au moteur vectoriel, nous réduisons le temps de traitement dans les cas d’utilisation liés aux crimes financiers et améliorons la cohérence des récits en diminuant le nombre d’erreurs. Cela permet d’augmenter l’efficacité grâce à un traitement direct, tout en transférant l’intervention humaine vers des analyses plus approfondies. »

Ryan Skousen, directeur de la technologie (riskCanvas) et vice-président de la technologie, Genpact Financial Crimes

Missing alt text value

Évaluation client de Academia

Academia est une plateforme de partage de la recherche universitaire. La mission d’Adademia.edu est d’accélérer la recherche dans le monde.

« Amazon OpenSearch Service permet à Academia d’accélérer la recherche mondiale en offrant des capacités d’indexation et de recherche efficaces sur des millions de vecteurs, facilitant ainsi l’identification et la recommandation des articles académiques les plus pertinents à nos utilisateurs. Le passage à Amazon OpenSearch Service a entraîné une augmentation de 20 % de l’engagement de nos utilisateurs à l’égard de nos recommandations de contenu par rapport à nos solutions de recommandation précédentes. »

Bob Tucker, directeur de l’ingénierie chez Academia

Missing alt text value

Évaluation client de Intuit

Intuit Inc. est une plateforme technologique financière mondiale qui permet aux consommateurs et petites entreprises de prospérer en proposant des produits et services de gestion financière, de conformité et de marketing.

« Notre équipe de plateforme a travaillé en étroite collaboration avec AWS pour développer des fonctionnalités avancées qui facilitent le stockage, la gestion et l’interrogation des vectorisations issues de modèles de machine learning de pointe. Cela nous permet d’explorer de nouvelles opportunités pour les applications et services liés au traitement du langage naturel. Grâce à Amazon OpenSearch Service, cette solution est désormais le magasin par défaut pour tous besoins vectoriels d’Intuit. Nous sommes ravis d’étendre l’adoption de notre base de données vectorielles basée sur OpenSearch afin de répondre aux nouveaux cas d’utilisation prévus dans les mois à venir. »

Achal Kumar, responsable des capacités en matière de données chez Intuit.

Missing alt text value