Toutes les questions fréquentes (FAQ) sur S3

Questions fréquentes (FAQ) d’ordre général sur S3

Ouvrir tout

Amazon S3 est une solution de stockage d’objets conçue pour stocker et récupérer n’importe quelle quantité de données, n’importe où. S3 est un service de stockage simple qui offre une durabilité, une disponibilité, des performances, une sécurité, et une capacité de mise à l’échelle de pointe pratiquement illimitée à un tarif très bas.

Amazon S3 offre une interface simple de services Web à utiliser pour stocker et récupérer n’importe quelle quantité de données, à tout moment, depuis n’importe où. Grâce à ce service, vous pouvez facilement créer des applications utilisant le stockage cloud natif. Étant donné qu'Amazon S3 est hautement scalable et que vous payez uniquement pour ce que vous utilisez, vous pouvez démarrer modestement et développer votre application comme vous le souhaitez, sans compromettre ses performance ou sa fiabilité. Amazon S3 est également conçu pour être extrêmement flexible. Stockez tous les types et quantités de données ; lisez les mêmes données un million de fois ou uniquement pour une reprise après sinistre d'urgence ; créez une application FTP simple ou une application web sophistiquée, comme le site Web marchand d'Amazon.com. Amazon S3 vous permet de vous concentrer sur l’innovation au lieu de passer du temps à chercher comment stocker vos données.

Pour vous inscrire à Amazon S3, accédez à la console S3. Vous devez posséder un compte Amazon Web Services pour accéder à ce service. Si vous n'avez pas encore de compte, vous serez invité à en créer un au début de la procédure d'inscription à Amazon S3. Après vous être inscrit, référez-vous à la documentation d’Amazon S3, aux guides de démarrage S3 et aux ressources supplémentaires dans le centre de ressources pour commencer à utiliser Amazon S3.

Amazon S3 vous permet de profiter des avantages de la grande échelle d’Amazon sans recourir à des investissements massifs, ni compromettre les performances. Utilisez Amazon S3, une solution simple et peu coûteuse, pour garantir l’accès rapide, la disponibilité permanente et la sécurité de vos données.

Vous pouvez stocker pratiquement n’importe quel type de données sous n’importe quel format. Référez-vous au Contrat de licence Amazon Web Services pour en savoir plus.

Le volume total de données et le nombre d’objets que vous pouvez stocker dans Amazon S3 sont illimités. La taille des objets Amazon S3 individuels est comprise entre 0 octet (minimum) et 5 téraoctets (maximum). L'objet le plus grand que vous pouvez charger avec une seule commande PUT est de 5 Go. Pour les objets dont la taille est supérieure à 100 Mo, les clients doivent envisager d’utiliser la fonctionnalité de chargement partitionné.

Un compartiment à usage général est un conteneur pour les objets stockés dans Amazon S3, et vous pouvez stocker autant d’objets que vous le souhaitez dans un compartiment. Les compartiments à usage général sont le type de compartiment S3 d’origine, et un seul compartiment à usage général peut contenir des objets stockés dans toutes les classes de stockage, à l’exception de S3 Express One Zone. Ils sont recommandés pour la plupart des cas d’utilisation et des modèles d’accès.

Un compartiment de répertoires est un conteneur pour les objets stockés dans Amazon S3, et vous pouvez stocker autant d’objets que vous le souhaitez dans un compartiment. Les compartiments de répertoires S3 autorisent uniquement les objets stockés dans la classe de stockage S3 Express One Zone, ce qui permet un traitement plus rapide des données au sein d’une seule zone de disponibilité. Ils sont recommandés pour les cas d’utilisation à faible latence. Chaque compartiment de répertoires S3 peut prendre en charge jusqu’à 2 millions de transactions par seconde (TPS), quel que soit le nombre de répertoires qu’il contient.

Un compartiment de table est spécialement conçu pour stocker des tables au format Apache Iceberg. Utilisez Amazon S3 Tables pour créer des compartiments de tables et configurer des autorisations au niveau des tables en quelques étapes seulement. Les compartiments de tables S3 sont spécifiquement optimisés pour les charges de travail d’analytique et de machine learning. Grâce à la prise en charge intégrée d’Apache Iceberg, vous pouvez interroger des données tabulaires dans S3 à l’aide de moteurs de requêtes courants tels qu’Amazon Athena, Amazon Redshift et Apache Spark. Utilisez les compartiments de tables S3 pour stocker des données tabulaires telles que les transactions d’achat quotidiennes, les données des capteurs de streaming ou les impressions d’annonces sous forme de table Iceberg dans Amazon S3, puis interagissez avec ces données à l’aide de fonctionnalités d’analytique.

Un compartiment vectoriel est spécialement conçu pour stocker et interroger des vecteurs. Dans un compartiment vectoriel, vous n’utilisez pas les API d’objets S3, mais plutôt des API vectorielles dédiées pour écrire des données vectorielles et les interroger en fonction de leur signification sémantique et de leur similitude. Vous pouvez contrôler l’accès à vos données vectorielles avec des mécanismes de contrôle d’accès existants dans Amazon S3, notamment des politiques de compartiment et IAM. Toutes les écritures dans un compartiment vectoriel sont parfaitement cohérentes, ce qui signifie que vous pouvez accéder immédiatement aux derniers vecteurs ajoutés. Au fur et à mesure que vous écrivez, mettez à jour et supprimez des vecteurs au fil du temps, les compartiments vectoriels S3 optimisent automatiquement les données vectorielles qui y sont stockées afin d’obtenir un rapport prix-performance optimal, même lorsque les jeux de données sont mis à l’échelle et évoluent.

Un compartiment est un conteneur pour les objets et les tables stockés dans Amazon S3, et vous pouvez stocker autant d’objets que vous le souhaitez dans un compartiment. Les compartiments à usage général sont le type de compartiment S3 d’origine, et un seul compartiment à usage général peut contenir des objets stockés dans toutes les classes de stockage, à l’exception de S3 Express One Zone. Ils sont recommandés pour la plupart des cas d'utilisation et des modèles d'accès. Les compartiments de répertoires S3 autorisent uniquement les objets stockés dans la classe de stockage S3 Express One Zone, ce qui permet un traitement plus rapide des données au sein d'une seule zone de disponibilité. Ils sont recommandés pour les cas d’utilisation à faible latence. Chaque compartiment de répertoires S3 peut prendre en charge jusqu’à 2 millions de transactions par seconde (TPS), quel que soit le nombre de répertoires qu’il contient. Les compartiments de tables S3 sont spécialement conçus pour stocker des données tabulaires dans S3, telles que les transactions d’achat quotidiennes, le streaming de données de capteurs ou les impressions publicitaires. Lorsque vous utilisez un compartiment de tables, vos données sont stockées sous forme de table Iceberg dans S3, puis vous pouvez interagir avec ces données à l’aide de fonctionnalités d’analytique telles que des transactions au niveau des lignes, des instantanés de table interrogeables, etc., le tout géré par S3. De plus, les compartiments de tableaux assurent une maintenance continue des tableaux afin d’optimiser automatiquement l’efficacité des requêtes au fil du temps, même à mesure que le lac de données se met à l’échelle. Les compartiments vectoriels S3 sont spécialement conçus pour stocker et interroger des vecteurs. Dans un compartiment vectoriel, vous utilisez des API vectorielles dédiées pour écrire des données vectorielles et les interroger en fonction de leur signification sémantique et de leur similitude. Vous pouvez contrôler l’accès à vos données vectorielles à l’aide des mécanismes de contrôle d’accès existants dans Amazon S3, notamment des politiques de compartiment et IAM. Au fur et à mesure que vous écrivez, mettez à jour et supprimez des vecteurs au fil du temps, les compartiments vectoriels S3 optimisent automatiquement les données vectorielles qui y sont stockées afin d’obtenir un rapport prix-performance optimal, même lorsque les jeux de données sont mis à l’échelle et évoluent.

Amazon stocke vos données et vérifie l’utilisation qui en est faite à des fins de facturation. Amazon n'accédera pas à vos données à des fins autres que celles de l'offre Amazon S3, sauf si la loi l'exige. Référez-vous au Contrat de licence Amazon Web Services pour en savoir plus.

Oui. Les organisations d'Amazon utilisent Amazon S3 pour divers types de projets. Un grand nombre de ces projets utilisent Amazon S3 en tant que magasin de données faisant autorité et s’y fient pour les opérations critiques.

Amazon S3 est un magasin d’objets sur clé simple. Lorsque vous stockez des données, vous leur attribuez une clé d'objet unique qui peut ensuite être utilisée pour les récupérer. Les clés peuvent être une chaîne quelconque et structurées pour imiter les attributs hiérarchiques. Vous pouvez également utiliser S3 Object Tagging pour organiser vos données sur l’ensemble de vos compartiments et préfixes S3.

Amazon S3 fournit une interface de services web simple de type REST reposant sur des normes, conçue pour fonctionner avec n’importe quelle boîte à outils de développement Internet. Les opérations sont volontairement simplifiées pour faciliter l’ajout de nouveaux protocoles de distribution et de couches fonctionnelles.

Amazon S3 vous permet d’accéder à la même infrastructure de stockage de données hautement évolutive, hautement disponible, rapide, peu coûteuse qu’Amazon utilise pour faire fonctionner son propre réseau mondial de sites Web. La classe de stockage S3 Standard est conçue pour offrir 99,99 % de disponibilité, les classes de stockage S3 Standard-IA, S3 Intelligent-Tiering et S3 Glacier Instant Retrieval 99,9 % de disponibilité, la classe S3 Unizone-IA 99,5 % de disponibilité et les classes S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive sont conçues pour une disponibilité de 99,99 % et un SLA de 99,9 %. Toutes ces classes de stockage sont accompagnées du contrat de niveau de service (SLA) Amazon S3.

Amazon S3 est conçu à partir de zéro pour traiter le trafic de toute application Internet. Grâce à la tarification à l'usage et à une capacité illimitée, vos coûts progressifs ne changent pas et votre service n'est pas interrompu. La grande échelle d’Amazon S3 vous permet de répartir la charge uniformément, de sorte qu’aucune application individuelle ne soit affectée par les pics de trafic.

Oui. Le contrat de niveau de service Amazon S3 donne droit à un crédit de service si le pourcentage de disponibilité mensuelle d’un client est inférieur à notre engagement de service au cours de n’importe quel cycle de facturation.

Amazon S3 offre automatiquement une forte cohérence lecture après écriture, sans modification des performances ou de la disponibilité, sans sacrifier l’isolation régionale pour les applications et sans frais supplémentaires. Après l'écriture réussie d'un nouvel objet ou le remplacement réussi d'un objet existant, toute demande de lecture ultérieure reçoit immédiatement la dernière version de l'objet. S3 fournit également une forte cohérence pour les opérations de liste. Par conséquent, après une écriture, vous pouvez immédiatement effectuer une liste des objets dans un compartiment avec toutes les modifications prises en compte.

Une forte cohérence lecture après écriture est utile lorsque vous devez immédiatement lire un objet après une écriture ; par exemple, lorsque vous effectuez souvent la lecture et le listage immédiatement après avoir écrit des objets. Les charges de travail de calcul haute performance bénéficient également du fait que lorsqu'un objet est écrasé, puis lu plusieurs fois simultanément, une forte cohérence lecture après écriture garantit que l'écriture la plus récente est lue sur toutes les lectures. Ces applications bénéficient automatiquement et immédiatement d'une forte cohérence lecture après écriture. La forte cohérence de S3 réduit également les coûts en éliminant le besoin d’une infrastructure supplémentaire pour fournir une cohérence forte.

Régions AWS

Ouvrir tout

Vous spécifiez une Région AWS lorsque vous créez votre compartiment à usage général Amazon S3. Concernant les classes de stockage S3 Standard, S3 Standard-IA, S3 Intelligent-Tiering, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive, vos objets sont automatiquement stockés sur plusieurs appareils répartis sur un minimum de trois zones de disponibilité (AZ). Les zones de disponibilité sont physiquement séparées par une distance significative, c'est-à-dire plusieurs kilomètres, de toute autre zone de disponibilité, bien qu'elles se trouvent toutes à moins de 100 km les unes des autres. Les objets stockés dans une classe de stockage S3 Unizone-IA sont stockés de façon redondante dans une seule zone de disponibilité dans la Région AWS de votre choix. Vous spécifiez une seule zone de disponibilité ou une zone locale dédiée AWS lorsque vous créez votre compartiment de répertoires. Les objets des compartiments de répertoires sont stockés de manière redondante dans une seule zone de disponibilité ou une seule zone locale. Lorsque vous utilisez des classes de stockage S3 pour des zones locales dédiées, vos objets restent dans la zone locale dédiée, sauf si vous les transférez vers une Région AWS. Pour S3 sur Outposts, vos données sont stockées dans votre environnement Outpost sur site, à moins que vous ne choisissiez manuellement de les transférer vers une Région AWS. Pour en savoir plus sur la disponibilité du service Amazon S3 par Région AWS, référez-vous à la liste des services régionaux AWS.

Vous devez utiliser les classes de stockage S3 pour les zones locales dédiées AWS si vos données et applications sensibles doivent être exécutées sur une infrastructure physiquement distincte, dédiée à votre usage exclusif et relevant d’une juridiction réglementaire spécifiée pour répondre aux exigences de sécurité et de conformité. Par exemple, certaines réglementations exigent que les données soient stockées dans un pays ou un État en particulier, pour des raisons réglementaires, contractuelles ou de sécurité de l’information courantes dans le secteur public, la santé, le pétrole et le gaz et d’autres secteurs hautement réglementés. AWS travaille avec vous pour configurer vos propres zones privées avec les fonctionnalités de sécurité et de gouvernance améliorées nécessaires pour vous aider à répondre à vos exigences réglementaires.

Une Région AWS est un emplacement physique dans le monde où sont regroupés les centres de données AWS. Chaque groupe de centres de données logiques au sein d'une région est appelé zone de disponibilité (AZ). Chaque région AWS se compose d'au moins trois zones de disponibilité, isolées et physiquement séparées au sein d'une zone géographique. D'autres fournisseurs de services cloud définissent souvent une région comme un centre de données unique. Chez AWS, la multiplicité des zones de disponibilité des régions AWS est avantageuse pour les clients. Chaque zone de disponibilité dispose d’une alimentation, d’un refroidissement et d’une sécurité physique indépendants et est connectée au moyen des réseaux redondants à très faible latence.

Une zone de disponibilité (AZ) comprend un ou plusieurs centres de données à part entière dotés d’une alimentation redondante, d’une mise en réseau et d’une connectivité au sein d’une Région AWS. Les zones de disponibilité donnent aux clients la possibilité d'utiliser des applications de production et des bases de données plus disponibles, plus tolérantes aux pannes et plus évolutives que ce qui serait possible à partir d'un centre de données unique. Toutes les zones de disponibilité d'une même région AWS sont interconnectées avec un réseau à bande passante élevée et à faible temps de latence, sur une fibre métropolitaine dédiée entièrement redondante, fournissant un réseau à haut débit et à faible temps de latence entre les zones de disponibilité. Les classes de stockage Amazon S3 Standard, S3 Standard-IA, S3 Intelligent-Tiering, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive répliquent les données sur un minimum de trois zones de disponibilité afin de les protéger en cas de perte de la totalité d'une zone de disponibilité. Cela est également valable pour les Régions où moins de trois zones de disponibilité sont publiquement disponibles. Il est possible d'accéder aux objets stockés dans ces classes de stockage depuis toutes les zones de disponibilité dans une région AWS.
La classe de stockage Amazon S3 Unizone-IA réplique les données dans une seule zone de disponibilité. Les données stockées dans S3 Unizone-IA ne résistent pas à la perte physique d’une zone de disponibilité liée à des catastrophes comme des tremblements de terre, des incendies et des inondations.

Plusieurs facteurs axés sur votre application particulière sont à prendre en compte. Vous pouvez vouloir stocker vos données dans une région qui est proche de vos clients, de vos centres de données ou de vos autres ressources AWS, afin de réduire les latences d'accès aux données. Vous pourriez également souhaiter stocker vos données dans une région éloignée de vos autres opérations à des fins de redondance géographique et de reprise après sinistre. Vous devez aussi prendre en compte les régions qui vous permettent de satisfaire à des exigences juridiques et règlementaires et/ou de réduire vos coûts de stockage. Vous pourriez par exemple choisir une région avec un tarif réduit afin de faire des économies. Pour plus d’informations sur la tarification S3, reportez-vous à la page de la tarification d’Amazon S3.

Amazon S3 est disponible dans les Régions AWS sur l’ensemble du globe, et vous pouvez utiliser Amazon S3 où que vous vous trouviez. Tout ce que vous avez à faire, c'est choisir dans quelle(s) régions AWS vous souhaitez stocker vos données Amazon S3. Vous trouverez dans la liste des services régionaux AWS les Régions AWS dans lesquelles S3 est actuellement disponible.

Facturation

Ouvrir tout

Avec Amazon S3, vous ne payez que les services que vous utilisez. Il n'y a aucun frais minimum. Vous pouvez estimer votre facture mensuelle à l'aide du Calculateur de prix AWS. AWS facture moins lorsque nos coûts sont moindres. Certains prix peuvent varier en fonction des régions Amazon S3. Les montants facturés sont basés sur l'emplacement de votre compartiment S3. Il n’y a pas de frais de transfert de données à l’intérieur d’une région Amazon S3 au moyen d’une requête COPY. Les données transférées entre les Régions AWS au moyen d’une requête COPY sont facturées aux tarifs indiqués sur la page de tarification Amazon S3. Il n’y a pas de frais pour les données transférées entre Amazon EC2 (ou tout autre service AWS) et Amazon S3 au sein de la même région, par exemple : des données transférées dans la région USA Est (Virginie du Nord). Cela dit, les données transférées entre Amazon EC2 (ou tout autre service AWS) et Amazon S3 dans toutes les autres régions sont facturées conformément aux tarifs indiqués sur la page Tarification d’Amazon S3. Par exemple, des données transférées entre les régions Amazon EC2 USA Est (Virginie du Nord) et Amazon S3 USA Ouest (Californie du Nord). Les coûts de transfert de données sont facturés au propriétaire du compartiment source. Pour connaître la tarification S3 sur Outposts, consultez la page de tarification Outposts.

Aucuns frais d’installation ou engagement ne sont nécessaires pour commencer à utiliser Amazon S3. À la fin du mois, vous êtes automatiquement facturé en fonction de votre utilisation au cours du mois. Vous pouvez accéder à vos frais pour la période de facturation en cours à tout moment en vous connectant à votre compte Amazon Web Services et en sélectionnant le « Tableau de bord de facturation » associé à votre profil de console. Avec l’offre gratuite AWS*, vous pouvez démarrer gratuitement avec Amazon S3 dans toutes les régions, à l’exception des Régions AWS GovCloud. Après leur inscription, les nouveaux clients AWS bénéficient chaque mois pendant un an de 5 Go de stockage Amazon S3 Standard, de 20 000 requêtes Get, de 2 000 requêtes Put et de 100 Go de transfert de données sortantes (vers Internet, d'autres régions AWS ou Amazon CloudFront). L'utilisation mensuelle inutilisée n'est pas reportée sur le mois suivant. Amazon S3 vous facture les types d'utilisation suivants. Notez que les calculs ci-dessous partent du principe qu’aucune offre gratuite AWS n’est en place.

AWS facture moins lorsque nos coûts sont moindres. Par exemple, nos coûts sont plus bas dans la région USA Est (Virginie du Nord) que dans la région USA Ouest (Californie du Nord).

Les tarifs Amazon S3 standard sont appliqués à chaque version d’un objet stocké ou demandé. Par exemple, observons le scénario suivant pour illustrer les coûts de stockage lors de l’utilisation du contrôle de version (en supposant que le mois en question est de 31 jours) : 1) Jour 1 du mois : vous effectuez une opération PUT de 4 Go (4 294 967 296 octets) sur votre compartiment.
2) Jour 16 du mois : vous effectuez une opération PUT de 5 Go (5 368 709 120 octets) dans le même compartiment en utilisant la même clé que l’opération PUT d’origine du Jour 1.

Lorsque les coûts de stockage des opérations ci-dessus sont analysés, notez que l'objet de 4 Go du Jour 1 n'est pas supprimé du compartiment lorsque l'objet de 5 Go est écrit le Jour 15. L’objet de 4 Go est plutôt préservé en tant qu’ancienne version et l’objet de 5 Go devient la version la plus récemment écrite de l’objet au sein de votre compartiment. À la fin du mois : utilisation totale (en octets-heure)
[4 294 967 296 octets x 31 jours x (24 heures/jour)] + [5 368 709 120 octets x 16 jours x (24 heures/jour)] = 5 257 039 970 304 octets-heure. Conversion en Go total-mois
5 257 039 970 304 octets/heure x (1 Go / 1 073 741 824 octets) x (1 mois / 744 heures) = 6 581 Go/mois Le coût est calculé sur la base des tarifs en vigueur pour votre région indiqués sur la page de tarification Amazon S3.

La tarification normale d’Amazon S3 s’applique lors de l’accès au service par la Console de gestion AWS. Pour une expérience optimisée, la console de gestion AWS peut exécuter les demandes de manière proactive. En outre, certaines opérations interactives génèrent plusieurs demandes vers le service.

L’accès à votre stockage via un autre compte AWS est facturé en fonction de la tarification normale d’Amazon S3. Vous pouvez également choisir de configurer votre compartiment avec un paiement par le demandeur. Dans ce cas, le demandeur assume le coût des demandes et des téléchargements pour vos données Amazon S3. Pour en savoir plus sur la configuration de compartiments avec paiement par le demandeur, référez-vous à la documentation d’Amazon S3.

Sauf indication contraire, nos prix n’incluent pas les taxes et redevances applicables, y compris la TVA et les taxes sur les ventes applicables. Pour les clients dont l'adresse de facturation est située au Japon, l'utilisation de services AWS est soumise à la taxe sur la consommation applicable dans ce pays. En savoir plus sur les taxes sur les services AWS »

AWS propose aux clients éligibles un transfert de données gratuit vers Internet lorsqu’ils transfèrent toutes leurs données hors d’AWS, conformément à la procédure ci-dessous.

Procédez comme suit : 1) Si vous disposez d’une équipe dédiée à votre compte AWS, contactez-la d’abord et informez-la de vos projets. Dans certains cas, si vous avez un engagement négocié avec AWS, vous souhaiterez discuter des options qui s’offrent à vous avec l’équipe responsable de votre compte AWS. 2) Passez en revue les critères et le processus décrits sur cette page. 3) Contactez le support client AWS et indiquez que votre demande concerne un « transfert de données gratuit pour quitter AWS ». Le support client AWS vous demandera de fournir des informations afin qu’il puisse revoir vos projets de transfert, déterminer si vous êtes éligible au transfert de données gratuit et calculer un montant de crédit approprié. 4) Si le support client AWS approuve votre transfert, vous recevrez un crédit temporaire pour le coût du transfert des données sortantes en fonction du volume de toutes les données que vous avez stockées dans les services AWS au moment du calcul par AWS. Le support client AWS vous informera si votre demande est approuvée, et vous aurez alors 60 jours pour terminer votre départ d’AWS. Le crédit ne sera pris en compte que pour l’utilisation du transfert de données sortantes et ne sera pas appliqué à l’utilisation d’autres services. Après avoir quitté les services AWS, dans le délai de 60 jours, vous devez supprimer toutes les données et charges de travail restantes de votre compte AWS. Sinon, vous pouvez fermer votre compte AWS. Les transferts de données gratuits pour les prestataires informatiques en déplacement sont également soumis aux critères suivants : a) Seuls les clients possédant un compte AWS actif et en règle peuvent bénéficier du transfert de données gratuit. b) Si vous avez moins de 100 Go de données sur votre compte AWS, vous pouvez transférer ces données hors d’AWS gratuitement dans le cadre de l’offre gratuite existante d’AWS de 100 Go par mois pour les transferts de données sortantes. Les clients qui ont moins de 100 Go de données sur leur compte AWS ne sont pas éligibles à des crédits supplémentaires. c) AWS vous fournira un transfert de données gratuit vers Internet lorsque vous transférerez toutes vos données hors d’AWS. Si vous souhaitez uniquement modifier votre utilisation totale d’un seul service, mais pas tout, contactez le support client AWS. d) Si vos plans changent ou si vous ne pouvez pas terminer votre transfert hors d’AWS dans les 60 jours, vous devez en informer le support client AWS. e) Les frais de service standard liés à l’utilisation des services AWS ne sont pas inclus. Seuls les frais de transfert de données liés à votre transfert hors d’AWS peuvent donner droit à des crédits. Toutefois, le transfert de données depuis des services de transfert de données spécialisés, tels qu’Amazon CloudFront, AWS Direct Connect, AWS Snowball et AWS Global Accelerator, n’est pas inclus. f) AWS peut revoir votre utilisation des services afin de vérifier la conformité à ces exigences. Si nous déterminons que vous avez utilisé le transfert de données sortantes dans un but autre que celui de quitter AWS, nous pouvons vous facturer le transfert de données sortant crédité. g) AWS peut apporter des modifications en ce qui concerne les transferts de données gratuits vers Internet à tout moment.

Les clients AWS effectuent des centaines de millions de transferts de données chaque jour, et nous ne connaissons généralement pas la raison de chaque transfert de données. Par exemple, les clients peuvent transférer des données à un utilisateur final de leur application, à un visiteur de leur site Web ou à un autre environnement cloud ou sur site à des fins de sauvegarde. Par conséquent, la seule façon de savoir si votre transfert de données est destiné à faciliter votre départ d’AWS est de nous en informer au préalable.

S3 Tables

Ouvrir tout

Les tableaux Amazon S3 offrent un stockage S3 spécifiquement optimisé pour les charges de travail d’analytique, améliorant ainsi les performances des requêtes tout en réduisant les coûts. Accédez aux fonctionnalités analytiques avancées d’Iceberg et interrogez des données à l’aide de services AWS courants tels qu’Amazon Athena, Redshift et EMR via l’intégration de tableaux S3 à Amazon SageMaker Lakehouse. En outre, vous pouvez utiliser des applications tierces compatibles Iceberg REST, telles qu'Apache Spark, Apache Flink, Trino, DuckDB et PyIceberg, pour lire et écrire des données dans des tables S3. Vous pouvez utiliser des compartiments de tables pour stocker des données tabulaires telles que les transactions d'achat quotidiennes, les données de capteurs de streaming ou les impressions d'annonces sous forme de table Iceberg dans Amazon S3, puis interagir avec ces données à l'aide de fonctionnalités d'analytique telles que les transactions au niveau des lignes, les instantanés de table interrogeables, etc., le tout géré par Amazon S3. De plus, les compartiments de tableaux assurent une maintenance continue des tableaux afin d’optimiser automatiquement l’efficacité des requêtes au fil du temps, même à mesure que le lac de données se met à l’échelle.

Vous devez utiliser S3 Tables pour disposer d’un moyen simple, performant et économique de stocker des données tabulaires dans Amazon S3. S3 Tables vous permet d’organiser vos données structurées dans des tables, puis d’interroger ces données à l’aide d’instructions SQL standard, pratiquement sans aucune configuration. En outre, S3 Tables offre les mêmes caractéristiques de durabilité, de disponibilité, de capacité de mise à l’échelle et de performance que S3 lui-même, et optimise automatiquement votre stockage pour maximiser les performances des requêtes et minimiser les coûts.

S3 Tables fournit un stockage S3 spécialement créé pour stocker des données structurées au format Apache Parquet, Avro et ORC. Dans un compartiment de tables, vous pouvez créer des tables en tant que ressources de première classe directement dans S3. Ces tables peuvent être sécurisées par des autorisations au niveau de la table définie dans des politiques basées sur l’identité ou les ressources et sont accessibles par des applications ou des outils qui prennent en charge la norme Apache Iceberg. Lorsque vous créez une table dans votre compartiment de tables, les données sous-jacentes dans S3 sont stockées sous forme de données Parquet, Avro ou ORC. S3 utilise ensuite la norme Apache Iceberg pour stocker les métadonnées nécessaires pour que ces données puissent être interrogées par vos applications. S3 Tables inclut une bibliothèque client qui est utilisée par les moteurs de requête pour naviguer et mettre à jour les métadonnées Iceberg des tables de votre compartiment de tables. Cette bibliothèque, associée aux API S3 mises à jour pour les opérations sur les tables, permet à plusieurs clients de lire et d’écrire en toute sécurité des données dans vos tables. Au fil du temps, S3 optimise automatiquement les données Parquet, Avro ou ORC sous-jacentes en réécrivant ou en « compactant » vos objets. Le compactage optimise vos données sur S3 afin d’améliorer les performances des requêtes et de minimiser les coûts.

Vous pouvez commencer à utiliser S3 Tables en quelques étapes simples, sans avoir à installer d’infrastructure en dehors de S3. Tout d’abord, créez un compartiment de tables dans la console S3. Lors de la création de votre premier compartiment de tables via la console, l’intégration aux services d’analytique AWS se fait automatiquement, ce qui permet à S3 de renseigner automatiquement tous les compartiments de tables et les tableaux de votre compte et de votre région dans le Catalogue de données AWS Glue. Par la suite, S3 Tables est désormais accessible aux moteurs de requêtes AWS tels qu’Amazon Athena, EMR et Redshift. Vous pouvez ensuite cliquer pour créer un tableau à l’aide d’Amazon Athena depuis la console S3. Une fois dans Athena, vous pouvez rapidement commencer à remplir de nouvelles tables et à les interroger.

Vous pouvez également accéder à S3 Tables à l’aide du point de terminaison du catalogue REST Iceberg via le Catalogue de données AWS Glue, qui vous permet de découvrir l’intégralité de votre patrimoine de données, y compris toutes les ressources des tables. Vous pouvez également vous connecter directement à un point de terminaison de compartiment de tables individuel pour découvrir toutes les ressources S3 Tables de ce compartiment. Cela vous permet d’utiliser S3 Tables avec n’importe quelle application ou n’importe quel moteur de requête prenant en charge la spécification du catalogue REST Apache Iceberg.

Vous pouvez créer une table dans votre compartiment de tables dans S3 à l’aide de l’API CreateTable. Vous pouvez également utiliser votre moteur de requête pour créer une table. Vous pouvez supprimer une table de votre compartiment de tables dans S3 à l’aide de l’API DeleteTable. Vous pouvez également utiliser votre moteur de requête pour supprimer une table. Dans ce cas, votre table ne sera plus accessible par votre moteur de requêtes.

S3 Tables prend en charge la norme Apache Iceberg, et les moteurs de requête tels qu’Amazon Athena, Amazon Redshift et Apache Spark peuvent être utilisés pour interroger les tables Iceberg. Les tables de vos compartiments de tables peuvent être utilisés pour interroger les tables de vos compartiments de tables à l’aide du SQL standard.

Vous pouvez vous attendre à des performances de requête jusqu’à trois fois plus rapides et à des transactions par seconde (TPS) jusqu’à dix fois plus élevées par rapport au stockage de tables Iceberg dans des compartiments Amazon S3 à usage général. En effet, les compartiments de tables compactent automatiquement les données Parquet Avro ou ORC sous-jacentes de vos tables afin d’optimiser les performances des requêtes, et le stockage spécialement conçu prend en charge jusqu’à dix fois le TPS par défaut.

Non. Pour éviter de compromettre accidentellement l’intégrité de vos tables ou de perturber les applications en aval, les compartiments de tables n’autorisent pas le remplacement ou la suppression manuels d’objets. Les compartiments de tables ne prennent en charge que le sous-ensemble d’API S3 nécessaires pour accéder aux tables Iceberg et les mettre à jour. Vous pouvez plutôt configurer la suppression des fichiers non référencés et l’expiration des instantanés sur vos tables pour supprimer des données.

Les compartiments de tables vous permettent d’appliquer des politiques de ressources à l’ensemble du compartiment ou à des tables individuelles. Les politiques relatives aux compartiments de tables peuvent être appliquées à l’aide des API PutTablePolicy et PutTableBucketPolicy. Les politiques au niveau des tables vous permettent de gérer les autorisations relatives aux tables de vos compartiments de tables en fonction de la table logique à laquelle elles sont associées, sans avoir à connaître l’emplacement physique des fichiers Parquet, Avro ou ORC individuels. De plus, l’accès public par bloc S3 est toujours appliqué à vos compartiments de tables.

Oui. Les compartiments de tables s’appuient sur la fonctionnalité de capture instantanée d’Iceberg pour garantir la cohérence de vos tables lorsqu’il y a plusieurs rédacteurs simultanés.

Les compartiments de tables prennent en charge le format de table Apache Iceberg avec les données Parquet, Avro ou ORC.

Les compartiments de tables proposent trois opérations de maintenance : le compactage, la gestion des instantanés et la suppression des fichiers non référencés. Le compactage combine périodiquement des objets plus petits en un nombre réduit d’objets plus grands afin d’améliorer les performances des requêtes. La gestion des instantanés expire et supprime les instantanés des tables en fonction de votre configuration de conservation des instantanés. La suppression de fichiers non référencés supprime les objets qui ne sont référencés par aucun instantané de table conformément à votre politique de suppression de fichiers non référencés, optimisant ainsi les coûts de stockage.

Oui, S3 Tables est compatible avec AWS CloudTrail. Vous pouvez configurer les données CloudTrail et les événements de gestion CloudTrail pour vos compartiments de tables, de la même manière que vous le feriez avec un compartiment S3 à usage général. Les journaux CloudTrail pour vos compartiments de tables incluent à la fois des informations sur les tables et les objets de données.

Oui, les données des compartiments de tables sont cryptées par défaut à l’aide d’un chiffrement côté serveur, garantissant ainsi une protection de base pour vos données au repos. Pour renforcer la sécurité, vous avez la possibilité de chiffrer vos données dans les tables S3 en utilisant vos propres clés de chiffrement. Ces clés sont créées et gérées dans votre compte AWS via AWS Key Management Service (AWS KMS). Avec KMS, il existe plusieurs autorisations distinctes pour l'utilisation de la clé KMS, fournissant ainsi un niveau supplémentaire de contrôle et de protection contre les accès non autorisés à vos tables stockés dans des compartiments de tables. En outre, KMS génère une piste d'audit détaillée, vous permettant de savoir qui a accédé à quelle table et quand, à l'aide de votre clé. KMS propose également des contrôles de sécurité supplémentaires pour vous aider à vous conformer aux exigences du secteur telles que PCI-DSS, HIPAA/HITECH et FedRAMP. Cette approche complète du chiffrement et de la gestion des clés offre la sécurité et la flexibilité nécessaires pour protéger efficacement vos données sensibles.

Avec S3 Tables, vous payez le stockage, les requêtes et les frais de surveillance des objets par objet stocké dans des compartiments de tables. Des frais supplémentaires s’appliquent également pour la maintenance des tables. Pour voir le détail des prix, consultez la page de tarification S3.

Le compactage combine des objets plus petits en un nombre réduit d’objets plus grands afin d’améliorer les performances des requêtes Iceberg. Amazon S3 compacte les tables en fonction d’une taille de fichier cible optimale pour votre modèle d’accès aux données, ou d’une valeur que vous spécifiez. Les fichiers compactés sont écrits en tant que capture d’écran la plus récente de votre table. Le compactage est pris en charge par défaut pour toutes les tables S3, avec une taille de fichier cible par défaut de 512 Mo. Vous pouvez modifier la taille du fichier cible de 64 à 512 Mo à l’aide de l’API PutTableMaintenanceConfiguration.

La gestion des instantanés expire et supprime les instantanés des tables conformément à la configuration de conservation des instantanés. La gestion des instantanés détermine le nombre de clichés actifs pour vos tables en fonction des valeurs MinimumSnapshots (1 par défaut) et MaximumSnapshotAge (120 heures par défaut). Lorsqu’un instantané expire, Amazon S3 crée des marqueurs de suppression pour les fichiers de données et de métadonnées référencés de manière unique par cet instantané, et marque ces fichiers comme non actuels. Ces fichiers non actuels sont supprimés après le nombre de jours spécifié par la propriété NoncurrentDays dans votre politique de suppression des fichiers non référencés. Vous pouvez modifier les valeurs par défaut de l’instantané à l’aide de l’API PutTableMaintenanceConfiguration. La gestion des instantanés ne prend pas en charge les valeurs de rétention que vous configurez dans le fichier Iceberg metadata.json, y compris la rétention basée sur les branches ou les balises. La gestion des instantanés pour S3 Tables est désactivée lorsque vous configurez une politique de rétention basée sur des branches ou des balises, ou lorsque vous configurez une politique de rétention sur le fichier metadata.json qui est plus longue que les valeurs configurées via l’API PutTableMaintenanceConfiguration.

La suppression de fichiers non référencés permet d’identifier et de supprimer tous les objets qui ne sont référencés par aucun instantané de table. Dans le cadre de votre politique de suppression des fichiers non référencés, vous pouvez configurer deux propriétés : ExpireDays (3 jours par défaut) et NoncurrentDays (10 jours par défaut). Pour tout objet non référencé par votre table et antérieur à la propriété ExpireDays, S3 supprime définitivement les objets après le nombre de jours spécifié par la propriété NoncurrentDays. Vous pouvez configurer la suppression des fichiers non référencés au niveau d’un compartiment de tables. Vous pouvez modifier les valeurs par défaut pour la conservation des instantanés à l’aide de l’API PutTableBucketMaintenanceConfiguration.

Vecteurs S3

Ouvrir tout

Vous pouvez commencer à utiliser S3 Vectors en quatre étapes simples, sans avoir à configurer d’infrastructure en dehors d’Amazon S3. Tout d’abord, créez un compartiment vectoriel dans une Région AWS spécifique via l’API CreateVectorBucket ou dans la console S3. Ensuite, pour organiser vos données vectorielles dans un compartiment vectoriel, vous devez créer un index vectoriel à l’aide de l’API CreateIndex ou de la console S3. Lorsque vous créez un index vectoriel, vous spécifiez la métrique de distance (cosinus ou euclidienne) et le nombre de dimensions qu’un vecteur doit avoir (jusqu’à 4 092). Pour des résultats plus précis, sélectionnez la métrique de distance recommandée par votre modèle de vectorisation. Troisièmement, ajoutez des données vectorielles à un index vectoriel à l’aide de l’API PutVectors. Vous pouvez éventuellement joindre des métadonnées sous forme de paires clé-valeur à chaque vecteur pour filtrer les requêtes. Quatrièmement, effectuez une requête de similarité à l’aide de l’API QueryVectors, en spécifiant le vecteur à rechercher et le nombre de résultats les plus similaires à renvoyer.

Vous pouvez créer un index vectoriel à l’aide de la console S3 ou de l’API CreateIndex. Lors de la création de l’index, vous spécifiez le compartiment vectoriel, l’index, la métrique de distance, les dimensions et, éventuellement, une liste de champs de métadonnées que vous souhaitez exclure du filtrage lors des requêtes de similarité. Par exemple, si vous souhaitez stocker des données associées à des vecteurs uniquement à titre de référence, vous pouvez les spécifier en tant que champs de métadonnées non filtrables. Lors de la création, chaque index se voit attribuer un Amazon Resource Name (ARN). Par la suite, lorsque vous faites une demande d’écriture ou de requête, vous la dirigez vers un index vectoriel au sein d’un compartiment vectoriel.

Vous pouvez ajouter des vecteurs à un index vectoriel à l’aide de l’API PutVectors. Chaque vecteur est constitué d’une clé qui identifie de manière unique chaque vecteur dans un index vectoriel (par exemple, vous pouvez générer un UUID par programmation). Pour optimiser le débit d’écriture, il est recommandé d’insérer des vecteurs par lots volumineux, jusqu’à la taille de requête maximale. En outre, vous pouvez joindre des métadonnées (par exemple, l’année, l’auteur, le genre et le lieu) sous forme de paires clé-valeur à chaque vecteur. Lorsque vous incluez des métadonnées, par défaut, tous les champs peuvent être utilisés comme filtres dans une requête de similarité, sauf s’ils sont spécifiés comme métadonnées non filtrables au moment de la création de l’index vectoriel. Pour générer de nouvelles vectorisations vectorielles de vos données non structurées, vous pouvez utiliser l’API InvokeModel d’Amazon Bedrock, en spécifiant l’ID du modèle de vectorisation que vous souhaitez utiliser.

Vous pouvez utiliser l’API GetVectors pour rechercher et renvoyer des vecteurs et les métadonnées associées à l’aide de la clé vectorielle.

Vous pouvez exécuter une requête de similarité à l’aide de l’API QueryVectors, en spécifiant le vecteur de requête, le nombre de résultats pertinents à renvoyer (les k premiers voisins les plus proches) et l’ARN de l’index. Lors de la génération du vecteur de requête, vous devez utiliser le même modèle de vectorisation que celui utilisé pour générer les vecteurs initiaux stockés dans l’index vectoriel. Par exemple, si vous utilisez le plongement lexical Amazon Titan v2 dans Amazon Bedrock pour générer des vectorisations de vos documents, il est recommandé d’utiliser le même modèle pour convertir une question en vecteur. En outre, vous pouvez utiliser des filtres de métadonnées dans une requête pour rechercher des vecteurs correspondant au filtre. Lorsque vous exécutez la requête de similarité, les clés vectorielles sont renvoyées par défaut. Vous pouvez éventuellement inclure la distance et les métadonnées dans la réponse.

S3 Vectors offre un stockage vectoriel hautement durable et disponible. Les données écrites dans S3 Vectors sont stockées sur S3, qui est conçu pour une durabilité des données de 11 à 9 s. S3 Vectors est conçu pour fournir une disponibilité de 99,99 % avec un SLA de disponibilité de 99,9 %.

S3 Vectors offre des temps de latence des requêtes inférieurs à la seconde. Il utilise le débit élastique d’Amazon S3 pour gérer les recherches sur des millions de vecteurs et est idéal pour les charges de travail de requêtes peu fréquentes.

Lorsque vous effectuez des requêtes de similarité pour vos vectorisations vectorielles, plusieurs facteurs peuvent affecter le rappel moyen, notamment le modèle de vectorisation, la taille du jeu de données vectoriel (nombre de vecteurs et dimensions) et la distribution des requêtes. S3 Vectors offre un rappel moyen de plus de 90 % pour la plupart des jeux de données. Le rappel moyen mesure la qualité des résultats de la requête : 90 % signifie que la réponse contient 90 % des vecteurs les plus proches du vecteur de requête, qui sont stockés dans l’index. Cependant, étant donné que les performances réelles peuvent varier en fonction de votre cas d’utilisation spécifique, nous vous recommandons d’effectuer vos propres tests avec des données représentatives et des requêtes afin de valider que les index S3 Vectors répondent à vos exigences de rappel.

Vous pouvez consulter une liste de vecteurs dans un index vectoriel à l’aide de l’API ListVectors, qui renvoie jusqu’à 1 000 vecteurs à la fois avec un indicateur si la réponse est tronquée. La réponse inclut la date de dernière modification, la clé vectorielle, les données vectorielles et les métadonnées. Vous pouvez également utiliser l’API ListVectors pour exporter facilement des données vectorielles à partir d’un index vectoriel spécifié. L’opération ListVectors est très cohérente. Ainsi, après une écriture, vous pouvez immédiatement répertorier les vecteurs avec toutes les modifications prises en compte.

Avec S3 Vectors, vous payez pour le stockage et toutes les demandes d’écriture et de lecture applicables (par exemple, l’insertion de vecteurs et l’exécution d’opérations de requête sur des vecteurs dans un index vectoriel). Pour voir le détail des prix, consultez la page de tarification S3.

Oui. Lors de la création d’une base de connaissances Bedrock via la console ou l’API Bedrock, vous pouvez configurer un index vectoriel S3 existant comme boutique vectorielle afin de réduire les coûts de stockage vectoriel pour les cas d’utilisation RAG. Si vous préférez laisser Bedrock créer et gérer l’index vectoriel pour vous, utilisez le flux de travail Création rapide dans la console Bedrock. En outre, vous pouvez configurer un nouvel index vectoriel S3 comme boutique vectorielle pour les flux de travail RAG dans Amazon SageMaker Unified Studio.

Oui. Vous pouvez utiliser S3 Vectors de deux manières avec Amazon OpenSearch Service. Tout d’abord, les clients S3 peuvent exporter tous les vecteurs d’un index vectoriel S3 vers OpenSearch sans serveur en tant que nouvelle collection sans serveur à l’aide de la console S3 ou OpenSearch. Si vous créez nativement sur des S3 Vectors, vous avez la possibilité d’utiliser OpenSearch sans serveur de manière sélective pour les charges de travail nécessitant des requêtes en temps réel. Deuxièmement, si vous êtes un client OpenSearch géré, vous pouvez désormais choisir S3 Vectors comme moteur pour les données vectorielles qui peuvent être interrogées avec une latence inférieure à la seconde. OpenSearch utilisera alors automatiquement S3 Vectors comme moteur sous-jacent pour les vecteurs et vous pourrez mettre à jour et rechercher vos données vectorielles à l’aide des API OpenSearch. Vous bénéficiez des avantages de S3 Vectors en termes de coûts, sans apporter la moindre modification à vos applications.

Amazon S3 et IPv6

Ouvrir tout

Chaque serveur ou appareil connecté à Internet doit posséder une adresse unique. Internet Protocol version 4 (IPv4) est le nom du schéma d'adressage 32 bits d'origine. Cependant, la croissance ininterrompue de l'Internet signifie que toutes les adresses IPv4 disponibles finiront par être utilisées. Internet Protocol version 6 (IPv6) est un mécanisme d’adressage. Il vise à surmonter les limitations des adresses globales sur IPv4.

Grâce à la prise en charge d’IPv6 pour Amazon S3, les applications peuvent se connecter à Amazon S3 sans passer par un logiciel ou système de traduction d’IPv6 vers IPv4. Vous pouvez répondre aux exigences de conformité et réaliser plus facilement l'intégration d'applications sur site basées sur IPv6 sans avoir à acheter des équipements réseau onéreux pour gérer la traduction des adresses. De plus, vous pouvez désormais utiliser les fonctionnalités actuelles de filtrage des adresses d’origine dans les stratégies IAM et les stratégies de compartiment avec les adresses IPv6. Vous disposez ainsi de nouvelles options pour protéger les applications interagissant avec Amazon S3.

Pour commencer, pointez votre application sur le point de terminaison « dual-stack » (double pile) d’Amazon S3, qui prend en charge les accès par IPv4 et IPv6. Dans la plupart des cas, aucune configuration ultérieure n'est requise pour un accès par IPv6, car la plupart des clients réseau privilégient les adresses IPv6 par défaut. Si une application est affectée par l'utilisation d'IPv6, il est possible de revenir à tout moment aux points de terminaison standard compatibles IPv4 uniquement. IPv6 avec Amazon S3 est pris en charge dans toutes les Régions AWS commerciales, y compris dans les Régions AWS GovCloud (US), la Région AWS Web Services Chine (Pékin) exploitée par Sinnet, et la région Amazon Web Services Chine (Ningxia) exploitée par NWCD.

Non. Vous obtiendrez les mêmes performances avec Amazon S3, que vous utilisiez IPv4 ou IPv6.

Notifications d’événements S3

Ouvrir tout

Vous pouvez utiliser la fonction de notification d’événements d’Amazon S3 pour recevoir des notifications lorsque certains événements se produisent dans votre compartiment S3, tels que les événements PUT, POST, COPY et DELETE. Vous pouvez publier des notifications dans Amazon EventBridge, Amazon SNS, Amazon SQS, ou directement dans AWS Lambda.

Amazon S3 Event Notifications vous permet d’exécuter des flux, d’envoyer des alertes ou de réaliser d’autres actions en réponse aux modifications apportées à vos objets stockés dans S3. Vous pouvez utiliser S3 Event Notifications pour configurer des déclencheurs en vue de réaliser des actions telles que le transcodage de fichiers multimédias lorsqu'ils sont chargés, le traitement des fichiers de données lorsqu'ils sont disponibles, et la synchronisation d'objets S3 avec d'autres magasins de données. Vous pouvez également configurer des notifications d'événements en fonction des préfixes et suffixes de noms d'objet. Par exemple, vous pouvez choisir de recevoir des notifications pour les noms d’objet commençant par « images/ ».

Pour obtenir une description détaillée des informations incluses dans les notifications d’événements Amazon S3, référez-vous à la documentation sur la configuration des notifications d’événements Amazon S3.

Pour obtenir une description détaillée de la configuration des notifications d’événements, référez-vous à la documentation sur la configuration des notifications d’événements Amazon S3. Pour en savoir plus sur les services de messagerie AWS, référez-vous à la documentation Amazon SNS et la documentation Amazon SQS.

Les notifications d’événements depuis Amazon S3 n’entraînent pas de frais supplémentaires. Vous payez uniquement l'utilisation d'Amazon SNS ou d'Amazon SQS pour transmettre les notifications d'événements ou les frais d'exécution de la fonction AWS Lambda. Consultez les pages de tarification Amazon SNS, Amazon SQS ou AWS Lambda pour connaître les tarifs de ces services.

Amazon S3 Transfer Acceleration

Ouvrir tout

Amazon S3 Transfer Acceleration crée un transfert rapide, facile et sécurisé de fichiers sur de longues distances entre votre client et votre compartiment Amazon S3. S3 Transfer Acceleration utilise les emplacements périphériques AWS d’Amazon CloudFront distribués au niveau mondial. Lorsque les données arrivent dans un emplacement périphérique AWS, elles sont transférées vers votre compartiment Amazon S3 sur un chemin de réseau optimisé.

Pour démarrer avec S3 Transfer Acceleration, activez S3 Transfer Acceleration sur un compartiment S3 en utilisant la console Amazon S3, les API Amazon S3 ou l’interface de ligne de commande AWS. Une fois S3 Transfer Acceleration activé, vous pouvez orienter vos demandes Amazon S3 PUT et GET vers le nom de domaine du point de terminaison s3-accelerate. Votre application de transfert de données doit utiliser l'un des deux types de points de terminaison suivants pour accéder au compartiment et accélérer le transfert de données : .s3-accelerate.amazonaws.com ou <.s3-accelerate.dualstack.amazonaws.com pour le point de terminaison « dual-stack ». Si vous souhaitez utiliser un transfert de données type, vous pouvez continuer à utiliser les points de terminaison habituels. Il existe des restrictions quant aux compartiments pouvant prendre en charge S3 Transfer Acceleration. Pour en savoir plus, référez-vous à la documentation d’Amazon S3.

S3 Transfer Acceleration vous permet d’utiliser pleinement votre bande passante, de réduire l’effet de la distance sur le débit. Par ailleurs, il a été conçu pour assurer un transfert de données constamment rapide vers Amazon S3, où que se trouve votre client. L'accélération dépend en premier lieu de la bande passante disponible, de la distance entre la source et la destination et des taux de perte de paquets sur le chemin réseau. En règle générale, vous constaterez davantage d'accélération si la source se trouve à une plus grande distance de la destination, s'il ne reste plus de bande passante disponible et/ou si la taille de l'objet est plus importante. Un client a observé une réduction de 50 % du temps moyen d'ingestion de fichiers de 300 Mo envoyés depuis une base d'utilisateurs internationale s'étendant aux États-Unis, à l'Europe et à certaines parties de l'Asie, vers un compartiment dans la région Asie-Pacifique (Sydney). Un autre client a constaté que dans certains cas, la performance a dépassé 500 % pour les utilisateurs d'Asie du Sud-est et d'Australie, notamment avec la capacité de charger des fichiers de 250 Mo (en parties de 50 Mo) vers un compartiment S3 dans la région USA Est (Virginie du Nord). Accédez à l’outil de comparaison de la vitesse de S3 Transfer Acceleration pour avoir un aperçu de l’avantage en termes de performance depuis votre emplacement.

S3 Transfer Acceleration a été conçu pour optimiser la vitesse de transfert de données envoyées dans le monde entier vers des compartiments S3. Si vous chargez des données depuis différentes zones géographiques vers un compartiment centralisé. De même, si vous transférez régulièrement des Go ou To de données à travers les continents, vous pouvez économiser des heures, voire des journées de temps de transfert de données avec S3 Transfer Acceleration.

S3 Transfer Acceleration est tout aussi sécurisé que les transferts habituels vers Amazon S3. Toutes les fonctions de sécurité de Amazon S3, comme et notamment la restriction de l'accès en fonction de l'adresse IP d'un client, sont également prises en charge. S3 Transfer Acceleration communique avec les clients sur un TCP standard et ne demande pas de modification du pare-feu. Aucune donnée n’est enregistrée sur les emplacements périphériques AWS.

À chaque fois que vous utilisez S3 Transfer Acceleration pour charger un objet, nous vérifions si S3 Transfer Acceleration peut être plus rapide qu’un transfert Amazon S3 ordinaire. Si nous estimons que S3 Transfer Acceleration ne sera pas plus rapide que le transfert Amazon S3 ordinaire du même objet vers la même Région de destination AWS, nous ne vous facturerons pas l’utilisation de S3 Transfer Acceleration pour ce transfert et contournerons le système S3 Transfer Acceleration pour ce chargement.

S3 Transfer Acceleration prend en charge toutes les fonctions au niveau du compartiment, notamment le chargement partitionné.

S3 Transfer Acceleration optimise le protocole TCP et ajoute davantage d’intelligence entre le client et le compartiment S3, ce qui fait de S3 Transfer Acceleration le choix judicieux si un débit plus élevé est nécessaire. Si vous avez des objets ou des données dont la taille est inférieure à 1 Go, pensez à utiliser les commandes PUT/POST d’Amazon CloudFront pour une performance optimale.

AWS Direct Connect est un bon choix pour les clients qui ont des exigences de réseaux privés ou qui ont accès aux échanges AWS Direct Connect. S3 Transfer Acceleration convient mieux au transfert de données depuis des emplacements clients distribués par le biais de l'Internet public, ou lorsque des conditions de réseau variables affaiblissent le débit. Certains clients AWS Direct Connect utilisent S3 Transfer Acceleration pour les transferts vers les bureaux distants, et ces clients peuvent expérimenter une mauvaise performance d’Internet.

Vous pouvez tirer parti de la configuration de la destination du compartiment dans votre passerelle tierce de manière à utiliser un domaine de point de terminaison S3 Transfer Acceleration.
Pour en savoir plus sur l’implémentation AWS, visitez cette section Fichier des FAQ sur Storage Gateway.

Oui. Les packages logiciels qui se connectent directement à Amazon S3 peuvent tirer profit de S3 Transfer Acceleration lorsqu'ils envoient leurs tâches vers Amazon S3. En savoir plus sur les solutions des partenaires disposant de la compétence Stockage »

Oui. AWS a étendu son programme de conformité HIPAA et fait de S3 Transfer Acceleration un service éligible HIPAA. Si vous disposez d’un accord d’association commerciale (BAA) exécuté avec AWS, vous pouvez utiliser S3 Transfer Acceleration pour effectuer des transferts de fichiers rapides, simples et sécurisés, y compris des informations de santé protégées (PHI), sur de longues distances entre votre client et votre compartiment Amazon S3.

Sécurité

Ouvrir tout

Amazon S3 est sécurisé par défaut. À leur création, vous êtes la seule personne à pouvoir accéder aux compartiments Amazon S3 que vous créez, et vous disposez d'un contrôle total sur les personnes pouvant accéder à vos données. Amazon S3 prend en charge l'authentification des utilisateurs pour contrôler l'accès aux données. Vous pouvez utiliser les mécanismes de contrôle d'accès tels que les politiques de compartiment pour accorder sélectivement des autorisations aux utilisateurs et groupes d'utilisateurs. La console Amazon S3 met en évidence vos compartiments accessibles au public, indique la source d'accès publique et vous avertit si des modifications apportées à vos stratégies ou listes ACL de compartiment rendent votre compartiment accessible au public. Vous pouvez activer le blocage de l’accès public Amazon S3 pour tous les comptes et compartiments que vous ne souhaitez pas rendre accessibles au public. L’option Bloquer l’accès public est activée par défaut pour tous les nouveaux compartiments. Vous pouvez charger/télécharger vos données en toute sécurité vers Amazon S3 par le biais des points de terminaison SSL utilisant le protocole HTTPS. Amazon S3 chiffrera automatiquement tous les téléchargements d’objets dans votre compartiment (dès le 5 janvier 2023). Vous pouvez également utiliser vos propres bibliothèques de chiffrement pour chiffrer des données avant de les stocker dans Amazon S3.
Pour en savoir plus sur la sécurité dans AWS, reportez-vous à la page de sécurité AWS. Pour des informations sur la sécurité relative à S3, visitez la page de sécurité de S3 et le guide des bonnes pratiques de sécurité de S3.

Les utilisateurs peuvent utiliser un certain nombre de mécanismes pour contrôler l’accès aux ressources Amazon S3, dont les politiques de gestion des identités et des accès AWS (AWS IAM), les politiques de compartiment, les politiques de point d’accès, les listes de contrôle d’accès (ACL), l’authentification par chaîne d’interrogation, les politiques de point de terminaison Amazon Virtual Private Cloud (Amazon VPC), les politiques de contrôle des services (SCP) dans AWS Organizations et Amazon S3 Block Public Access.

Oui, les clients peuvent configurer les compartiments Amazon S3 pour créer des enregistrements de journal d’accès pour toutes les demandes qui leur sont adressées. Les clients qui ont besoin de récupérer les informations IAM/d'identité utilisateur dans leurs fichiers journaux peuvent configurer les événements de données AWS CloudTrail. Ces enregistrements de journal d’accès peuvent être utilisés à des fins d’audit et contiennent des détails relatifs à la requête, tels que le type de requête, ainsi que l’heure et la date auxquelles la requête a été effectuée.

Amazon S3 chiffre tous les nouveaux téléchargements de données vers n’importe quel compartiment. Amazon S3 appliquera le chiffrement côté serveur géré par S3 (SSE-S3) comme niveau de base de chiffrement à tous les téléchargements d'objets (dès le 5 janvier 2023). SSE-S3 vous fournit une solution entièrement intégrée où Amazon prend en charge la gestion et la protection de vos clés à l'aide de multiples couches de sécurité. Nous vous conseillons de continuer à utiliser SSE-S3 si vous préférez qu'Amazon gère vos clés. De plus, Vous pouvez choisir de chiffrer vos données à l'aide de SSE-C, SSE-KMS, DSSE-KMS, ou d'une bibliothèque client telle que le Client de chiffrement Amazon S3 Chaque solution vous permet de stocker des données sensibles chiffrées au repos sur Amazon S3. SSE-C permet à Amazon S3 d'effectuer le chiffrement et le déchiffrement des objets, tout en vous laissant le contrôle des clés de chiffrement. Avec SSE-C, vous n'avez pas à implémenter ni à utiliser une bibliothèque de chiffrement côté client pour effectuer le chiffrement et le déchiffrement de vos objets stockés dans Amazon S3. Cependant, vous devez gérer les clés que vous avez transmises à Amazon S3 pour chiffrer et déchiffrer les objets. Utilisez SSE-C si vous souhaitez gérer vos propres clés de chiffrement, mais ne souhaitez pas implémenter ou utiliser une bibliothèque de chiffrement côté client. SSE-KMS permet à AWS Key Management Service (AWS KMS) de gérer vos clés de chiffrement. Utiliser AWS KMS pour la gestion de vos clés présente plusieurs avantages supplémentaires. Avec AWS KMS, il existe plusieurs autorisations distinctes pour l'utilisation de la clé KMS, fournissant ainsi un niveau de contrôle supplémentaire et une protection contre les accès non autorisés à vos objets stockés dans Amazon S3. AWS KMS fournit un journal d'activité d'audit de sorte que vous puissiez voir qui a utilisé votre clé pour accéder à tel objet à tel moment, et consulter les tentatives d'accès non autorisées aux données des utilisateurs en vue de les déchiffrer. AWS KMS offre également des contrôles de sécurité supplémentaires afin de soutenir les efforts des clients pour se conformer aux exigences du secteur PCI-DSS, HIPAA/HITECH et FedRAMP. Le DSSE-KMS simplifie le processus d'application de deux couches de chiffrement à vos données, sans avoir à investir dans l'infrastructure requise pour le chiffrement côté client. Chaque couche de chiffrement utilise une implémentation différente de l'algorithme AES-GCM (Advanced Encryption Standard with Galois Counter Mode) 256 bits et est approuvée et acceptée pour une utilisation sur des charges de travail top secrètes. DSSE-KMS utilise AWS KMS pour générer des clés de données et permet à AWS KMS de gérer vos clés de chiffrement. Avec AWS KMS, il existe plusieurs autorisations distinctes pour l'utilisation de la clé KMS, fournissant ainsi un niveau de contrôle supplémentaire et une protection contre les accès non autorisés à vos objets stockés dans Amazon S3. AWS KMS fournit un journal d'activité d'audit de sorte que vous puissiez voir qui a utilisé votre clé pour accéder à tel objet à tel moment, et consulter les tentatives d'accès non autorisées aux données des utilisateurs en vue de les déchiffrer. AWS KMS offre également des contrôles de sécurité supplémentaires afin de soutenir les efforts des clients pour se conformer aux exigences du secteur PCI-DSS, HIPAA/HITECH et FedRAMP. En utilisant une bibliothèque client de chiffrement vous gardez le contrôle des clés et chiffrez/déchiffré les objets côté client à l’aide de la bibliothèque de choix de votre choix. Certains clients préfèrent garder le contrôle total du chiffrement et du déchiffrement de leurs objets. De cette manière, seuls les objets cryptés sont transférés via Internet vers Amazon S3. Utilisez une bibliothèque de chiffrement côté client dans les cas suivants : vous souhaitez garder le contrôle de vos clés de chiffrement, vous êtes en mesure d’implémenter et d’utiliser une bibliothèque de chiffrement côté client et avez besoin de chiffrer vos objets avant qu’ils soient transférés à Amazon S3 pour être stockés. Pour en savoir plus sur l’utilisation d’Amazon S3 SSE-S3, SSE-C ou SSE-KMS, référez-vous à la documentation sur la protection des données par chiffrement.

Les clients peuvent choisir de stocker toutes les données en Europe en utilisant la région Europe (Francfort), Europe (Irlande), Europe (Paris), Europe (Stockholm), Europe (Milan), Europe (Espagne), Europe (Londres) ou Europe (Zurich). Vous pouvez également utiliser Amazon S3 on Outposts afin de conserver toutes vos données sur site dans AWS Outpost. Vous pouvez éventuellement transférer les données entre les AWS Outposts ou vers une Région AWS. Toutefois, vous êtes tenu de respecter les lois européennes relatives au respect de la vie privée. Reportez-vous au Centre AWS sur le règlement général sur la protection des données (RGPD) et au Centre AWS sur la confidentialité des données pour en savoir plus. Si vous avez des exigences plus spécifiques en matière d’emplacement ou d’autres réglementations sur la confidentialité des données qui vous obligent à conserver les données dans un endroit où il n’y a pas de Région AWS, vous pouvez utiliser les classes de stockage S3 pour les zones locales dédiées AWS ou S3 sur Outposts.

Par défaut, les données et les métadonnées de l’objet restent dans la seule zone locale dédiée dans laquelle vous avez placé l’objet. Les données de gestion et de télémétrie des compartiments, y compris les noms des compartiments, les métriques de capacité, les journaux CloudTrail, les métriques CloudWatch, les clés gérées par le client via AWS Key Management Service (KMS) et les politiques de gestion des identités et des accès (IAM), sont stockées dans la Région AWS parente. En option, d’autres fonctionnalités de gestion des compartiments, telles que S3 Batch Operations, stockent les métadonnées de gestion avec le nom du compartiment et le nom de l’objet dans la Région AWS parente.

Un point de terminaison d’un VPC Amazon pour Amazon S3 est une entité logique dans un VPC qui autorise la connectivité à S3 au moyen du réseau mondial AWS. Il existe deux types de points de terminaison d'un VPC pour S3 : les points de terminaison d'un VPC de passerelle et les points de terminaison d'un VPC d'interface. Les points de terminaison de passerelle sont une passerelle que vous spécifiez dans votre table de routage pour accéder à S3 à partir de votre VPC au moyen du réseau AWS. Les points de terminaison d'interface étendent la fonctionnalité des points de terminaison de passerelle en utilisant des IP privées pour acheminer les demandes vers S3 à partir de votre VPC, sur site ou à partir d'une autre région AWS. Pour en savoir plus, référez-vous à la documentation d’AWS PrivateLink for Amazon S3.

Vous pouvez limiter l’accès à votre compartiment depuis un point de terminaison Amazon VPC spécifique ou un ensemble des points de terminaison à l’aide des stratégies de compartiment Amazon S3. Les stratégies de compartiment S3 prennent désormais en charge une condition, aws:sourceVpce, que vous pouvez utiliser pour restreindre l'accès. Pour en savoir plus et obtenir des exemples de politiques, lisez la documentation sur les points de terminaison de passerelle pour S3.

AWS PrivateLink for S3 offre une connectivité privée entre Amazon S3 et les instances sur site. Vous pouvez provisionner des points de terminaison d'un VPC d'interface pour S3 dans votre VPC, afin de connecter vos applications sur site directement à S3, avec AWS Direct Connect ou AWS VPN. Plus besoin d'utiliser des IP publiques, de modifier les règles de pare-feu ou de configurer une passerelle Internet pour accéder à S3 à partir d'un environnement sur site. Pour en savoir plus, référez-vous à la documentation relative à AWS PrivateLink for S3.

Vous pouvez créer un point de terminaison d’un VPC d’interface à l’aide de la console AWS, de l’interface de la ligne de commande AWS (AWS CLI), du kit SDK AWS ou de l’API. Pour en savoir plus, référez-vous à la documentation.

AWS recommande d’utiliser des points de terminaison d’un VPC d’interface pour accéder à S3 depuis les environnements sur site ou un VPC dans une autre Région AWS. Pour les ressources accédant à S3 depuis un VPC dans la même région AWS que S3, nous recommandons l'utilisation des points de terminaison d'un VPC de passerelle, car ils ne sont pas facturés. Pour en savoir plus, référez-vous à la documentation.

Oui. Si vous disposez d'un point de terminaison d'un VPC de passerelle, créez un point de terminaison d'un VPC d'interface et mettez à jour vos applications clients avec les noms de point de terminaison spécifiques aux points de terminaison d'un VPC. Par exemple, si votre identifiant de point de terminaison d'un VPC de point de terminaison d'interface est vpce-0fe5b17a0707d6abc-29p5708s dans la région us-east-1, alors, votre nom DNS spécifique au point de terminaison sera vpce-0fe5b17a0707d6abc-29p5708s.s3.us-east-1.vpce.amazonaws.com. Dans ce cas, seules les demandes aux noms spécifiques de point de terminaison d'un VPC seront acheminées par les points de terminaison d'un VPC vers S3, tandis que les autres demandes continueront d'être acheminées par le point de terminaison d'un VPC de passerelle. Pour en savoir plus, reportez-vous à la documentation.

Amazon Macie est un service de sécurité basé sur l’IA qui vous permet d’éviter toute perte de données en identifiant, répertoriant et protégeant automatiquement les données sensibles stockées dans Amazon S3. Amazon Macie utilise le machine learning pour reconnaître les données sensibles comme les données d'identification personnelle (PII) ou la propriété intellectuelle. Le service attribue une valeur commerciale à ces données et fournit une visibilité sur leur emplacement de stockage et la façon dont elles sont exploitées dans votre organisation. Amazon Macie contrôle en permanence l'activité liée à l'accès aux données et génère des alertes lorsqu'il détecte un risque d'accès non autorisé ou des fuites accidentelle de données. Grâce à Amazon Macie, vous pouvez vous protéger contre les menaces de sécurité par le biais d'une surveillance continue de vos données et de vos informations d'identification de compte. Amazon Macie est un outil automatisé requérant peu d'interventions et permettant de rechercher et classer vos données métier. Ce service vous permet de contrôler, par l'intermédiaire de fonctions Lambda modélisées, la révocation d'accès ou le déclenchement de stratégies de réinitialisation de mot de passe en cas de détection de comportement suspect ou d'accès non autorisé aux données à des entités ou des applications tierces. Lorsqu’une alerte est générée, vous pouvez utiliser Amazon Macie pour répondre à l’incident et Amazon CloudWatch Events pour prendre rapidement les mesures de protection de vos données. Pour en savoir plus, référez-vous à la documentation Amazon Macie.

Access Analyzer for S3 est une fonction qui vous permet de simplifier la gestion des autorisations lorsque vous définissez, vérifiez et affinez les politiques de vos compartiments et points d’accès S3. Access Analyzer for S3 contrôle vos politiques d'accès existantes pour vérifier qu'elles fournissent uniquement l'accès requis à vos ressources S3. Access Analyzer for S3 évalue vos politiques d'accès aux compartiments et vous permet de découvrir et d'apporter rapidement des modifications aux compartiments qui ne nécessitent pas d'accès. Access Analyzer for S3 vous prévient si l’un de vos compartiments est configuré de manière à autoriser l’accès à n’importe quel utilisateur sur Internet, ou s’il est partagé avec d’autres comptes AWS. Vous recevez des découvertes portant sur la source et le niveau des accès public ou partagé. Par exemple, Access Analyzer for S3 vous informe directement si des accès en lecture ou en écriture non requis ont été accordés par accident dans le cadre d’une liste de contrôle d’accès ou d’une stratégie de compartiment. Grâce à ces résultats, vous pouvez définir ou restaurer immédiatement la stratégie d’accès requis. Lorsque vous recevez des résultats montrant des accès potentiellement partagés à un compartiment, vous pouvez bloquer les accès publics au compartiment en un seul clic dans la console S3. Vous pouvez également aller plus loin en configurant des niveaux d’accès granulaires dans les paramètres des niveaux d’autorisation des compartiments. À des fins d'audit, vous pouvez télécharger les découvertes d'Access Analyzer for S3 sous forme de rapport CSV. De plus, la console S3 signale les avertissements de sécurité, les erreurs et les suggestions de l'analyseur d'accès IAM lors de la création de vos stratégies S3. La console exécute automatiquement plus de 100 contrôles de stratégie pour valider vos stratégies. Ces contrôles vous font gagner du temps, vous guident pour résoudre les erreurs et vous aident à appliquer les meilleures pratiques de sécurité.
Pour en savoir plus, reportez-vous à la documentation IAM Access Analyzer.

S3 Access Grants

Ouvrir tout

Les autorisations d’accès Amazon S3 mappent les identités figurant dans des répertoires, comme Active Directory ou les principaux AWS Identity and Access Management (IAM), à des jeux de données dans S3. Vous pouvez ainsi gérer à grande échelle les autorisations relatives aux données en accordant automatiquement l’accès à S3 aux utilisateurs finaux en fonction de leur identité d’entreprise. De plus, S3 Access Grants enregistre l'identité de l'utilisateur final et l'application utilisée pour accéder aux données S3 dans AWS CloudTrail. Cela permet de fournir un historique d’audit détaillé incluant jusqu’à l’identité de l’utilisateur final pour tous les accès aux données de vos compartiments S3.

S3 Access Grants est particulièrement utile si vos données S3 sont partagées et consultées par de nombreux utilisateurs et applications, dont certaines identités figurent dans votre répertoire d’entreprise (comme Okta ou Entra ID), et que vous avez besoin d’un moyen évolutif, simple et sur lequel vous pouvez effectuez des audits pour autoriser à grande échelle l’accès à ces jeux de données S3.

Vous pouvez commencer à utiliser S3 Access Grants en quatre étapes. Tout d'abord, configurez une instance S3 Access Grants. Au cours de cette étape, si vous souhaitez utiliser S3 Access Grants avec des utilisateurs et des groupes de votre répertoire d’entreprise, activez AWS Identity Center et connectez S3 Access Grants à votre instance Identity Center. Ensuite, enregistrez l’emplacement auprès de S3 Access Grants. Au cours de ce processus, vous attribuez à S3 Access Grants un rôle IAM qui est utilisé pour créer des informations d’identification S3 temporaires que les utilisateurs et les applications peuvent utiliser pour accéder à S3. Troisièmement, définissez des autorisations qui spécifient qui peut accéder à telle ou telle ressource. Enfin, au moment de l’accès, faites en sorte que votre application demande des informations d’identification temporaires à S3 Access Grants et utilise des informations d’identification distribuées par Access Grants pour accéder à S3.

S3 Access Grants prend en charge deux types d’identités : les identités d’utilisateur d’entreprise ou de groupe issues d’AWS Identity Center, et les principaux AWS IAM (notamment les utilisateurs et les rôles IAM). Lorsque vous utilisez S3 Access Grants avec AWS Identity Center, vous pouvez définir les autorisations relatives aux données en fonction de l’appartenance à un groupe de répertoires. AWS Identity Center est un service AWS qui se connecte aux fournisseurs d’identité les plus utilisés, notamment Entra ID, Okta et Ping. En plus de prendre en charge les identités de répertoire via AWS Identity Center, S3 Access Grants prend également en charge les règles d’autorisation pour les principaux AWS IAM (notamment les utilisateurs et les rôles IAM). Cela concerne les cas d’utilisation dans lesquels vous gérez une fédération d’identité personnalisée, non pas via AWS Identity Center mais via des assertions IAM et SAML (exemple d’implémentation), ou gérez les identités des applications en fonction des principaux IAM, et que vous souhaitez utiliser S3 Access Grants en raison de sa capacité de mise à l’échelle et de la facilité d’effectuer des audits.

Les autorisations d’accès S3 proposent trois niveaux d’accès : LECTURE, ÉCRITURE et LECTURE-ÉCRITURE. Le niveau LECTURE vous permet de visualiser et de récupérer des objets depuis S3. Le niveau ÉCRITURE vous permet d'écrire et de supprimer dans S3. Le niveau LECTURE-ÉCRITURE vous permet d’effectuer à la fois des opérations de lecture et d’écriture.

Non. Vous ne pouvez utiliser que les trois niveaux d’accès prédéfinis (LECTURE/ÉCRITURE/LECTURE-ÉCRITURE) proposés par S3 Access Grants.

Oui. Vous pouvez créer jusqu’à 100 000 autorisations et 1 000 emplacements par instance S3 Access Grants.

Non. La latence pour obtenir des informations d’identification temporaires auprès des autorisations d’accès S3 est similaire à celle de l’obtention d’informations d’identification temporaires auprès d’AWS STS aujourd’hui. Après avoir obtenu les informations d’identification auprès de S3 Access Grants, vous pouvez réutiliser les informations d’identification qui n’ont pas encore expiré pour les demandes suivantes. Dans ce cas, il n’y a aucune latence supplémentaire pour les demandes authentifiées via les informations d’identification des autorisations d’accès S3 par rapport à d’autres méthodes.

Si vous avez l’intention d’utiliser S3 Access Grants pour les identités d’annuaires, vous devez d’abord configurer AWS IAM Identity Center. AWS IAM Identity Center vous aide à créer ou à connecter les identités de vos collaborateurs, que celles-ci soient créées et stockées dans Identity Center ou auprès d’un fournisseur d’identité tiers externe. Reportez-vous à la documentation d’Identity Center pour en savoir plus sur le processus de configuration. Après avoir configuré l’instance Identity Center, vous pouvez la connecter à S3 Access Grants. Par la suite, S3 Access Grants s’appuie sur Identity Center pour récupérer les attributs des utilisateurs tels que l’appartenance à un groupe afin d’évaluer les demandes et de prendre des décisions d’autorisation.

Oui. Alors qu’actuellement, vous initialisez votre client S3 avec des informations d’identification IAM associées à votre application (par exemple, des informations d’identification de rôle IAM pour Rôles Anywhere IAM ou EC2, ou en utilisant des informations d’identification d’utilisateur IAM à long terme), votre application devra d’abord obtenir des informations d’identification S3 Access Grants avant d’initialiser le client S3. Ces informations d’identification S3 Access Grants seront spécifiques à l’utilisateur authentifié dans votre application. Une fois que le client S3 est initialisé avec ces informations d’identification S3 Access Grants, il les utilise pour effectuer des demandes de données S3 de manière habituelle.

Aujourd’hui, les autorisations d’accès S3 s’intègrent déjà à EMR et à Spark open source via le connecteur S3A. De plus, S3 Access Grants s’intègre à des logiciels tiers tels qu’Immuta et Informatica afin que vous puissiez centraliser la gestion des autorisations. Enfin, les autorisations d’accès S3 prennent en charge Terraform et CloudFormation pour que vous puissiez programmer l’allocation des autorisations d’accès S3.

Non, S3 Access Grants ne remplace pas IAM et fonctionne parfaitement avec vos stratégies existantes de protection des données basées sur IAM (chiffrement, réseau, règles de périmètre des données). S3 Access Grants repose sur des primitives IAM et vous permet d’établir des autorisations S3 plus précises à grande échelle.

Oui. Afin d’utiliser S3 Access Grants pour les objets chiffrés avec KMS, les propriétaires de compartiments incluent les autorisations KMS nécessaires dans le rôle IAM qu’ils accordent à S3 Access Grants dans le cadre de l’enregistrement de l’emplacement. S3 Access Grants peut ensuite utiliser ce rôle IAM pour accéder aux objets chiffrés par KMS dans les compartiments.

Pour consulter et gérer vos autorisations S3 Access Grants, vous pouvez utiliser la console S3 Access Grants dans la Console de gestion AWS, ou les API d’interface de ligne de commande et de kit SDK.

Non, vous ne pouvez pas accorder un accès public aux données avec S3 Access Grants.

La demande d’ouverture de session d’accès aux données avec S3 Access Grants, demande effectuée par l’application, sera enregistrée dans CloudTrail. CloudTrail fera la distinction entre l'identité de l'utilisateur qui fait la demande et l'identité de l'application qui accède aux données pour le compte de l'utilisateur. Cela vous permet de vérifier l’identité de l’utilisateur final pour savoir qui a accédé à telle ou telle donnée et à quel moment.

S3 Access Grants est facturé en fonction du nombre de demandes adressées à S3 Access Grants. Pour plus de détails, consultez la page de tarification.

AWS Lake Formation est destiné aux cas d’utilisation où vous devez gérer l’accès à des données tabulaires (par exemple, les tables Glue) et pouvoir imposer un accès au niveau des lignes et des colonnes. S3 Access Grants permet de gérer l’accès pour les autorisations S3 directes, telles que les données non structurées (vidéos, images, journaux, etc.).

Non. S3 Access Grants n’est pas intégré à IAM Access Analyzer pour le moment. Pour le moment, vous ne pouvez pas utiliser IAM Access Analyzer pour analyser les autorisations accordées par S3 Access Grants. Les clients peuvent effectuer des audits de S3 Access Grants directement en accédant à la page S3 Access Grants de la console S3 ou par programmation à l’aide de l’API ListAccessGrants.

Points d’accès S3

Ouvrir tout

Les points d’accès Amazon S3 simplifient la gestion de l’accès aux données pour toute application ou tout service AWS fonctionnant avec S3. Les points d’accès S3 fonctionnent avec les compartiments S3 et les systèmes de fichiers Amazon FSx pour OpenZFS. Vous pouvez contrôler et simplifier la manière dont les différentes applications ou les différents utilisateurs peuvent accéder aux données en créant des points d’accès dotés de noms et d’autorisations adaptés à chaque application ou utilisateur.

Grâce aux point d’accès S3 avec compartiments S3, vous ne devez plus gérer une stratégie de compartiment unique et complexe avec des centaines de règles d’autorisation différentes qu’il faut écrire, lire, suivre et auditer. Au lieu de cela, vous pouvez créer des centaines de points d’accès par compartiment, chacun proposant un chemin personnalisé vers un compartiment, avec un nom d’hôte unique et une stratégie d’accès qui met en œuvre les autorisations spécifiques et les contrôles de réseau pour toute demande effectuée par le point d’accès.

En utilisant les points d’accès S3 avec FSx pour OpenZFS, vous pouvez accéder à vos données FSx à l’aide de l’API S3 comme si les données se trouvaient dans S3. Grâce à cette fonctionnalité, les données de vos fichiers dans FSx pour OpenZFS sont accessibles et peuvent être utilisées avec le large éventail de services et d’applications d’intelligence artificielle, de machine learning et d’analytique qui fonctionnent avec S3, tandis que vos données de fichiers continuent de résider sur le système de fichiers FSx pour OpenZFS.

Les points d’accès S3 simplifient la gestion de l’accès à vos jeux de données partagés sur S3. Vous ne devez plus gérer une stratégie de compartiment unique et complexe avec des centaines de règles d'autorisation différentes qu'il faut écrire, lire, suivre et auditer. Grâce aux points d'accès S3, vous pouvez créer des points d'accès ou déléguer des autorisations à des comptes de confiance pour créer des points d'accès intercompte dans votre compartiment. Cela permet d'accéder à des jeux de données partagés avec des stratégies adaptées à l'application spécifique. Grâce aux points d'accès, vous pouvez décomposer la stratégie générale d'un compartiment en plusieurs stratégies de point d'accès séparées pour chaque application qui doit accéder au jeu de données partagé. Cela permet de se concentrer sur la définition de la stratégie d'accès correcte pour une application, sans devoir se préoccuper du risque de perturber ce qu'une autre application fait dans l'ensemble de données partagé. Vous pouvez aussi créer une politique de contrôle des services (SCP) et exiger que tous les points d’accès soient limités à un cloud privé virtuel (VPC), créant ainsi un pare-feu pour vos données au sein de vos réseaux privés.

Avec les points d’accès S3, vous pouvez accéder aux données des fichiers dans Amazon FSx pour OpenZFS à l’aide des API S3 et sans déplacer les données vers S3. Les points d’accès S3 attachés à FSx pour les systèmes de fichiers OpenZFS fonctionnent de la même manière que les points d’accès S3 attachés à des compartiments S3, en fournissant un accès aux données via S3 avec un accès contrôlé par des politiques d’accès, tandis que les données continuent d’être stockées dans FSx pour les systèmes de fichiers OpenZFS ou dans des compartiments S3. Par exemple, une fois qu’un point d’accès S3 est connecté à un système de fichiers FSx pour OpenZFS, les clients peuvent utiliser le point d’accès avec des services et des applications d’IA générative, de machine learning et d’analytique qui fonctionnent avec S3 pour accéder à leurs données FSx pour OpenZFS.

Chaque point d’accès S3 est configuré avec une stratégie d’accès spécifique à un cas d’utilisation ou à une application, et un compartiment peut compter des milliers de points d’accès. Par exemple, pour votre compartiment S3, vous pouvez créer un point d'accès qui accorde l'accès à des groupes d'utilisateurs ou d'applications pour votre lac de données. Un point d'accès peut prendre en charge un seul utilisateur ou une seule application, ou des groupes d'utilisateurs ou d'applications au sein d'un même compte ou entre plusieurs comptes, ce qui permet une gestion distincte de chaque point d'accès. En outre, vous pouvez déléguer des autorisations à des comptes de confiance pour créer des points d'accès intercompte dans votre compartiment. Les points d'accès intercompte n'accordent pas l'accès aux données tant que vous n'avez pas obtenu les autorisations du propriétaire du compartiment. Le propriétaire du compartiment conserve toujours le contrôle ultime des données et doit mettre à jour la stratégie du compartiment pour autoriser les demandes provenant du point d'accès intercompte. Consultez le guide de l'utilisateur pour voir un exemple de politique de compartiment. Chaque point d'accès est associé à un seul compartiment et contient un contrôle d'origine réseau et un contrôle de blocage de l'accès public. Vous pouvez créer un point d'accès avec un contrôle de l'origine réseau qui n'autorise l'accès au stockage que depuis votre cloud privé virtuel, qui est une section isolée de manière logique du Cloud AWS. Vous pouvez également créer un point d'accès dont la politique de point d'accès est configurée pour n'autoriser l'accès qu'aux objets ayant des préfixes définis ou aux objets ayant des identifications spécifiques. Vous pouvez accéder aux données dans les compartiments partagés par le biais d’un point d’accès de l’une des deux manières suivantes. Pour les opérations sur les objets S3, vous pouvez utiliser le point d'accès ARN à la place d'un nom de compartiment. Pour les demandes nécessitant un nom de compartiment au format standard de nom de compartiment S3, vous pouvez utiliser plutôt un alias de point d’accès. Les alias de points d'accès S3 sont automatiquement générés et interchangeables avec les noms de compartiments S3 partout où vous utilisez un nom de compartiment pour l'accès aux données. S3 génère automatiquement un nouvel alias de point d’accès chaque fois que vous créez un point d’accès pour un compartiment. Pour l’ensemble des opérations et services AWS compatibles, référez-vous à la documentation S3.

Par défaut, vous pouvez créer 10 000 points d’accès S3 par région et par compte dans les compartiments de votre compte et entre les comptes. Il n’y a pas de limite stricte au nombre de points d’accès S3 par compte AWS. Rendez-vous sur Service Quotas pour demander une modification de cette limite.

Les points d’accès S3 ont leur propre stratégie de point d’accès IAM. Les stratégies de point d'accès sont créées de façon similaire aux stratégies de compartiment, en utilisant l'ARN du point d'accès comme ressource. Les stratégies de point d'accès peuvent accorder ou limiter l'accès aux données S3 demandées à travers le point d'accès. Amazon S3 évalue toutes les stratégies pertinentes, y compris celles qui portent sur l’utilisateur, le compartiment, le point d’accès, le point de terminaison d’un VPC et les politiques de contrôle des services, ainsi que les listes de contrôle d’accès, pour décider d’autoriser ou non la requête.

Vous pouvez écrire une stratégie de point d’accès exactement de la même manière qu’une stratégie de compartiment en utilisant des règles IAM pour le contrôle des autorisations et en spécifiant l’ARN du point d’accès dans le document de stratégie.

Vous pouvez continuer d’utiliser des stratégies de compartiment pour limiter l’accès au compartiment aux VPC spécifiés. Les points d'accès constituent une méthode plus simple et auditable pour limiter un sous-ensemble ou la totalité du contenu d'un ensemble de données partagé au trafic par VPC pour toutes les applications dans votre organisation à l'aide de contrôles API. Vous pouvez utiliser une stratégie de contrôle de service (SCP) AWS Organizations pour exiger que tout point d'accès créé au sein de votre organisation utilise la valeur « vpc » pour le paramètre d'API « contrôle d'origine réseau ». Ainsi, les nouveaux points d'accès créés limitent automatiquement l'accès aux données au trafic par VPC. Aucune stratégie d’accès supplémentaire n’est requise pour garantir que les seules demandes de données traitées sont celles qui proviennent des VPC spécifiés.

Oui. Pour appliquer une politique « Aucun accès aux données depuis Internet » pour les points d'accès de votre organisation, il faut veiller à ce que tous les points d'accès autorisent l'accès uniquement par VPC. Pour ce faire, il faut créer une SCP AWS n'acceptant que la valeur « vpc » pour le paramètre « contrôle d'origine réseau » dans l'API create_access_point(). Si des points d'accès accessibles depuis Internet existent déjà, ils peuvent être supprimés. Il faudra également modifier la politique de chacun de vos compartiments pour restreindre davantage l'accès direct au compartiment par Internet à travers son nom d'hôte. Étant donné que d'autres services AWS peuvent potentiellement accéder directement à votre compartiment, veillez à bien configurer l'accès de façon à autoriser les services AWS désirés. À cet effet, modifiez la politique pour autoriser ces services AWS. Consultez la documentation S3 pour découvrir comment procéder avec quelques exemples.

Ce n’est actuellement pas possible, mais vous pouvez associer une stratégie de compartiment qui rejette les requêtes qui ne proviennent pas d’un point d’accès. Pour plus d’informations, consultez la documentation S3.

Oui. La suppression d’un point d’accès n’a pas d’impact sur l’accès au compartiment associé à travers d’autres points d’accès et à travers le nom d’hôte du compartiment.

Les points d’accès et les compartiments qui utilisent des points d’accès ne font pas l’objet de frais supplémentaires. Les tarifs habituels pour les requêtes Amazon S3 sont appliqués.

Vous pouvez commencer à créer des points d’accès S3 dans de nouveaux compartiments ainsi que dans des compartiments existants par le biais de la console de gestion AWS, l’interface de ligne de commande (CLI) AWS, l’interface de programmation d’applications (API) et le client kit de développement logiciel (SDK) AWS. Pour en savoir plus sur les points d’accès S3, consultez le guide de l’utilisateur.

Durabilité et protection des données

Ouvrir tout

Amazon S3 fournit le stockage le plus durable dans le cloud. Sur la base de son architecture unique, S3 est conçu pour fournir une durabilité des données de 99,999999999 % (11 neuf). De plus, S3 stocke les données de manière redondante dans au moins 3 zones de disponibilité (AZ) par défaut, offrant ainsi une résilience intégrée en cas de catastrophe généralisée. Les clients peuvent stocker les données dans une zone de stockage unique afin de minimiser les coûts de stockage ou la latence, dans plusieurs zones de disponibilité pour résister à la perte permanente d’un centre de données entier, ou dans plusieurs Régions AWS pour répondre aux exigences de résilience géographique.

La conception durable d’Amazon S3 est fonction des taux de défaillance des périphériques de stockage et de la vitesse à laquelle S3 peut détecter les défaillances, puis répliquer les données sur ces appareils. S3 vérifie l'intégrité de bout en bout de chaque chargement d'objet et vérifie que toutes les données sont stockées correctement et de manière redondante sur plusieurs périphériques de stockage avant de considérer que votre téléchargement est réussi. Une fois que vos données sont stockées dans S3, S3 surveille en permanence la durabilité des données au fil du temps en vérifiant périodiquement l'intégrité de toutes les données au repos. S3 surveille également activement la redondance de vos données afin de vérifier que vos objets sont capables de tolérer la défaillance simultanée de plusieurs périphériques de stockage.

Dans le cas peu probable de perte ou d’endommagement de tout ou partie d’une zone de disponibilité AWS, les données d’une classe de stockage One Zone peuvent être perdues. Par exemple, des événements tels qu'un incendie et des dégâts d'eau peuvent entraîner une perte de données. Hormis ces types d’événements, les classes de stockage One Zone utilisent des conceptions techniques similaires à celles des classes de stockage régionales pour protéger les objets contre les défaillances indépendantes au niveau du disque, de l’hôte et du rack, et chacune est conçue pour garantir une durabilité des données de 99,999999999 %.

Amazon S3 possède une solide culture de durabilité, et les meilleures pratiques en matière de durabilité sont intégrées à nos systèmes et logiciels dès le départ. AWS possède plus d’expérience en matière d’exploitation de stockage à haute durabilité que tout autre fournisseur de cloud, et nous utilisons cette expérience pour atténuer les risques liés à la durabilité et intégrer des garanties de durabilité dans tout ce que nous faisons.

Oui. Le système de durabilité d'Amazon S3 ne fournit aucune protection contre les suppressions accidentelles ou malveillantes. S3 compte sur les clients pour décider quelles données ils souhaitent conserver, quelles données ils souhaitent supprimer et quels contrôles facultatifs ils ont besoin pour se protéger contre les suppressions incorrectes, que ce soit par accident ou par malveillance. Lorsque vous demandez à Amazon S3 de supprimer des données, celles-ci sont immédiatement supprimées et ne peuvent pas être récupérées par AWS. Ce mode de réponse à une demande de suppression est une caractéristique importante du service.

Les fonctionnalités de gestion des versions S3 Object Versioning, de réplication S3 Replication et de verrouillage S3 Object Lock sont toutes facultatives et vous pouvez les utiliser pour renforcer la protection des données, au-delà de la durabilité que S3 fournit automatiquement. En outre, vous pouvez utiliser une application de sauvegarde pour sauvegarder tout ou partie des données de vos compartiments S3.

Simple Storage Service (Amazon S3) utilise une combinaison de totaux de contrôle Content-MD5, d’algorithmes de hachage sécurisé et de contrôles de redondance cycliques (CRC) pour vérifier l’intégrité des données. Amazon S3 exécute ces totaux de contrôle sur des données au repos et répare toute disparité en utilisant les données redondantes. En outre, les derniers kits SDK AWS calculent automatiquement des sommes de contrôle efficaces basées sur contrôle de redondance cyclique (CRC) pour l’ensemble des chargements. S3 vérifie indépendamment cette somme de contrôle et n’accepte les objets qu’après avoir vérifié que l’intégrité des données a été maintenue pendant le transit sur l’Internet public. Si une version du kit SDK ne fournissant pas de somme de contrôle précalculée est utilisée pour charger un objet, S3 calcule une somme de contrôle basée sur CRC pour l’ensemble de l’objet, y compris pour les chargements en plusieurs parties. Les sommes de contrôle sont stockées dans les métadonnées des objets et sont donc disponibles pour vérifier l’intégrité des données à tout moment. Vous pouvez choisir parmi cinq algorithmes de somme de contrôle pris en charge pour vérifier l’intégrité des données lors de vos demandes de chargement et de téléchargement. Vous pouvez choisir un algorithme de total de contrôle SHA-1, SHA-256, CRC32, CRC32C ou CRC64NVME, selon les besoins de votre application. Vous pouvez calculer et vérifier automatiquement les totaux de contrôle lorsque vous stockez ou récupérez des données à partir de S3, et vous pouvez accéder aux informations sur le total de contrôle à tout moment à l’aide de l’API HeadObject S3, de l’API GetObjectAttributes S3 ou d’un rapport d’inventaire S3. Le calcul du total de contrôle pendant la diffusion des données dans S3 vous fait gagner du temps, car vous pouvez vérifier et transmettre vos données en une seule fois, au lieu de deux opérations séquentielles. L’utilisation de totaux de contrôle pour la validation des données est une bonne pratique pour la durabilité des données, et ces capacités augmentent les performances et réduisent le coût de cette opération.

La gestion des versions permet de préserver, récupérer et restaurer toutes les versions de chacun des objets stockés dans un compartiment Amazon S3. Une fois le contrôle de version pour un compartiment activé, Amazon S3 préserve les objets existants à chaque fois que vous réalisez une opération PUT, POST, COPY ou DELETE sur ces objets. Par défaut, les demandes GET récupèrent la version écrite le plus récemment. Les versions plus anciennes d’un objet écrasé ou supprimé peuvent être récupérées en spécifiant une version dans la demande.

Amazon S3 fournit aux clients une infrastructure de stockage hautement durable. Le contrôle de version propose un niveau de protection supplémentaire en fournissant un moyen de récupération lorsque les clients écrasent ou suppriment accidentellement des objets. Ceci vous permet de récupérer facilement les objets perdus suite à des actions involontaires d'utilisateurs et des défaillances d'applications. Vous pouvez également utiliser la gestion des versions pour la conservation et l’archivage des données.

Vous pouvez commencer à assurer la gestion des versions en activant un paramètre sur votre compartiment Amazon S3. Pour en savoir plus sur la manière d’activer la gestion des versions, référez-vous à la documentation d’Amazon S3.

Lorsqu’un utilisateur effectue une opération DELETE sur un objet, les demandes simples (dont la gestion par version est annulée) ultérieures ne peuvent plus récupérer l’objet. Toutefois, toutes les versions de cet objet continueront d'être préservées dans votre compartiment Amazon S3 et pourront être récupérées ou restaurées. Seul le propriétaire d'un compartiment Amazon S3 peut supprimer une version de manière définitive. Vous pouvez définir des règles de cycle de vie pour gérer la durée de vie et le coût de stockage de plusieurs versions de vos objets.

Vous pouvez utiliser les règles de cycle de vie Amazon S3 avec la gestion des versions S3 pour implémenter une fenêtre de restauration pour vos objets S3. Par exemple, avec votre compartiment avec gestion des versions, vous pouvez configurer une règle qui archive toutes vos versions antérieures dans la classe de stockage S3 Glacier Flexible Retrieval économique, et les supprime après 100 jours, ce qui vous laisse un délai de 100 jours pour annuler des modifications apportées à vos données, tout en diminuant vos coûts de stockage. En outre, vous pouvez réduire les coûts en supprimant les anciennes versions (non courantes) d'un objet après cinq jours et lorsqu'il existe au moins deux versions plus récentes de l'objet. Vous pouvez modifier le nombre de jours ou le nombre de nouvelles versions en fonction de vos besoins d'optimisation des coûts. Ainsi, vous disposez de versions supplémentaires de vos objets en fonction de vos besoins, et vous pouvez réduire les coûts en les transférant ou en les supprimant après un certain temps.

La fonction Authentification multifactorielle (MFA) Delete de la gestion des versions peut permettre de fournir une couche de sécurité supplémentaire. Par défaut, toutes les demandes vers votre compartiment Amazon S3 nécessitent vos identifiants de compte AWS. Si vous activez la gestion des versions avec MFA Delete sur votre compartiment Amazon S3, deux formes d'authentification sont requises pour supprimer de manière permanente une version d'un objet : vos informations d'identification de compte AWS, un code à six chiffres et un numéro de série valides émis par un périphérique d'authentification que vous détenez physiquement. Pour en savoir plus sur l’activation de la gestion des versions avec MFA Delete, et notamment comment acheter et activer un périphérique d’authentification, reportez-vous à la documentation d’Amazon S3.

Les tarifs Amazon S3 standard sont appliqués à chaque version d’un objet stocké ou demandé. Par exemple, observons le scénario suivant pour illustrer les coûts de stockage lors de l’utilisation du contrôle de version (en supposant que le mois en question est de 31 jours) : 1) Jour 1 du mois : vous effectuez une opération PUT de 4 Go (4 294 967 296 octets) sur votre compartiment.
2) Jour 16 du mois : vous effectuez une opération PUT de 5 Go (5 368 709 120 octets) dans le même compartiment en utilisant la même clé que l’opération PUT d’origine du Jour 1.

Lorsque les coûts de stockage des opérations ci-dessus sont analysés, notez que l'objet de 4 Go du Jour 1 n'est pas supprimé du compartiment lorsque l'objet de 5 Go est écrit le Jour 15. L’objet de 4 Go est plutôt préservé en tant qu’ancienne version et l’objet de 5 Go devient la version la plus récemment écrite de l’objet au sein de votre compartiment. À la fin du mois : utilisation totale (en octets-heure)
[4 294 967 296 octets x 31 jours x (24 heures/jour)] + [5 368 709 120 octets x 16 jours x (24 heures/jour)] = 5 257 039 970 304 octets-heure. Conversion en Go total-mois
5 257 039 970 304 octets/heure x (1 Go / 1 073 741 824 octets) x (1 mois / 744 heures) = 6 581 Go/mois Le coût est calculé sur la base des tarifs en vigueur pour votre région indiqués sur la page de tarification Amazon S3.

Amazon S3 Object Lock est une fonction d’Amazon S3 qui empêche la version d’un objet d’être supprimée ou remplacée pendant une période fixe ou indéfinie. Cette période vous permet d’appliquer des politiques de conservation en tant que couche supplémentaire de protection des données ou à des fins de conformité réglementaire. Vous pouvez migrer des charges de travail depuis des systèmes WORM (Write Once Read Many, une seule écriture et plusieurs lectures) existants vers Amazon S3, et configurer S3 Object Lock aux niveaux de l'objet et du compartiment pour empêcher les suppressions de version d'objet avant les dates de fin de conservation prédéfinies, ou indéfiniment (dates de détention légale). La protection S3 Object Lock est conservée quelle que soit la classe de stockage de la version de l'objet lors des transitions de cycle de vie S3 entre les classes de stockage. Vous devez utiliser S3 Object Lock si vous avez des exigences réglementaires qui stipulent que vos données doivent avoir une protection WORM, ou si vous voulez ajouter une autre couche de protection aux données dans Amazon S3. S3 Object Lock peut vous aider à respecter des exigences réglementaires qui stipulent que les données doivent être stockées dans un format immuable, et peut également vous protéger contre la suppression accidentelle ou malveillante de données dans Amazon S3.
Pour en savoir plus, consultez le guide de l’utilisateur de S3 Object Lock.

Amazon S3 Object Lock empêche la suppression de la version d’un objet pendant la durée d’une période de conservation fixe ou indéfinie jusqu’à ce que la détention légale soit levée. S3 Object Lock vous permet de vous assurer que la version d'un objet reste immuable tant que la protection WORM s'applique. Vous pouvez appliquer la protection WORM en attribuant une date de fin de conservation ou une détention légale à la version d'un objet à l'aide du kit SDK AWS, de l'interface de ligne de commande, de l'API REST ou de la console de gestion S3. Vous pouvez appliquer des paramètres de conservation au sein d'une demande PUT, ou les appliquer à un objet existant après sa création. La date de fin de conservation définit la durée pendant laquelle la version d'un objet reste immuable. Une fois qu'une date de fin de conservation a été attribuée à la version d'un objet, cet objet ne peut pas être modifié ou supprimé jusqu'à cette date. Si un utilisateur tente de supprimer un objet avant la date de fin de conservation, l'opération est refusée. Sinon, vous pouvez rendre un objet immuable en appliquant une détention légale. Une détention légale empêche la modification ou la suppression indéfinie de la version d'un objet jusqu'à sa suppression explicite. Pour placer et supprimer des détentions légales, votre compte AWS doit avoir l'autorisation en écriture pour l'action PutObjectLegalHold. Une détention légale peut être appliquée à tout objet dans un compartiment avec S3 Object Lock, que cet objet soit soumis actuellement ou non à une protection WORM par une période de conservation.
S3 Object Lock peut être configuré dans deux modes. Lorsqu'ils sont déployés en mode de gouvernance, les comptes AWS avec des autorisations IAM spécifiques peuvent supprimer la protection WORM de la version d'un objet. Si vous avez besoin d'une immuabilité plus forte pour vous conformer à des réglementations, vous pouvez utiliser le mode de conformité. En mode de conformité, la protection WORM ne peut être supprimée par aucun utilisateur, y compris le compte racine.

Non, vous ne pouvez pas désactiver S3 Object Lock ou S3 Versioning pour les compartiments une fois que S3 Object Lock est activé.

Pour commencer à répliquer des objets avec S3 Replication à partir de compartiments pour lesquels S3 Object Lock est activé, vous pouvez ajouter une configuration de réplication sur votre compartiment source en spécifiant un compartiment de destination dans la même région AWS ou dans une Région AWS différente et dans le même compte AWS ou un compte AWS différent. Vous pouvez choisir de répliquer tous les objets au niveau du compartiment S3, ou de filtrer les objets au niveau d'un préfixe partagé ou au niveau de l'objet à l'aide de balises d'objet S3. Vous devrez également spécifier un rôle AWS Identity and Access Management (IAM) avec les autorisations requises pour effectuer l'opération de réplication. Vous pouvez utiliser la console S3, l'API AWS, l'interface de ligne de commande AWS CLI, les kits SDK AWS ou AWS CloudFormation pour activer la réplication. La gestion des versions S3 doit être activée pour les compartiments source et de destination. En outre, pour répliquer des objets à partir de compartiments compatibles S3 Object Lock, S3 Object Lock doit également être activé dans votre compartiment de destination. Pour plus d’informations, consultez la documentation sur la configuration de la réplication S3 et l’utilisation de S3 Object Lock avec S3 Replication.

Oui, pour répliquer des objets à partir de compartiments compatibles avec S3 Object Lock, vous devez accorder deux nouvelles autorisations, s3:GetObjectRetention et s3:GetObjectLegalHold, sur le compartiment source dans le rôle IAM que vous utilisez pour configurer la réplication. Sinon, si le rôle IAM dispose d'une autorisation s3:Get*, il répond à l'exigence. Pour plus d’informations, consultez la documentation sur l’utilisation de S3 Object Lock avec la réplication S3.

Non, toutes les fonctionnalités de Réplication S3, telles que la Réplication S3 sur une même région (S3 SRR), la Réplication interrégionale S3 (S3 CRR), les métriques de réplication S3 pour suivre la progression, le contrôle du temps de réplication, le Contrôle du temps de réplication S3 (S3 RTC) et la Réplication par lots S3, sont prises en charge lors de la réplication à partir de compartiments S3 Object Lock.

Vous pouvez utiliser la réplication par lots S3 pour répliquer des objets existants à partir de compartiments compatibles avec S3 Object Lock. Pour plus d’informations sur la réplication d’objets existants, consultez la documentation sur la Réplication par lots S3.

Classes de stockage

Ouvrir tout

Amazon S3 propose une gamme de classes de stockage que vous pouvez choisir en fonction des exigences de vos charges de travail en matière d’accès aux données, de résilience et de coût. Les classes de stockage S3 sont spécialement conçues pour fournir le stockage le plus économique pour différents types d'accès. Les classes de stockage S3 conviennent à pratiquement tous les cas d'utilisation, y compris ceux qui présentent des besoins en performance importants, des exigences en termes de résidence des données, des modèles d'accès inconnus ou changeants, ou le stockage d'archives. Chaque classe de stockage S3 facture des frais pour stocker les données ainsi que des frais pour accéder aux données. Au moment de choisir la classe de stockage S3 idéale pour votre charge de travail, vous devez prendre en compte les modèles d’accès et le délai de conservation de vos données pour une optimisation des coûts les plus avantageux par rapport à la durée de vie de vos données.

Au moment de choisir la classe de stockage S3 idéale pour votre charge de travail, vous devez prendre en compte les modèles d’accès et le délai de conservation de vos données pour une optimisation des coûts les plus avantageux par rapport à la durée de vie de vos données. De nombreuses charges de travail ont des modèles d’accès changeants (contenus générés par les utilisateurs), imprévisibles (analytique, lacs de données) ou inconnus (nouvelles applications). C’est pourquoi S3 Intelligent-Tiering doit être la classe de stockage par défaut pour économiser automatiquement sur les coûts de stockage. Si vous connaissez les modèles d'accès de vos données, vous pouvez suivre ces recommandations. La classe de stockage S3 Standard est idéale pour les données fréquemment consultées. Il s'agit du meilleur choix si vous accédez à vos données plus d'une fois par mois. La classe de stockage S3 Standard – Accès peu fréquent est idéale pour les données conservées pendant au moins un mois et consultées une fois tous les mois ou tous les deux mois. Les classes de stockage Amazon S3 Glacier sont spécialement conçues pour l'archivage de données et vous offrent les meilleures performances, la plus grande flexibilité de récupération et le stockage d'archives le plus économique du cloud. Vous pouvez désormais choisir parmi trois classes de stockage d'archives optimisées pour différents modèles d'accès et durées de stockage. Pour les données d'archives nécessitant un accès immédiat, telles que les images médicales, les ressources des médias d'information ou les données génomiques, choisissez la classe de stockage S3 Glacier Instant Retrieval, une classe de stockage d'archives qui offre le stockage le plus économique avec une récupération en quelques millisecondes. Pour les données d'archives qui ne nécessitent pas un accès immédiat, mais qui ont besoin de la flexibilité nécessaire pour récupérer gratuitement de grands ensembles de données, comme dans les cas de sauvegarde ou de reprise après sinistre, choisissez S3 Glacier Flexible Retrieval (anciennement S3 Glacier), avec une récupération en quelques minutes ou des récupérations en bloc gratuites en 5 à 12 heures. Pour économiser encore plus sur le stockage d'archives de longue durée, comme les archives de conformité et la préservation des médias numériques, choisissez S3 Glacier Deep Archive, le stockage le plus économique du cloud avec une récupération des données en 12 heures. Toutes ces classes de stockage fournissent une résilience sur plusieurs zones de disponibilité en stockant de manière redondante vos données sur plusieurs appareils et dans plusieurs zones de disponibilité AWS physiquement séparées dans une région AWS.

Pour les données qui ont des exigences de résilience plus faibles, vous pouvez réduire vos coûts en sélectionnant une classe de stockage mono-AZ, telle que S3 One Zone-Infrequent Access. Si vos exigences en matière de résidence des données ne peuvent pas être satisfaites par une Région AWS existante, vous pouvez utiliser les classes de stockage S3 pour les zones locales dédiées AWS ou les racks S3 sur Outposts pour stocker vos données dans un périmètre spécifique.

S3 Intelligent-Tiering

Ouvrir tout

S3 Intelligent-Tiering est le premier système de stockage dans le cloud qui réduit automatiquement vos coûts de stockage au niveau des objets en déplaçant automatiquement les données vers le niveau d’accès le plus rentable en fonction de la fréquence d’accès, sans impact sur les performances, les frais de récupération ou les coûts opérationnels. S3 Intelligent-Tiering offre une latence de quelques millisecondes et des performances de haut débit pour les données fréquemment, peu ou rarement consultées dans les niveaux d'accès fréquents, peu fréquents et instantanés aux archives. Entraînant de faibles frais mensuels de surveillance et d'automatisation des objets, S3 Intelligent-Tiering contrôle les modèles d'accès et déplace automatiquement les objets d'un niveau d'accès à l'autre. Il n'y a aucun frais d'extraction dans S3 Intelligent-Tiering, vous n'aurez donc pas d'augmentations imprévues dans les factures de stockage quand les modèles d'accès changent. Vous pouvez utiliser S3 Intelligent-Tiering comme classe de stockage par défaut pour pratiquement toutes les charges de travail, notamment les lacs de données, l’analytique des données, le machine learning, les nouvelles applications et le contenu généré par les utilisateurs.

La classe de stockage Amazon S3 Intelligent-Tiering est conçue pour optimiser les coûts de stockage en déplaçant automatiquement les données vers le niveau d’accès le plus économique lorsque les modèles d’accès changent. Générant de faibles frais mensuels de surveillance et d'automatisation des objets, S3 Intelligent-Tiering contrôle les modèles d'accès et déplace automatiquement les objets qui n'ont pas été accédés pendant 30 jours consécutifs vers le niveau Accès peu fréquent pour économiser jusqu'à 40 % sur les coûts de stockage. Les objets qui n'ont pas été consultés pendant 90 jours consécutifs sont déplacés vers le niveau Accès instantané aux archives pour économiser jusqu'à 68 % sur les coûts de stockage. Il n'y a aucun impact sur les performances ni aucun frais d'extraction dans S3 Intelligent-Tiering. Si un objet stocké dans le niveau Accès peu fréquent ou Accès instantané aux archives est accédé ultérieurement, il est automatiquement déplacé dans le niveau Accès fréquent. Pour bénéficier des coûts de stockage les plus économique pour les données accessibles de façon asynchrone, vous pouvez choisir d'activer des fonctionnalités d'archivage supplémentaires. Une fois que vous activez l'un des niveaux d'accès asynchrone aux archives ou les deux, S3 Intelligent-Tiering déplacera automatiquement les objets qui n'ont pas été accédés pendant 90 jours au minimum vers le niveau Accès aux archives pour économiser jusqu'à 71 %, et ceux qui n'ont pas été consultés pendant 180 jours vers le niveau Accès Deep Archive pour économiser jusqu'à 95 % sur les objets rarement consultés. Si un objet se trouvant dans les niveaux d'accès optionnels Archive ou Deep Archive est restauré ultérieurement, il est déplacé dans le niveau Accès fréquent, et avant de pouvoir récupérer l'objet, vous devez d'abord le restaurer en utilisant RestoreObject. Pour plus d'informations sur la restauration des objets archivés, consultez la section Restauration des objets archivés. Il n'y a pas de frais d'extraction dans S3 Intelligent-Tiering. Aucun frais de hiérarchisation ou de cycle de vie supplémentaire ne s'applique lorsque les objets sont déplacés entre les niveaux d'accès au sein de la classe de stockage S3 Intelligent-Tiering.

Il n'existe aucune taille d'objet minimale pour S3 Intelligent-Tiering, mais les objets plus petits que 128 Ko ne sont pas éligibles à la hiérarchisation automatique. Ces objets plus petits peuvent être stockés dans S3 Intelligent-Tiering, mais ils seront toujours facturés aux taux du niveau Accès fréquent, les frais de surveillance et d'automatisation ne seront cependant pas facturés. Si vous souhaitez normaliser S3 Intelligent-Tiering comme classe de stockage par défaut pour les données nouvellement créées, vous pouvez modifier vos applications en spécifiant INTELLIGENT_TIERING dans l'en-tête de votre demande d'API S3 PUT. S3 Intelligent-Tiering est conçu pour être disponible à 99,9 % et durable à 99,999999999 %. Il offre automatiquement des performances de débit élevé et de faible latence comparables à celles de S3 Standard. Vous pouvez utiliser Explorateur de coûts AWS pour mesurer les économies supplémentaires réalisées grâce au niveau Accès instantané aux archives.

Vous pouvez utiliser S3 Intelligent-Tiering comme classe de stockage par défaut pour pratiquement toutes les charges de travail, notamment les lacs de données, l’analytique des données, le machine learning, les nouvelles applications et le contenu généré par les utilisateurs. S3 Intelligent-Tiering est le premier système de stockage dans le cloud qui réduit automatiquement vos coûts de stockage au niveau des objets en déplaçant automatiquement les données vers le niveau d'accès le plus rentable en fonction de la fréquence d'accès, sans impact sur les performances, les frais de récupération ou les coûts opérationnels. Si vous avez des données ayant des modèles d'accès inconnus ou changeants, notamment les lacs de données, l'analyse de données et les nouvelles applications, nous vous recommandons d'utiliser S3 Intelligent-Tiering. Si vous avez des données qui ne nécessitent pas une extraction immédiate, nous vous recommandons d'activer le niveau Deep Archive Access au prix modique de 1 USD par To pour les données qui sont rarement consultées sur de longues périodes. S3 Intelligent-Tiering est conçu pour les données ayant des modèles d'accès inconnus ou changeants. Il n’y a aucuns frais d’extraction lors de l’utilisation de la classe de stockage S3 Intelligent-Tiering.

S3 Intelligent-Tiering optimise automatiquement vos coûts de stockage sans impacter vos performances. Les niveaux d’accès S3 Intelligent-Tiering fréquent, peu fréquent et accès instantané aux archives offrent des performances de débit élevé et des latences de quelques millisecondes.

Pour les données accessibles de façon asynchrones, le niveau optionnel Access Archive, offre les mêmes performances que S3 Glacier Flexible Retrieval, et le niveau Deep Archive Access offre les mêmes performances que la classe de stockage S3 Glacier Deep Archive. Vous ne devez activer les fonctionnalités d’archivage asynchrone que si votre application peut attendre de quelques minutes à plusieurs heures. Si l’objet que vous récupérez est stocké dans les niveaux Archive Access ou Deep Archive Access, avant de pouvoir récupérer l’objet, vous devez d’abord restaurer un objet en utilisant RestoreObject. Pour plus d’informations sur la restauration des objets archivés, consultez la section Restauration des objets archivés. Les objets du niveau Archive Access sont déplacés dans le niveau Frequent Access en 3 à 5 heures, et ceux du niveau Deep Archive Access en l’espace de 12 heures. Si vous avez besoin d’un accès plus rapide à un objet stocké dans le niveau Archive Access, vous pouvez payer pour une récupération plus rapide en utilisant la console pour sélectionner l’option de vitesse de récupération accélérée.

S3 Intelligent-Tiering est conçu pour la même durabilité à 99,999999999 % que la classe de stockage S3 Standard. S3 Intelligent-Tiering est conçu pour offrir une disponibilité de 99,9 % et dispose d’un contrat de niveau de service (SLA) offrant des crédits de service en cas de disponibilité inférieure à notre engagement de service au cours de n’importe quel cycle de facturation.

Vous pouvez transférer vos données vers S3 Intelligent-Tiering de deux manières. Vous pouvez les placer (PUT) directement dans S3 Intelligent-Tiering en spécifiant INTELLIGENT_TIERING dans l’en-tête x-amz-storage-class, ou définir les stratégies de cycle de vie pour transférer des objets depuis S3 Standard ou S3 standard – Accès peu fréquent vers S3 INTELLIGENT_TIERING.

Pour S3 Intelligent-Tiering, vous payez des frais mensuels pour le stockage, les requêtes et le transfert de données, ainsi que de faibles frais mensuels pour la surveillance et l’automatisation par objet. La classe de stockage S3 Intelligent-Tiering stocke automatiquement vos objets dans trois niveaux d'accès : un niveau à accès fréquent pour lequel la tarification du stockage S3 Standard est appliquée, un niveau à accès peu fréquent pour lequel la tarification du stockage S3 Standard – Stockage avec accès peu fréquent est appliquée, un niveau d'accès instantané aux archives pour lequel la tarification du stockage S3 Glacier Instant Retrieval est appliquée. S3 Intelligent-Tiering dispose également de deux niveaux d'archivage optionnels conçus pour un accès asynchrone, un niveau Archive Access, facturé aux tarifs de stockage de S3 Glacier Flexible Retrieval, et un niveau Deep Archive Access, facturé aux tarifs de stockage de S3 Glacier Deep Archive.

Moyennant des frais mensuels modiques pour la surveillance et l'automatisation, S3 Intelligent-Tiering surveille les modèles d'accès et déplace automatiquement les objets entre les niveaux d'accès à faible latence et à débit élevé, ainsi qu'entre deux niveaux optionnels d'accès aux archives asynchrones. Ces niveaux offrent aux clients les coûts de stockage les plus économiques dans le cloud pour les données qui peuvent être consultées de façon asynchrone.

Il n'existe aucune taille d'objet facturable minimale dans S3 Intelligent-Tiering, mais les objets plus petits que 128 Ko ne sont pas éligibles pour la hiérarchisation automatique. Ces petits objets ne seront pas surveillés et seront toujours facturés aux tarifs du niveau Accès fréquent, sans frais de surveillance et d'automatisation. Pour chaque objet archivé au niveau Archive Access ou au niveau Deep Archive Access dans S3 Intelligent-Tiering, Amazon S3 utilise 8 Ko de stockage pour le nom de l’objet et d’autres métadonnées (facturés aux tarifs de stockage S3 Standard) et 32 Ko de stockage pour l’index ainsi que les métadonnées connexes (facturés aux tarifs de stockage S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive).

Non. Il n’y aucuns frais de récupération dans S3 Intelligent-Tiering. S3 Intelligent-Tiering contrôle les modèles d’accès de vos données, et si vous accédez à un objet dans les niveaux Accès peu fréquent, Accès instantané aux archives ou Archivage asynchrone, S3 Intelligent-Tiering déplace automatiquement cet objet dans le niveau Accès fréquent.

Pour accéder à un objet stocké au niveau d’archive Archive ou Deep Archive, vous devez émettre une demande de restauration (RESTORE) et le déplacement vers le niveau Frequent Access de l’objet sera initialisé, le tout au sein de la classe de stockage S3 Intelligent-Tiering. Les objets du niveau d'accès Archive sont déplacés dans le niveau Frequent Access en 3 à 5 heures et ceux du niveau Deep Archive en l'espace de 12 heures. Une fois les objets dans le niveau Accès fréquent, vous pouvez émettre une requête GET pour récupérer l’objet.

Vous pouvez utiliser l’inventaire Amazon S3 pour rapporter le niveau d’accès des objets stockés dans la classe de stockage S3 Intelligent-Tiering. Chaque jour ou chaque semaine, Amazon S3 Inventory crée des fichiers de sortie au format CSV, ORC ou Parquet qui listent vos objets et les métadonnées qui leur sont associées pour un compartiment S3 ou un préfixe commun. Vous pouvez également émettre une requête HEAD sur vos objets pour obtenir un rapport sur les niveaux d’accès d’archive S3 Intelligent-Tiering.

Oui. Vous pouvez gérer le cycle de vie des objets S3 Intelligent-Tiering des niveaux Accès fréquent, Accès peu fréquent et Accès instantané aux archives dans S3 Unizone – Accès peu fréquent, S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive. De plus, vous pouvez gérer le cycle de vie des objets S3 Intelligent-Tiering des niveaux d’accès optionnels dans S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive, et le niveau S3 Intelligent-Tiering Deep Archive Access dans S3 Glacier Deep Archive.

Non, la classe de stockage S3 Intelligent-Tiering n’a pas de durée de stockage minimale.

Non, la classe de stockage S3 Intelligent-Tiering n’a pas de taille d’objet facturable minimale, mais les objets inférieurs à 128 Ko ne sont pas éligibles pour la hiérarchisation automatique. Ces objets plus petits seront toujours facturés aux tarifs du niveau Accès fréquent, sans frais de surveillance et d'automatisation. Pour chaque objet archivé au niveau optionnel Archive Access ou Deep Archive Access dans S3 Intelligent-Tiering, Amazon S3 utilise 8 Ko de stockage pour le nom de l'objet et d'autres métadonnées (facturés aux tarifs de stockage S3 Standard) et 32 Ko de stockage pour l'index ainsi que les métadonnées connexes (facturés aux tarifs de stockage S3 Glacier et S3 Glacier Deep Archive). Pour plus de détails, consultez la page Tarification Amazon S3.

S3 Standard

Ouvrir tout

Amazon S3 Standard offre un stockage durable avec une latence d’accès de quelques millisecondes et des performances de débit élevé pour les données fréquemment consultées (généralement plusieurs fois par mois). S3 Standard est conçu pour les cas d'utilisation sensibles aux performances, tels que les lacs de données, les applications natives cloud, les sites web dynamiques, la distribution de contenu, les application mobiles et de jeux, l'analytique et les modèles de machine learning. S3 Standard est conçu pour une disponibilité des données de 99,99 % et une durabilité des objets de 99,999999999 % sur plusieurs zones de disponibilité sur une année donnée. Vous pouvez utiliser les stratégies de cycle de vie S3 pour un contrôle total du moment où les données sont transférés entre S3 Standard et des classes de stockage plus économiques sans rien changer aux applications.

S3 Standard est idéal pour les données fréquemment consultées ou modifiées qui nécessitent un accès de quelques millisecondes et des performances de débit élevé. S3 Standard est idéal pour les données qui sont lues ou écrites très souvent, étant donné qu'il n'y a aucuns frais d'extraction. S3 Standard est optimisé pour de nombreux cas d’utilisation, notamment les lacs de données, les applications natives cloud, les sites Web dynamiques, la distribution de contenu, les applications mobiles et de jeux et l’analytique.

S3 Express One Zone

Ouvrir tout

Amazon S3 Express One Zone est une classe de stockage Amazon S3 hautes performances à disponibilité unique. Elle a été conçue pour fournir un accès homogène, de l’ordre de la milliseconde, aux données pour les applications les plus sensibles aux latences des clients. Amazon S3 Express One Zone est la classe de stockage d’objets dans le cloud à la latence la plus faible disponible actuellement. Elle offre une vitesse d’accès aux données jusqu’à 10 fois supérieure et des coûts de demande jusqu’à 80 % inférieurs à ceux d’Amazon S3 Standard. Avec S3 Express One Zone, vous pouvez sélectionner une zone de disponibilité AWS spécifique au sein d’une Région AWS pour stocker vos données. Vous pouvez décider de localiser votre stockage et vos ressources de calcul dans la même zone de disponibilité afin d’optimiser davantage les performances.

S3 Express One Zone est la classe de stockage idéale pour les applications nécessitant la vitesse d’accès aux données la plus rapide et les meilleures performances pour les applications sensibles à la latence. S3 Express One Zone est la meilleure classe de stockage pour les opérations gourmandes en demandes telles que la formation et l’inférence par machine learning (ML), l’analytique interactive et la création de contenu multimédia.

Vous pouvez commencer par créer un compartiment de répertoires S3 dans la zone de disponibilité (AZ) AWS de votre choix. Vous pouvez décider de localiser votre stockage et vos ressources de calcul dans la même AZ afin d’optimiser davantage les performances. Le Blocage de l’accès public S3 est activé par défaut dans les compartiments de répertoires. Après avoir créé le compartiment de répertoires, vous pouvez télécharger directement des objets vers la classe de stockage S3 Express One Zone ou copier des objets depuis des classes de stockage S3 existantes dans S3 Express One Zone. Vous pouvez également importer des données d’un simple clic dans la console de gestion AWS dans S3 Express One Zone ou utiliser S3 Batch Operations pour copier un compartiment entier, un préfixe ou des sous-ensembles de données d’une classe de stockage S3 existante dans S3 Express One Zone.

Vous pouvez importer des données provenant de la même Région AWS dans la classe de stockage S3 Express One Zone via la console S3 en utilisant l’option Importer après avoir créé un compartiment de répertoires. L’importation simplifie la copie des données dans des compartiments de répertoires S3 en vous permettant de choisir un préfixe ou un compartiment à partir duquel importer les données sans avoir à spécifier tous les objets à copier individuellement. S3 Batch Operations copie les objets dans le préfixe ou le compartiment à usage général sélectionné et vous pouvez suivre la progression de la tâche d’importation et de copie via la page de détails de la tâche S3 Batch Operations.

Les objets S3 Express One Zone sont stockés dans une seule zone de disponibilité (AZ) AWS de votre choix. Le stockage d'objets dans une zone vous permet de stocker vos données localement sur votre ordinateur afin de minimiser la latence. Vous pouvez accéder aux données depuis toutes les zones de disponibilité, même si la latence augmente.

S3 Express One Zone offre une élasticité de performance similaire à celle des autres classes de stockage S3, mais avec des latences de requêtes de lecture et d’écriture constantes de quelques millisecondes au premier octet, jusqu’à 10 fois plus rapides que les classes de stockage S3 existantes. Avec S3 Express One Zone, les clients n'ont pas besoin de planifier ou de provisionner à l'avance leurs exigences en matière de capacité ou de débit, et bénéficient immédiatement de demandes traitées plus rapidement. S3 Express One Zone convient parfaitement aux tâches d'analyse où la latence de stockage accélère les délais d'exécution des tâches et réduit le coût total de possession global. Ce système est également idéal pour les charges de travail interactives, comme le montage vidéo, où les professionnels de la création ont besoin de l’accès le plus réactif possible à leurs données S3.

S3 Express One Zone utilise une architecture unique pour optimiser les performances et fournir une faible latence des requêtes en permanence. S3 Express One Zone stocke les données sur du matériel hautes performances et son protocole objet a été amélioré pour rationaliser les frais généraux d’authentification et de métadonnées. En outre, afin d’améliorer encore la vitesse d’accès et de prendre en charge jusqu’à 2 millions de demandes par seconde, les données sont stockées dans un nouveau type de compartiment : un compartiment de répertoires Amazon S3. Avec S3 Express One Zone, vous pouvez sélectionner une zone de disponibilité AWS spécifique au sein d’une Région AWS pour stocker vos données. Vous pouvez décider de localiser votre stockage et vos ressources de calcul dans la même zone de disponibilité afin d’optimiser davantage les performances.

Chaque compartiment de répertoires S3 peut prendre en charge jusqu’à 2 millions de lectures et jusqu’à 200 000 écritures par seconde par compartiment de répertoires S3, quel que soit le nombre de répertoires qu’il contient. Par défaut, chaque compartiment de répertoires S3 prend en charge jusqu’à 200 000 lectures et 100 000 écritures par seconde. Si votre charge de travail dépasse les limites en TPS par défaut, vous pouvez demander une augmentation via AWS Support.

Les compartiments de répertoires S3 n’ayant enregistré aucune activité de demande pendant une période de trois mois ou plus deviennent inactifs. Lorsqu’il est inactif, un compartiment de répertoires est temporairement inaccessible pour les opérations de lecture et d’écriture. Les compartiments inactifs conservent l’intégralité du stockage, ainsi que les métadonnées d’objets et de compartiments. Les frais de stockage existants s’appliquent aux compartiments inactifs. Suite à une demande d’accès à un compartiment inactif, celui-ci passe à l’état actif généralement en quelques minutes. Pendant cette période de transition, les opérations de lecture et d’écriture renverront un code d’erreur 503 SlowDown.

S3 Express One Zone fournit un débit élevé et élastique similaire à celui des autres classes de stockage Amazon S3. S3 Express One Zone est conçu dès le départ pour permettre aux clients individuels d'augmenter leur débit à des niveaux agrégés très élevés. Par exemple, les applications de formation de modèles de machine learning peuvent s'entraîner sur des millions d'objets et des pétaoctets de données. Vous pouvez obtenir les meilleures performances en répartissant ces demandes sur des connexions distinctes afin de maximiser la bande passante accessible.

Avec S3 Express One Zone, vous authentifiez et autorisez les demandes par le biais d’un nouveau mécanisme basé sur les sessions, S3 CreateSession, optimisé pour fournir la latence la plus faible possible. Vous pouvez utiliser CreateSession pour demander des informations d'identification temporaires qui fournissent un accès à faible latence à votre compartiment. Ces informations d'identification temporaires sont limitées à un compartiment de répertoires S3 spécifique. Pour plus d’informations sur ce modèle basé sur les sessions, reportez-vous à S3 Create Session dans le guide du développeur.

S3 Express One Zone est conçu pour fournir une disponibilité de 99,95 % au sein d’une seule zone de disponibilité, avec un contrat de niveau de service (SLA) de disponibilité de 99,9 %.

Avec S3 Express One Zone, vos données sont stockées de manière redondante sur plusieurs appareils au sein d’une même zone de disponibilité. Le service S3 Express One Zone est conçu pour prendre en charge des défaillances simultanées de périphériques en détectant et en réparant rapidement toute redondance perdue. Ainsi, en cas de défaillance de l’appareil existant, S3 Express One Zone transfère automatiquement les demandes vers de nouveaux appareils au sein d’une AZ. Cette redondance permet un accès ininterrompu à vos données au sein d’une zone de disponibilité.

Il n’y a pas de frais d’installation ou d’engagement pour commencer à utiliser S3 Express One Zone. S3 Express One Zone vous facture le stockage et les demandes. Le volume de stockage facturé par mois s'accumule sur la base du stockage total utilisé par heure, mesuré en gigaoctets par mois (Go-mois). Des frais d’accès par demande vous sont également facturés en fonction du type de demande, tel que les types PUT et GET. Vous devrez payer des frais supplémentaires par Go pour le téléchargement et la récupération des données. Exemple 1 :
Supposons que vous stockiez 10 Go de données dans S3 Express One Zone pendant 30 jours, soit un total de 1 000 000 écritures et 9 000 000 lectures, et que vous y accédiez avec Athena avec une taille de requête de 10 Ko. Ensuite, vous supprimez 1 000 000 fichiers au bout de 30 jours. En supposant que votre compartiment se trouve dans la Région USA Est (Virginie du Nord), les frais de stockage et inhérents aux demandes sont calculés comme suit : Frais de stockage
Utilisation totale (en octet-heure) = 10 Go/mois
Coût de stockage total = 10 Go/mois x 0,11 USD = 1,10 USD Frais inhérents aux demandes
1 000 000 de demandes PUT : 1 000 000 de demandes x 0,00113 USD/1 000 = 1,13 USD
9 000 000 de demandes GET : 9 000 000 de demandes x 0,00003 USD/1 000 = 0,27 USD
1 000 000 de demandes DELETE = 1 000 000 de demandes x 0,00 USD (gratuit) = 0 USD Frais de chargement de données : 10 Ko/1 048 576 x 1 000 000 x 0,0032 USD = 0,03 USD
Frais de récupération de données : 10 Ko/1 048 576 x 9 000 000 x 0,0006 USD = 0,05 USD
Total des frais = 1,10 USD + 1,13 USD + 0,27 USD + 0,03 USD + 0,05 USD = 2,58 USD Exemple 2 :
Supposons que vous stockiez 10 To de données pour la formation au machine learning pour une charge de travail de 8 heures par jour, puis que vous les supprimiez. Au cours de cette charge de travail de 8 heures, vous effectuez 5 242 880 écritures et 10 485 760 lectures pour une taille de requête de 2 Mo. Supposons que vous le fassiez pendant 30 jours (soit un mois). Frais de stockage
Utilisation totale en octet-heure = [10 995 116 277 760 octets x 30 jours x (8 heures/jour)] = 2 638 827 906 662 400 octets-heures = 3 303,77 Go/mois
Coût de stockage total = 3 303,77 Go x 0,11 USD = 363,41 USD Frais inhérents aux demandes
5 242 880 de demandes PUT par jour : 5 242 880 de demandes x 30 x 0,00113 USD/1 000 = 177,73 USD
10 485 760 de demandes GET par jour : 10 485 760 de demandes x 30 x 0,00003 USD/1 000 = 9,44 USD
5 242 880 de demandes DELETE/jour : 5 242 880 de demandes x 0,00 USD (gratuit) = 0 USD Frais de téléchargement de données : 2 Mo/1 024 x 5 242 880 x 30 x 0,0032 USD = 983,04 USD
Frais de récupération de données : 2 Mo/1 024 x 10 485 760 x 30 x 0,0006 USD = 368,64 USD
Total des frais = 363,41 USD + 177,73 USD + 9,44 USD + 983,04 USD + 368,64 USD = 1 902,26 USD

Les frais de demande pour accéder aux données dans la zone S3 Express One incluent les coûts de transfert de données au sein du réseau AWS d’une région, et il n’y a pas de frais de transfert de données supplémentaires pour les données transférées entre Amazon EC2 (ou tout service AWS) et S3 Express One Zone au sein de la même région, par exemple, les données transférées dans la région USA Est (Virginie du Nord).

Les frais de demande pour accéder aux données dans S3 Express One Zone incluent les coûts d’utilisation des points de terminaison d’un VPC de passerelle, et il n’y a pas de frais supplémentaires pour l’utilisation des points de terminaison de passerelle avec S3 Express One Zone.

S3 Standard-Infrequent Access (S3 Standard-IA)

Ouvrir tout

Amazon S3 Standard-Infrequent Access (S3 Standard-IA) est une classe de stockage d’Amazon S3 pour les données consultées moins fréquemment, mais nécessitant un accès rapide. S3 Standard – Accès peu fréquent offre la haute durabilité, le débit élevé et la faible latence d'une classe de stockage Amazon S3 Standard avec un prix de stockage au Go et des frais d'extraction par Go faibles. Ces performances élevées alliées à un faible coût font de S3 Standard – Accès peu fréquent l'outil idéal pour le stockage et les sauvegardes à long terme, ainsi qu'en tant que dépôt de données pour la reprise après sinistre. La classe de stockage de S3 One Zone-IA est définie au niveau de l’objet et peut occuper le même compartiment que les classes de stockage S3 Standard ou S3 One Zone-IA, ce qui vous permet d’utiliser des stratégies de gestion du cycle de vie S3 pour assurer le passage automatique des objets d’une classe de stockage à une autre sans changement pour les applications.

S3 Standard-IA est idéal pour les données consultées peu fréquemment, mais nécessitant un accès rapide le cas échéant. S3 Standard-IA est particulièrement adapté au stockage de fichiers à long terme, au stockage d’anciennes données de synchronisation et de partage et d’autres données anciennes.

S3 Standard-IA fournit la même latence de quelques millisecondes et les mêmes performances de débit élevé que la classe de stockage S3 standard.

Vous pouvez transférer vos données vers S3 Standard – Accès peu fréquent de deux manières différentes. Vous pouvez exécuter directement une opération PUT sur vos données dans S3 Standard – Accès peu fréquent en indiquant STANDARD_IA dans l'en-tête x-amz-storage-class. Vous pouvez également définir des politiques de cycle de vie pour faire passer des objets de S3 standard à la classe de stockage S3 standard – Accès peu fréquent.

Vous serez facturé pour une demande COPY S3 Standard (classe de stockage de destination) et pour une récupération de données S3 Standard–Accès peu fréquent (classe de stockage source). Pour plus d’informations, reportez-vous à la page de tarification Amazon S3.

S3 Standard-IA est conçu pour les données à longue durée de vie consultées peu fréquemment et conservées pendant des mois ou des années. Les données supprimées de S3 Standard-IA dans les 30 jours seront facturées 30 jours complets. Référez-vous à la page de tarification Amazon S3 pour obtenir des informations sur la tarification de la classe S3 Standard-IA.

S3 Standard-IA est conçu pour des objets plus importants et génère des frais de stockage d’objet minimum de 128 Ko. Les objets de taille inférieure à 128 Ko donneront lieu à des frais de stockage équivalents à ceux d'un objet de 128 Ko. Par exemple, un objet de 6 Ko dans S3 Standard-IA entraîne les frais de stockage de S3 Standard-IA pour 6 Ko, et des frais supplémentaires correspondant à la taille minimale de l'objet équivalant à 122 Ko au coût de stockage de S3 Standard-IA. Référez-vous à la page de tarification Amazon S3 pour obtenir des informations sur la tarification de la classe S3 Standard-IA.

Oui. En plus d’utiliser des stratégies de cycle de vie pour faire migrer des objets depuis S3 Standard vers S3 Standard-IA, vous pouvez définir des stratégies de cycle de vie pour faire passer des objets depuis S3 Standard-IA vers les classes de stockage S3 One Zone-IA, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive.

S3 One Zone-Infrequent Access (S3 One Zone-IA)

Ouvrir tout

La classe de stockage S3 One Zone-IA est une classe de stockage Amazon S3 que les clients peuvent utiliser pour stocker des objets dans une seule zone de disponibilité. La classe de stockage S3 unizone – Accès peu fréquent stocke les données de façon redondante dans cette seule zone de disponibilité afin d'offrir une option de stockage à un prix 20 % inférieur à celui du stockage S3 Standard – Accès peu fréquent géographiquement redondant qui stocke des données de façon redondante sur plusieurs zones de disponibilité géographiquement distinctes. S3 unizone – Accès peu fréquent offre un accord de niveau de service (SLA) disponible à 99 % et est également conçu pour une durabilité à onze 9 dans la zone de disponibilité. Cependant, les données dans la classe de stockage S3 unizone – Accès peu fréquent ne résistent pas aux pertes physiques d'une zone de disponibilité entière. Le stockage S3 unizone – Accès peu fréquent offre les mêmes fonctions Amazon S3 que S3 standard et S3 standard – Accès peu fréquent et est utilisé par les API Amazon S3, par la console Amazon S3 et par l'interface de ligne de commande Amazon S3. La classe de stockage S3 unizone – Accès peu fréquent est définie au niveau de l'objet et peut occuper le même compartiment que les classes de stockage S3 Standard et S3 Standard – Accès peu fréquent. Vous pouvez occuper les stratégies de cycle de vie S3 afin de faire passer automatiquement des objets d’une classe de stockage à l’autre sans rien changer aux applications.

Les clients peuvent utiliser la classe S3 One Zone-IA pour les accès peu fréquents pour un stockage peu consulté, comme les copies de sauvegarde, les copies de reprise après sinistre ou d’autres données faciles à récréer.

La classe de stockage S3 One Zone-IA offre les mêmes performances en termes de latence et de débit que les classes S3 standard et S3 Standard - Stockage avec accès peu fréquent.

La classe de stockage S3 One Zone-IA est conçue pour offrir une durabilité de 99,999999999 % au sein d’une zone de disponibilité. Cependant, les données dans la classe de stockage S3 unizone – Accès peu fréquent ne résistent pas à la perte de disponibilité ou à la perte physique d'une zone de disponibilité. Au contraire, les classes de stockage S3 standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access et S3 Glacier sont conçues pour éviter la perte de disponibilité ou résister à la destruction d'une zone de disponibilité. S3 One Zone-IA offre une durabilité et une disponibilité égales ou supérieures à celles de la plupart des centres de données physiques modernes tout en fournissant en plus l’avantage de l’élasticité du stockage et l’ensemble des fonctions d’Amazon S3.

Oui. Chaque région AWS désigne une zone géographique séparée. Chaque région se compose de plusieurs emplacements isolés appelés zones de disponibilité. La classe de stockage S3 One Zone-IA utilise une seule zone de disponibilité AWS dans la région.

Chaque zone de disponibilité utilise une mise en réseau et une alimentation redondante. Au sein d'une région AWS, les zones de disponibilité se trouvent sur différentes plaines inondables et lignes d'activités sismiques et sont géographiquement séparées pour éviter les incendies. Les classes de stockage S3 standard et S3 standard – Accès peu fréquent offrent une protection contre ce genre de catastrophes en stockant vos données de façon redondante dans différentes zones de disponibilité. S3 unizone – Accès peu fréquent offre une protection contre les pannes d'équipement dans une zone de disponibilité, mais les données ne résistent pas à la perte physique de la zone de disponibilité liée à des catastrophes, comme des tremblements de terre et des inondations. Grâce aux options S3 One Zone-IA, S3 standard et S3 standard – Accès peu fréquent, vous pouvez choisir la classe de stockage qui répond au mieux aux besoins en durabilité et en disponibilité de votre stockage.

Classe de stockage Amazon S3 Glacier Instant Retrieval

Ouvrir tout

La classe de stockage S3 Glacier Instant Retrieval offre le stockage le plus économique pour les données à longue durée de vie, rarement consultées et nécessitant une récupération en quelques millisecondes. S3 Glacier Instant Retrieval offre l'accès le plus rapide au stockage d'archives, avec le même débit et le même accès en millisecondes que les classes de stockage S3 Standard et S3 standard – Accès peu fréquent. S3 Glacier Instant Retrieval est conçu pour une durabilité des données de 99,999999999 % (11 9s) et une disponibilité de 99,9 % en stockant de manière redondante les données dans au moins trois zones de disponibilité AWS physiquement séparées.

S3 Glacier Instant Retrieval est idéal si vous avez des données rarement consultées (une fois par trimestre) et qui nécessitent un délai de récupération de quelques millisecondes. Cette classe de stockage est idéale si vous souhaitez la même faible latence et les mêmes performances de débit élevé que S3 Standard-IA, tout en stockant les données moins fréquemment consultées que S3 Standard-IA avec un prix de stockage inférieur et des coûts d’accès aux données légèrement supérieurs.

S3 Glacier Instant Retrieval est conçu pour une durabilité de 99,999999999 % (11 9s) et une disponibilité de 99,9%, tout comme S3 Standard – Accès peu fréquent, et dispose d’un contrat de niveau de service offrant des crédits de service en cas de disponibilité inférieure à 99 % au cours de n’importe quel cycle de facturation.

S3 Glacier Instant Retrieval fournit la même latence de quelques millisecondes et les mêmes performances de débit élevé que les classes de stockage S3 Standard et S3 Standard – Accès peu fréquent. À la différence des classes de stockage S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive, qui sont conçues pour un accès asynchrone, vous n’avez pas besoin d’émettre une demande de restauration (RESTORE) avant d’accéder à un objet stocké dans S3 Glacier Instant Retrieval.

Vous pouvez transférer vos données vers S3 Glacier Instant Retrieval de deux manières différentes. Vous pouvez les placer (PUT) directement dans S3 Glacier Instant Retrieval en spécifiant GLACIER_IR dans l’en-tête x-amz-storage-class, ou définir les stratégies de cycle de vie S3 pour transférer des objets depuis S3 Standard ou S3 standard – Accès peu fréquent vers S3 Glacier Instant Retrieval.

S3 Glacier Instant Retrieval est conçu pour les données à longue durée de vie consultées peu fréquemment et conservées pendant des mois ou des années. Les objets archivés dans S3 Glacier Instant Retrieval sont stockés pendant 90 jours au minimum, et les objets supprimés avant le délai de 90 jours font l'objet de frais appliqués au prorata équivalents aux frais de stockage pour les jours restants. Consultez la page de tarification Amazon S3 pour obtenir des informations sur la tarification d’Amazon S3 Glacier Instant Retrieval.

S3 Glacier Instant Retrieval est conçu pour des objets plus importants et génère des frais de stockage d’objet minimum de 128 Ko. Les objets de taille inférieure à 128 Ko donneront lieu à des frais de stockage équivalents à ceux d'un objet de 128 Ko. Par exemple, un objet de 6 Ko dans S3 Glacier Instant Retrieval entraîne les frais de stockage de S3 Glacier Instant Retrieval pour 6 Ko, plus des frais supplémentaires correspondant à la taille minimale de l'objet équivalant à 122 Ko au coût de stockage de S3 Glacier Instant Retrieval. Consultez la page de tarification Amazon S3 pour obtenir des informations sur la tarification d’Amazon S3 Glacier Instant Retrieval.

Pour S3 Glacier Instant Retrieval, vous payez des frais mensuels pour le stockage, les requêtes en fonction de leur type et les extractions de données. Le volume de stockage facturé pour un mois dépend du volume de stockage moyen utilisé pendant le mois concerné. Il se mesure en gigaoctets par mois (Go-mois). Vous êtes facturé en fonction du type des requêtes (par ex., PUT, COPY et GET). Vous payez également des frais par Go pour chaque gigaoctet de données renvoyé vers vous.

Classe de stockage Amazon S3 Glacier Flexible Retrieval

Ouvrir tout

La classe de stockage S3 Glacier Flexible Retrieval offre un stockage à faible coût, jusqu’à 10 % moins cher (que S3 Glacier Instant Retrieval), pour les données d’archives consultées une à deux fois par an et récupérées de manière asynchrone, avec extractions en bloc gratuites. Pour les données d'archive qui ne nécessitent pas un accès immédiat mais qui ont besoin de la flexibilité nécessaire pour récupérer gratuitement de grands ensembles de données, tels que les cas d'utilisation liés à la sauvegarde ou à la reprise après sinistre, S3 Glacier Flexible Retrieval est la classe de stockage idéale. S3 Glacier Flexible Retrieval offre des options de récupération extrêmement souples, qui assurent le juste équilibre entre le coût, des temps d'accès allant de quelques minutes à quelques heures, et des extractions en bloc gratuites. Il s'agit d'une solution idéale pour la sauvegarde, la reprise après sinistre, les besoins de stockage de données hors site, et pour les cas où des données doivent être extraites en quelques minutes et que vous ne voulez pas vous soucier des coûts. S3 Glacier Flexible Retrieval est conçu pour une durabilité des données de 99,999999999 % (11 9s) et une disponibilité de 99,99 % en stockant de manière redondante les données dans plusieurs zones de disponibilité AWS physiquement séparées au cours d’une année donnée.

Pour les données d’archive qui ne nécessitent pas un accès immédiat, mais qui ont besoin de la flexibilité nécessaire pour récupérer gratuitement de grands jeux de données, tels que les cas d’utilisation liés à la sauvegarde ou à la reprise après sinistre, S3 Glacier Flexible Retrieval est la classe de stockage idéale. S3 Glacier Flexible Retrieval offre des options de récupération extrêmement souples, qui assurent le juste équilibre entre le coût, des temps d'accès allant de quelques minutes à quelques heures, et des extractions en bloc gratuites. Il s’agit d’une solution idéale pour la sauvegarde, la reprise après sinistre, les besoins de stockage de données hors site, et pour les cas où des données doivent être extraites en quelques minutes et que vous ne voulez pas vous soucier des coûts de récupération des données.

Vous pouvez transférer vos données vers S3 Glacier Flexible Retrieval de deux manières différentes. Vous pouvez exécuter directement une opération PUT sur vos données dans S3 Glacier Flexible Retrieval en indiquant GLACIER dans l'en-tête x-amz-storage-class. Vous pouvez également utiliser les stratégies de cycle de vie S3 pour transférer des données entre toute Classe de stockage S3 pour les données actives (S3 Standard, S3 Intelligent-Tiering, S3 Standard – Accès peu fréquent et S3 unizone – Accès peu fréquent et S3 Glacier Instant Retrieval) vers Amazon S3 Glacier Flexible Retrieval en fonction de l'âge de l'objet. Utilisez la console de gestion d'Amazon S3, les kits de développement logiciel (SDK) AWS ou les API d'Amazon S3 pour exécuter directement une opération PUT sur vos données vers Amazon S3 Glacier définir des règles d'archivage.

Remarque : S3 Glacier Flexible Retrieval est également disponible via les API Glacier directes d'origine et via la console de gestion Amazon S3 Glacier. Pour une expérience amélioré complète avec un accès à toutes les fonctions S3 définies, y compris la gestion du cycle de vie, la réplication S3, S3 Storage Lens, etc., nous vous recommandons d’utiliser les API S3 et la console de gestion S3 pour l’utilisation des fonctions S3 Glacier.

Les objets archivés dans S3 Glacier Flexible Retrieval sont accessibles de manière asynchrone. Pour extraire les données stockées dans la catégorie de stockage S3 Glacier Flexible Retrieval, lancez une demande d'extraction à l'aide des API d'Amazon S3 ou de la console Amazon S3. La demande d'extraction crée une copie temporaire de vos données dans la classe de stockage S3 Standard tout en laissant les données archivées intactes dans S3 Glacier Flexible Retrieval. Vous pouvez définir la période (en jours), durant laquelle la copie temporaire est conservée dans Amazon S3. Vous pouvez ensuite accéder à votre copie temporaire dans S3, via une requête Amazon S3 GET sur l'objet archivé. Dans les régions AWS où le coût du stockage à redondance réduite est inférieur à celui de S3 Standard, les données temporairement disponibles sont facturées en tant que stockage à redondance réduite. Cependant, la classe de stockage de facturation à redondance réduite ne reflète pas la façon dont les données sont stockées. Avec les notifications de restauration, vous pouvez désormais recevoir une Notification d'événement S3 lorsqu'un objet a été restauré avec succès à partir de S3 Glacier Flexible Retrieval et que la copie temporaire est mise à votre disposition. Le propriétaire du compartiment (ou d’autres personnes, comme le permet une politique IAM) peut faire en sorte que les notifications soient envoyées à Amazon Simple Queue Service (SQS) ou à Amazon Simple Notification Service (SNS). Les notifications peuvent également être envoyées à AWS Lambda pour être traitées par une fonction Lambda.

Lorsqu’il traite une tâche d’extraction, Amazon S3 extrait d’abord les données demandées de S3 Glacier Flexible Retrieval, puis crée une copie temporaire des données demandées dans Amazon S3. Cela prend généralement quelques minutes. Le temps d'accès de votre demande dépend de l'option d'extraction que vous avez choisie : extraction rapide, standard ou en bloc. Les données consultées à l'aide des extractions rapides sont habituellement disponibles après 1 à 5 minutes, sauf pour les objets plus importants (plus de 250 Mo). L'extraction standard des objets prend généralement entre 3 et 5 heures. Les récupérations standard commencent généralement en quelques minutes lorsqu'elles sont lancées à l'aide de S3 Batch Operations. Les récupérations en bloc prennent généralement entre 5 et 12 heures, et sont gratuites. Pour en savoir plus sur les options d'extraction de S3 Glacier Flexible Retrieval, référez-vous à la section de restauration d'un objet archivé dans le guide de l'utilisateur S3.
Avec les unités de capacité allouées de la classe de stockage S3 Glacier, vous pouvez payer des frais initiaux fixes pour un mois donné afin de garantir la disponibilité de la capacité de récupération pour les récupérations accélérées à partir de S3 Glacier Flexible Retrieval. Vous pouvez acheter deux unités de capacité allouées par mois pour augmenter la quantité de données que vous pouvez récupérer. Chaque unité de capacité garantit qu'au moins trois extractions rapides soient exécutées toutes les cinq minutes, et offre jusqu'à 150 Mo/s de débit d'extraction. Si votre application nécessite un accès hautement fiable et prévisible à un sous-ensemble de vos données en quelques minutes, vous devriez acheter une capacité d'extraction allouée. Sans capacité allouée, des extractions expéditives pourraient ne pas être acceptées pendant les périodes de grande demande. Si vous avez besoin d'extractions expéditives à tout moment, nous vous recommandons d'acheter une capacité d'extraction allouée.
Vous pouvez acheter une capacité allouée à l'aide de la console Amazon S3, l'API REST d'achat de capacité allouée, les kits de développement (SDK) AWS ou AWS CLI. Une unité de capacité allouée a une période d'expiration d'un mois dès la date et l'heure de l'achat. Il s'agit de la date d'entrée en vigueur. L'unité expire à la date d'expiration, exactement un mois après la date d'entrée en vigueur à la seconde près. Pour des renseignements sur la tarification des capacités allouées, consultez la section de Tarification Amazon S3.

Le volume de stockage facturé pour un mois dépend du volume de stockage moyen utilisé pendant le mois concerné. Il se mesure en gigaoctets par mois (Go-mois). Amazon S3 calcule la taille de l'objet correspondant à la quantité de données que vous avez stockée, à laquelle s'ajoutent 32 Ko de données S3 Glacier et 8 Ko de classe stockage S3 Standard supplémentaires. S3 Glacier Flexible Retrieval a besoin de 32 Ko de données supplémentaires par objet pour l'index et les métadonnées de S3 Glacier, afin que vous puissiez identifier et récupérer vos données. Amazon S3 requiert 8 Ko pour stocker et tenir à jour le nom défini par l'utilisateur et les métadonnées correspondant aux objets archivés dans S3 Glacier Flexible Retrieval. Vous pouvez ainsi obtenir la liste en temps réel de tous vos objets Amazon S3, y compris ceux qui sont stockés à l'aide de la classe de stockage S3 Glacier Flexible Retrieval, en utilisant l'API LIST d'Amazon S3 ou le rapport d'inventaire S3. Par exemple, si vous avez archivé 100 000 objets de 1 Go chacun, les frais applicables au stockage seront les suivants :
1,000032 gigaoctets par objet x 100 000 objets = 100 003,2 gigaoctets de stockage dans S3 Glacier.
0,000008 gigaoctet par objet x 100 000 objets = 0,8 gigaoctet de stockage dans S3 Standard.
Le tarif est calculé sur la base des tarifs en vigueur pour votre Région AWS, qui sont indiqués sur la page de tarification Amazon S3. Pour des exemples de facturation S3 supplémentaires, consultez nos FAQ sur la facturation S3 ou utilisez le calculateur de prix AWS.

Les objets qui sont archivés dans S3 Glacier Flexible Retrieval ont une durée de stockage minimale de 90 jours. Les objets supprimés, écrasés ou transférés avant 90 jours seront facturés au prorata pour les frais de stockage des jours restants.

S3 Glacier Flexible Retrieval exige également 40 Ko de métadonnées supplémentaires pour chaque objet archivé. Cela comprend 32 Ko de métadonnées facturées au tarif S3 Glacier Flexible Retrieval nécessaire pour identifier et récupérer vos données. Et un supplément de 8 Ko de données facturé au tarif S3 Standard qui est nécessaire pour maintenir le nom et les métadonnées définis par l'utilisateur pour les objets archivés sur S3 Glacier Flexible Retrieval. Vous pouvez ainsi obtenir la liste en temps réel de tous vos objets S3 à l'aide de l'API S3 LIST ou du rapport d'inventaire S3. Consultez la page de tarification Amazon S3 pour obtenir des informations sur la tarification de Amazon S3 Glacier Flexible Retrieval.

Il existe trois moyens de récupérer les données à partir de S3 Glacier Flexible Retrieval : récupération accélérée, récupération standard et récupération en bloc. Les modes accéléré et standard offrent des frais de récupération par Go et des frais par requête (en d'autres termes, vous payez les requêtes effectuées sur vos objets Amazon S3). La récupération en bloc depuis S3 Glacier Flexible Retrieval est gratuite. Pour une tarification détaillée de S3 Glacier selon la Région AWS, veuillez consulter la page de tarification Amazon S3 Glacier.

Les classes de stockage Amazon S3 Glacier sont spécialement conçues pour l’archivage de données et vous offrent les meilleures performances, la plus grande flexibilité de récupération et le stockage d’archives le plus économique du cloud. Vous pouvez désormais choisir parmi trois classes de stockage d'archives optimisées pour différents modèles d'accès et durées de stockage. Pour les données d'archives nécessitant un accès immédiat, telles que les images médicales, les ressources des médias d'information ou les données génomiques, choisissez la classe de stockage S3 Glacier Instant Retrieval, une classe de stockage d'archives qui offre le stockage le plus économique avec une récupération en quelques millisecondes. Pour les données d'archives qui ne nécessitent pas un accès immédiat, mais qui ont besoin de la flexibilité nécessaire pour récupérer gratuitement de grands ensembles de données, comme dans les cas de sauvegarde ou de reprise après sinistre, choisissez S3 Glacier Flexible Retrieval (anciennement S3 Glacier), avec une récupération en quelques minutes ou des récupérations en bloc gratuites en 5 à 12 heures. Pour économiser encore plus sur le stockage d’archives de longue durée, comme les archives de conformité et la préservation des médias numériques, choisissez S3 Glacier Deep Archive, le stockage le plus économique du cloud avec une récupération des données en 12 heures.

Nous préférons nous concentrer sur les résultats pour le client en termes de performance, de durabilité, de disponibilité et de sécurité. Toutefois, cette question est souvent posée par nos clients. Nous utilisons un certain nombre de technologies différentes qui nous permettent de proposer les tarifs que nous pratiquons actuellement avec les clients. Nos services ont été élaborés à l'aide de technologies de stockage de données couramment utilisées : ces dernières sont spécifiquement regroupées dans des systèmes dédiés et optimisés en matière de coûts grâce aux logiciels développés par AWS. Les classes de stockage S3 Glacier optimisent la séquence d’entrées et de sorties afin d’accroître l’efficacité de l’accès au stockage sous-jacent.

Amazon S3 Glacier Deep Archive

Ouvrir tout

S3 Glacier Deep Archive est une classe de stockage Amazon S3 qui offre un stockage d’objets durable et sécurisé pour la conservation des données sur le long terme et un accès à ces dernières une ou deux fois par an. Avec un tarif de départ de 0,00099 USD par Go-mois seulement (moins d’un centième de centime, soit un peu moins de 1 USD par To-mois), S3 Glacier Deep Archive propose le stockage dans le cloud le moins cher, à des prix bien moins élevés que si vous stockiez et entreteniez vos données dans des bibliothèques de bandes magnétiques sur site ou que si vous archiviez vos données hors site.

S3 Glacier Deep Archive est la classe de stockage idéale pour offrir une protection hors ligne aux ressources de données de votre entreprise les plus importantes. Elle permet également de conserver les données à long terme lorsque la politique de l’entreprise, des exigences contractuelles ou des règlements l’imposent. Les clients considèrent que S3 Glacier Deep Archive est un excellent choix pour protéger les principaux droits de propriété intellectuelle, les dossiers financiers et médicaux, les résultats de la recherche, les documents juridiques, les études d'exploration sismique, les sauvegardes à long terme, principalement dans les industries hautement règlementées comme les services financiers, la santé, le pétrole et le gaz, et le secteur public. De plus, certaines organisations, comme les sociétés multimédia et de divertissement, veulent conserver une copie de sauvegarde des principaux droits de propriété intellectuelle. Bien souvent, les clients S3 Glacier Deep Archive peuvent réduire ou supprimer l’utilisation des bibliothèques de bandes magnétiques sur site et des services d’archives sur bandes hors site.

Grâce à S3 Glacier Deep Archive, nos offres d’archivage de données sont étendues : vous pouvez sélectionner la classe de stockage optimale en fonction des coûts de stockage et d’extraction, ainsi que des délais d’extraction. Choisissez la classe de stockage S3 Glacier Instant Retrieval lorsque vous avez besoin d'accéder en quelques millisecondes aux archives de données à un prix réduit. Pour les données d'archives qui ne nécessitent pas un accès immédiat, mais qui ont besoin de la flexibilité nécessaire pour récupérer gratuitement de grands ensembles de données, comme dans les cas de sauvegarde ou de reprise après sinistre, choisissez S3 Glacier Flexible Retrieval (anciennement S3 Glacier), avec une récupération en quelques minutes ou des récupérations en bloc gratuites en 5 à 12 heures. La technologie S3 Glacier Deep Archive, quant à elle, a été conçue pour les données froides auxquelles vous accéderez peu ou pas du tout, mais qui ont quand même besoin d'un stockage durable sur le long terme. S3 Glacier Deep Archive est jusqu’à 75 % moins cher que S3 Glacier Flexible Retrieval et permet une extraction en 12 heures en utilisant le niveau de récupération standard. Les récupérations standard commencent généralement dans les 9 heures lorsqu’elles sont lancées à l’aide de S3 Batch Operations. Pour réduire les coûts d’extraction, vous pouvez sélectionner l’extraction en bloc qui renvoie les données dans un délai de 48 heures.

Pour stocker des données dans S3 Glacier Deep Archive, le moyen le plus simple est de charger directement des données à l’aide de l’API S3. Il vous suffit de spécifier « S3 Glacier Deep Archive » en tant que classe de stockage. Pour ce faire, vous pouvez vous servir de la console de gestion AWS, l'API REST S3, les kits SDK AWS ou l'interface de ligne de commande AWS. Vous pouvez également commencer à utiliser S3 Glacier Deep Archive en créant des politiques de migration des données à l'aide du cycle de vie S3. Grâce à ce dernier, vous pouvez définir le cycle de vie de votre objet et réduire le coût de stockage. Ces politiques peuvent être configurées de manière à migrer les objets dans S3 Glacier Deep Archive en fonction de l'âge de l'objet. Vous pouvez définir la politique pour un compartiment S3 ou pour des préfixes spécifiques. Les transitions du cycle de vie sont facturées au prix du chargement S3 Glacier Deep Archive. La passerelle de bande, une fonctionnalité de bibliothèque de bandes virtuelles basée sur le cloud au sein de AWS Storage Gateway, s'intègre désormais à S3 Glacier Deep Archive. Grâce à cette intégration, vous pouvez stocker à long terme vos sauvegardes et archives basées sur des bandes virtuelles dans S3 Glacier Deep Archive. Il s'agit de la solution de stockage dans le cloud la moins coûteuse pour ces données. Pour commencer, créez une nouvelle bande virtuelle à l'aide de la console ou de l'API AWS Storage Gateway, puis définissez la cible de stockage d'archivage sur S3 Glacier Flexible Retrieval ou S3 Glacier Deep Archive. Lorsque votre application de sauvegarde éjecte la bande, celle-ci est archivée dans la cible de stockage sélectionnée.

Il existe différentes façons de migrer des données depuis des archives sur bandes existantes vers S3 Glacier Deep Archive. Pour l'intégration avec des applications de sauvegarde existantes, vous pouvez utiliser la passerelle de bandes AWS à l'aide de l'interface de la bibliothèque de bandes virtuelles (VTL). Cette interface présente des bandes virtuelles à l'application de sauvegarde. Celles-ci peuvent être immédiatement utilisées pour stocker des données dans Amazon S3, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive.
Pour migrer les données, vous pouvez également utiliser AWS Snowball. Snowball accélère le transfert de téraoctets et de pétaoctets de données vers et depuis AWS à l’aide d’appareils de stockage sécurisés pour le transport. Grâce à Snowball, vous pouvez surmonter les difficultés rencontrées lors d’importants transferts de données, en particulier les coûts de réseau élevés, la durée des transferts et les problèmes de sécurité. Pour finir, vous pouvez utiliser AWS Direct Connect pour établir des connexions réseau dédiées depuis votre environnement sur site vers AWS. Généralement, AWS Direct Connect peut réduire les coûts de réseau, augmenter le débit de bande passante et fournir une expérience réseau plus cohérente que les connexions basées sur Internet.

Pour extraire les données stockées dans S3 Glacier Deep Archive, vous pouvez lancer une demande de restauration à l’aide des API Simple Storage Service (Amazon S3) ou de la console de gestion Simple Storage Service (Amazon S3). La restauration crée une copie temporaire de vos données dans la classe de stockage S3 Standard tout en laissant les données archivées intactes dans S3 Glacier Deep Archive. Vous pouvez définir la période (en jours), durant laquelle la copie temporaire est conservée dans S3. Vous pouvez ensuite accéder à votre copie temporaire dans S3, via une requête Amazon S3 GET sur l'objet archivé. Lorsque vous restaurez un objet archivé, vous pouvez spécifier l'une des options suivantes dans l'élément Tier du corps de la demande : le niveau Standard est le niveau par défaut et vous permet d'accéder à tous vos objets archivés dans les 12 heures, les extractions commençant généralement dans les 9 heures lorsqu'elles sont lancées à l'aide de S3 Batch Operations. Le traitement en masse vous permet de récupérer de grandes quantités de données, même des pétaoctets de données, à peu de frais et généralement en 48 heures.

Le stockage S3 Glacier Deep Archive est facturé en fonction de la quantité de données stockées en Go, du nombre de demandes de transition PUT ou de cycle de vie, des extractions en Go, et du nombre de demandes de restauration. Le modèle tarifaire est similaire à celui de S3 Glacier Flexible Retrieval. Référez-vous à la page de tarification Amazon S3 pour obtenir des informations sur la tarification de S3 Glacier Deep Archive.

L’utilisation de S3 Glacier Deep Archive et le coût qui en résulte s’affichent sur une ligne de service indépendante dans votre facture mensuelle AWS. Cet élément tarifaire est donc séparé de l’utilisation et des coûts liés à Amazon S3. En revanche, dans les rapports détaillés sur les dépenses mensuelles générés par l’outil Gestion des coûts AWS, l’utilisation et les coûts de S3 Glacier Deep Archive sont inclus dans l’utilisation et les coûts généraux d’Amazon S3. Ils ne font donc pas l’objet d’une ligne de service séparée.

Les objets qui sont archivés dans S3 Glacier Deep Archive ont une durée de stockage minimale de 180 jours. Les objets supprimés, écrasés ou transférés avant 180 jours seront facturés au prorata pour les frais de stockage des jours restants. S3 Glacier Deep Archive exige également 40 Ko de métadonnées supplémentaires pour chaque objet archivé. Cela comprend 32 Ko de métadonnées facturées au tarif S3 Glacier Deep Archive nécessaire pour identifier et récupérer vos données. Et un supplément de 8 Ko de données facturé au tarif S3 Standard qui est nécessaire pour maintenir le nom et les métadonnées définis par l'utilisateur pour les objets archivés sur S3 Glacier Deep Archive. Vous pouvez ainsi obtenir la liste en temps réel de tous vos objets S3 à l’aide de l’API S3 LIST ou du rapport d’inventaire S3. Consultez la page de tarification Amazon S3 pour obtenir des informations sur la tarification de S3 Glacier Deep Archive.

S3 Glacier Deep Archive s’intègre aux fonctions Amazon S3, dont S3 Object Tagging, les politiques de cycle de vie S3, S3 Object Lock et S3 Replication. Grâce aux fonctions de gestion du stockage S3, vous pouvez utiliser un seul compartiment Amazon S3 pour stocker une combinaison des données S3 Glacier Deep Archive, S3 Standard, S3 Standard – Accès peu fréquent, S3 unizone – Accès peu fréquent et S3 Glacier Flexible Retrieval. Les administrateurs du stockage peuvent ainsi prendre des décisions en fonction de la nature des données et des tendances d'accès à ces dernières. Les clients peuvent utiliser les politiques de cycle de vie d'Amazon S3 pour migrer automatiquement les données vers des classes de stockage plus économiques à mesure que les données prennent de l'âge, ou les politiques de réplication entre régions S3 ou à l'intérieur d'une même région pour répliquer les données dans une autre région ou dans la même région. Le service AWS Storage Gateway intègre désormais la passerelle de bande avec la classe de stockage Amazon S3 Glacier Deep Archive. Vous pouvez donc stocker des bandes virtuelles dans la classe de stockage Amazon S3 au coût le plus bas, réduisant ainsi jusqu'à 75 % le coût mensuel de stockage de vos données à long terme dans le cloud. Avec cette fonctionnalité, la passerelle de bande prend en charge l'archivage de vos nouvelles bandes virtuelles directement dans S3 Glacier Flexible Retrieval et S3 Glacier Deep Archive, ce qui vous permet de répondre à vos exigences en matière de sauvegarde, d'archivage et de restauration. La passerelle de bande vous aide à déplacer des sauvegardes sur bande vers AWS sans apporter de modification à vos flux de travail de sauvegarde existants. La sauvegarde sur bande virtuelle est compatible avec la plupart des applications de sauvegarde comme Veritas, Veeam, Commvault, Dell EMC NetWorker, IBM Spectrum Protect (sur le système d’exploitation Windows) et Microsoft Data Protection Manager.

S3 sur Outposts

Ouvrir tout

Amazon S3 sur Outposts fournit un stockage d’objets dans votre environnement sur site, à l’aide des fonctionnalités et API S3 que vous utilisez aujourd’hui sur AWS. AWS Outposts est un service entièrement géré qui permet d'étendre l'infrastructure, les services, les API et les outils API AWS à pratiquement n'importe quels centres de données, espaces en colocalisation ou installations sur site. Grâce à S3 sur Outposts, vous pouvez traiter et stocker de manière sécurisée les données client générées sur site avant de les déplacer vers une région AWS. Vous pouvez également accéder aux données localement pour les applications qui s'exécutent sur site, ou stocker les données sur votre Outpost pour les entreprises situées dans des zones avec des exigences de résidence de données ou les entreprises appartenant à des secteurs règlementés. Pour en savoir plus sur S3 sur Outposts, consultez la page de présentation.

Gestion du stockage

Ouvrir tout

Les balises d’objet S3 sont des paires clé-valeur appliquées aux objets S3, qui peuvent être créées, chargées ou supprimées à tout moment de la durée de vie de l’objet. Elles vous donnent la possibilité de créer des politiques AWS Identity and Access Management (IAM), de configurer des politiques de gestion du cycle de vie Amazon S3 et de personnaliser les métriques de stockage. Ces identifications au niveau de l’objet peuvent ensuite gérer les transitions entre les classes de stockage et faire expirer des objets en arrière-plan. Vous pouvez ajouter des balises à de nouveaux objets lorsque vous les chargez ou les ajoutez à des objets existants. Jusqu’à dix balises peuvent être ajoutées à chaque objet S3. De plus, vous pouvez utiliser la console de gestion AWS, l’API REST, l’interface de ligne de commande AWS ou les kits SDK AWS pour ajouter des balises d’objet.
Pour en savoir plus, consultez le guide de l’utilisateur de balises d’objet S3.

Les balises d’objet sont un outil qui vous permet de profiter d’une gestion simplifiée de votre stockage S3. Vous avez la possibilité de créer, de mettre à jour et de supprimer les balises à tout moment pendant la durée de vie de l'objet. Ainsi, votre stockage peut s'adapter aux besoins de votre entreprise. Ces balises vous permettent de contrôler l’accès aux objets étiquetés avec des paires clé-valeur spécifiques, et de protéger ainsi les données confidentielles d’un groupe ou d’un utilisateur particulier. Des balises d’objet peuvent également être utilisées pour étiqueter des objets qui appartiennent à un projet ou à une unité opérationnelle spécifique. Ces balises peuvent être associées à des stratégies de cycle de vie S3 pour gérer les transitions vers d’autres classes de stockage (S3 Standard-IA, S3 One Zone-IA, Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval et Amazon S3 Glacier Deep Archive) ou avec la réplication S3 pour répliquer des données de manière sélective entre des Régions AWS.

Les balises d’objet peuvent être modifiées à tout moment pendant la durée de vie de votre objet S3. Pour ce faire, utilisez la Console de gestion AWS, l’API REST, l’interface de ligne de commande AWS ou les kits SDK AWS. Notez que toutes les modifications apportées aux balises en dehors de la console de gestion AWS sont appliquées à l’ensemble complet de balises. Si cinq balises sont associées à un objet particulier et si vous souhaitez en ajouter une sixième, vous devez inclure les cinq balises d’origine dans votre demande.

Le prix des balises d’objet est basé sur la quantité de balises à laquelle s’ajoute le coût de la demande d’ajout de balises. Les demandes associées à l’ajout et à la mise à jour de balises d’objet sont facturées de la même manière que les demandes existantes. Pour en savoir plus, consultez la page de tarification Amazon S3.

Vous pouvez utiliser la console de gestion AWS ou l’API PUT Bucket Analytics S3 pour configurer une stratégie d’analyse de classe de stockage afin qu’elle identifie les stockages auxquels l’accès est rare et qui peuvent être transférés vers une classe de stockage S3 Standard – Accès peu fréquent ou S3 Unizone – Accès peu fréquent, ou archivés dans les classes de stockage S3 Glacier. Vous pouvez accéder à l’onglet Gestion dans la console S3 pour gérer les fonctions d’analyse de classe de stockage, l’inventaire S3, ainsi que les métriques CloudWatch.

Vous devez utiliser Amazon S3 Metadata si vous souhaitez utiliser le langage SQL pour interroger les informations relatives à vos objets S3 afin d’identifier rapidement des jeux de données spécifiques pour votre IA générative, vos analytiques et d’autres cas d’utilisation. S3 Metadata met les métadonnées à jour quasiment en temps réel. Vous pouvez donc utiliser n’importe quel client compatible Iceberg pour exécuter des requêtes SQL afin de rechercher des objets à l’aide des métadonnées des objets. Par exemple, vous pouvez utiliser une requête SQL pour renvoyer une liste d’objets correspondant à certains filtres, tels que les objets ajoutés au cours des 30 derniers jours dans n’importe quel compartiment.

Les métadonnées S3 sont conçues pour générer automatiquement des métadonnées qui fournissent des informations supplémentaires sur les objets qui sont chargés dans un compartiment et pour rendre ces métadonnées consultables dans une table en lecture seule. Ces tables de métadonnées sont stockées dans des tableaux Amazon S3, qui reposent sur Apache Iceberg et fournissent un moyen géré de stocker et d’interroger des données tabulaires dans S3. S3 Metadata crée et maintient des métadonnées au niveau du système telles que la taille de l’objet, des métadonnées personnalisées telles que des balises et des métadonnées définies par l’utilisateur lors du téléchargement de l’objet, ainsi que des métadonnées d’événements telles que l’adresse IP qui a envoyé la demande. À mesure que les données de votre compartiment changent, les métadonnées S3 sont mises à jour quasiment en temps réel pour refléter les dernières modifications. Vous pouvez ensuite interroger vos tables de métadonnées à l’aide de divers services d’analytique AWS et d’outils open source qui sont compatibles avec Iceberg, notamment Amazon Athena, Amazon QuickSight et Apache Spark.

Vous pouvez commencer à utiliser S3 Metadata en quelques clics dans la Console S3. Il vous suffit de sélectionner le compartiment S3 à usage général sur lequel vous souhaitez activer les métadonnées S3. S3 analysera les données de votre compartiment et créera une table Apache Iceberg entièrement gérée contenant les métadonnées de tous vos objets. En quelques minutes, vous pouvez commencer à interroger vos métadonnées à l’aide de n’importe quel moteur de requête ou outil prenant en charge Apache Iceberg.

Vos tables S3 Metadata sont stockées dans un compartiment de tables géré par AWS sur votre compte AWS, appelé aws-s3. Vos tables seront en lecture seule et seul S3 sera autorisé à écrire, mettre à jour ou supprimer des métadonnées.

S3 Metadata stocke les métadonnées dans deux tables gérées de votre compte : les tables de journal et les tables d’inventaire dynamiques.

La table de journal S3 Metadata fournit une vue des modifications apportées dans votre compartiment. Au fur et à mesure que des objets sont ajoutés, mis à jour et supprimés depuis vos compartiments S3 à usage général, les modifications correspondantes sont prises en compte dans les tables de journaux quasiment en temps réel. Les tableaux de journaux sont utiles pour comprendre le comportement de vos applications et pour identifier toute modification apportée à vos jeux de données. Par exemple, vous pouvez écrire des requêtes SQL pour les tables de journal afin de rechercher des objets S3 correspondant à un filtre, tels que des objets ajoutés au cours des 30 derniers jours, des objets ajoutés par des demandeurs actifs ou des objets dont les métadonnées ont été modifiées au cours de la dernière semaine.

Le tableau d’inventaire dynamique des métadonnées S3 contient une liste complète de tous les objets de votre compartiment. Les tableaux d’inventaire en temps réel sont mis à jour toutes les heures et contiennent toutes les informations que S3 connaît sur vos objets. Les tableaux d’inventaire dynamiques sont utiles pour découvrir ou identifier les jeux de données de votre compartiment, en fonction des caractéristiques générées dans les métadonnées des objets. Par exemple, vous pouvez utiliser des tableaux d’inventaire dynamiques pour identifier des jeux de données de formation pour le machine learning, pour les utiliser dans le cadre d’exercices d’optimisation des coûts de stockage ou pour aider à appliquer les contrôles de gouvernance.

Lorsque vous ajoutez de nouveaux objets à votre compartiment, vous verrez apparaître les entrées dans le tableau de journal dans les minutes qui suivent, et vous verrez apparaître les entrées dans le tableau d’inventaire en direct lors de la prochaine actualisation horaire. Lorsque vous activez les métadonnées S3 sur un compartiment existant, S3 lance automatiquement une opération de remplissage afin de générer des métadonnées pour tous vos objets existants. Ce remplissage se termine généralement en quelques minutes, mais peut prendre plusieurs heures si vos jeux de données existants contiennent des millions ou des milliards d’objets S3.

Oui. Vous pouvez créer vos propres tables Iceberg dans des compartiments de tables contenant des métadonnées personnalisées, puis les associer aux tables générées par S3 Metadata à l’aide de simples requêtes SQL.

La fonction S3 Inventory constitue une alternative planifiée à l’API List synchrone d’Amazon S3. Vous pouvez configurer la fonction d’inventaire S3 pour fournir, chaque jour ou chaque semaine, un fichier de sortie au format CSV, ORC ou Parquet à partir de vos objets, et des métadonnées qui sont associées à ceux-ci, pour un compartiment S3 ou un préfixe. Vous pouvez simplifier et accélérer les flux de travail d’entreprise et les tâches de Big Data à l’aide de la fonction S3 Inventory. Vous pouvez utiliser la fonction S3 Inventory pour vérifier le chiffrement et l’état de la réplication de vos objets, afin de répondre aux besoins commerciaux, de conformité et de réglementation. Pour en savoir plus, consultez le guide de l’utilisateur d’Amazon S3 Inventory.

Vous pouvez utiliser la console de gestion AWS ou l’API PUT Bucket Inventory Configuration pour configurer un rapport d’inventaire quotidien ou hebdomadaire pour tous les objets de votre compartiment S3 ou un sous-ensemble des objets sous un préfixe partagé. Dans le cadre de la configuration, vous pouvez préciser un compartiment S3 de destination pour votre rapport d'inventaire S3, le format du fichier de sortie (CSV, ORC ou Parquet) et les métadonnées objet spécifiques nécessaires à votre application d'entreprise (par ex. : nom d'objet, taille, date de la dernière modification, classe de stockage, ID de version, marqueur de suppression, balise d'ancienne version, indicateur de chargement partitionné, état de la réplication ou état du chiffrement). Vous pouvez utiliser la fonction S3 Inventory comme saisie directe dans vos flux de travail d'application ou vos tâches Big Data. Vous pouvez également interroger la fonction S3 Inventory en utilisant le langage SQL standard avec Amazon Athena, Amazon Redshift Spectrum et d'autres outils comme Presto, Hive et Spark. Pour en savoir plus, consultez le guide de l’utilisateur de l’inventaire Amazon S3.

Référez-vous à la page de tarification Amazon S3 pour connaître la tarification de la fonction Inventory S3. Une fois que vous avez configuré le chiffrement à l’aide de SSE-KMS, vous encourez des frais KMS pour le chiffrement. Pour en savoir plus, référez-vous à la page de tarification de KMS.