Tutte le domande frequenti su S3

Domande frequenti su S3 - Informazioni generali

Apri tutto

Amazon S3 è uno spazio di archiviazione di oggetti per archiviare e recuperare qualsiasi volume di dati da qualsiasi origine. S3 un servizio di archiviazione semplice che offre durabilità, disponibilità, prestazioni, sicurezza e scalabilità virtualmente illimitata leader nel settore a costi molto bassi.

Amazon S3 offre un'interfaccia Web service semplice che consente di archiviare e recuperare qualsiasi volume di dati, in qualsiasi momento e da qualsiasi posizione. Grazie a questo servizio, è possibile realizzare, con la massima semplicità, applicazioni che si appoggiano allo storage nativo per il cloud. Poiché Amazon S3 è altamente scalabile e le sue tariffe sono calcolate sulle risorse effettivamente impiegate, è possibile iniziare con una soluzione di base per poi espandere l'applicazione secondo le specifiche esigenze, senza dover scendere a compromessi su prestazioni o affidabilità. Amazon S3 è stato inoltre progettato per essere altamente flessibile. È possibile archiviare qualsiasi tipo e volume di dati, accedere agli stessi dati milioni di volte o soltanto in caso di ripristino di emergenza, costruire una semplice applicazione FTP oppure una sofisticata applicazione Web come il sito di vendita al dettaglio di Amazon.com. Amazon S3 consente di concentrarsi sull'innovazione anziché di occuparsi dell'archiviazione dei dati.

Per registrarsi per Amazon S3, visita la console S3. Per accedere a questo servizio devi avere un account Amazon Web Services. Se non possiedi un account, all'inizio della procedura di registrazione ad Amazon S3 ti verrà chiesto di crearne uno. Dopo aver effettuato la registrazione, per iniziare a utilizzare Amazon S3 fai riferimento alla documentazione di Amazon S3, visualizza i materiali introduttivi di S3 e visualizza le risorse aggiuntive nel centro risorse.

Amazon S3 consente di usufruire delle risorse su larga scala di Amazon senza investimenti anticipati o compromessi sulle prestazioni. Utilizzando Amazon S3, garantire che i dati siano rapidamente accessibili, sempre disponibili e sicuri è economico e semplice.

Si può archiviare praticamente qualsiasi tipo di dati in qualunque formato. Per i dettagli, consulta il l'accordo di licenza di Amazon Web Services.

Il volume totale di dati e il numero di oggetti che si possono archiviare in Amazon S3 sono illimitati. I singoli oggetti di Amazon S3 possono variare nelle dimensioni da un minimo di 0 byte a un massimo di 5 terabyte. La dimensione massima che può essere caricata in un unico PUT è 5 gigabyte per oggetto. Per gli oggetti di dimensioni superiori ai 100 MB, è consigliabile utilizzare la funzionalità di caricamento in più parti.

Un bucket per uso generico è un container per oggetti archiviati su Amazon S3 in cui è possibile memorizzare un numero qualsiasi di oggetti. I bucket per uso generico sono il tipo di bucket S3 originale e possono contenere oggetti archiviati in tutte le classi di archiviazione a eccezione di S3 Express One Zone. Sono consigliati per la maggior parte dei casi d'uso e dei modelli di accesso.

Un bucket di directory è un container per oggetti archiviati su Amazon S3 in cui è possibile memorizzare un numero qualsiasi di oggetti. I bucket di directory S3 ammettono solo gli oggetti archiviati nella classe di archiviazione S3 Express One Zone, che fornisce un'elaborazione più rapida dei dati all'interno di una singola zona di disponibilità. Sono consigliati per casi d'uso a bassa latenza. Ogni bucket di directory S3 può supportare fino a 2 milioni di transazioni al secondo (TPS), indipendentemente dal numero di directory al suo interno.

Un bucket di tabelle è progettato appositamente per l'archiviazione di tabelle nel formato Apache Iceberg. Usa Tabelle Amazon S3 per creare bucket di tabelle e impostare autorizzazioni a livello di tabella in pochi passaggi. I bucket di tabelle Amazon S3 sono ottimizzati specificamente per i carichi di lavoro di analisi e machine learning. Con il supporto integrato per Apache Iceberg, è possibile interrogare i dati tabulari in S3 con i motori di query più diffusi come Amazon Athena, Amazon Redshift e Apache Spark. Usa i bucket di tabelle S3 per archiviare dati tabulari come transazioni di acquisto giornaliere, dati dei sensori di streaming o impressioni degli annunci sotto forma di tabella in Amazon S3 e poi interagire con tali dati utilizzando capacità di analisi.

Un bucket vettoriale è stato creato appositamente per archiviare e interrogare i vettori. All'interno di un bucket vettoriale, non si utilizzano le API degli oggetti S3, ma piuttosto le API vettoriali dedicate per scrivere dati vettoriali e interrogarli in base al significato semantico e alla somiglianza. Puoi controllare l'accesso ai tuoi dati vettoriali con i meccanismi di controllo degli accessi esistenti in Amazon S3, inclusi bucket e policy IAM. Tutte le scritture su un bucket vettoriale sono fortemente coerenti, il che significa che puoi accedere immediatamente ai vettori aggiunti più di recente. Man mano che scrivi, aggiorni ed elimini i vettori nel tempo, i bucket vettoriali S3 ottimizzano automaticamente i dati vettoriali in essi archiviati per ottenere il rapporto prezzo-prestazioni ottimale, anche se i set di dati si ridimensionano ed evolvono.

Un bucket è un container per oggetti e tabelle archiviati su Amazon S3 in cui è possibile memorizzare un numero qualsiasi di oggetti. I bucket per uso generico sono il tipo di bucket S3 originale e possono contenere oggetti archiviati in tutte le classi di archiviazione a eccezione di S3 Express One Zone. Sono consigliati per la maggior parte dei casi d'uso e dei modelli di accesso. I bucket di directory S3 ammettono solo gli oggetti archiviati nella classe di archiviazione S3 Express One Zone, che fornisce un'elaborazione più rapida dei dati all'interno di una singola zona di disponibilità. Sono consigliati per casi d'uso a bassa latenza. Ogni bucket di directory S3 può supportare fino a 2 milioni di transazioni al secondo (TPS), indipendentemente dal numero di directory al suo interno. I bucket di tabelle S3 sono progettati appositamente per l'archiviazione in S3 di dati tabulari, come transazioni di acquisto giornaliere, dati dei sensori di streaming o impressioni degli annunci. Quando si utilizza un bucket di tabelle, i dati vengono archiviati sotto forma di tabella Iceberg in S3 ed è poi possibile interagirvi utilizzando capacità di analisi come transazioni a livello di riga, snapshot di tabella interrogabili e molte altre, tutte gestite da S3. Inoltre, i bucket di tabelle eseguono una manutenzione continua delle tabelle, in modo da ottimizzare automaticamente l'efficienza delle query nel tempo, anche se il data lake si scala e si evolve. I bucket vettoriali S3 sono progettati appositamente per l'archiviazione e l'interrogazione dei vettori. All'interno di un bucket vettoriale, si utilizzano API vettoriali dedicate per scrivere dati vettoriali e interrogarli in base al significato semantico e alla somiglianza. Puoi controllare l'accesso ai tuoi dati vettoriali utilizzando i meccanismi di controllo degli accessi esistenti in Amazon S3, inclusi bucket e policy IAM. Man mano che scrivi, aggiorni ed elimini i vettori nel tempo, i bucket vettoriali S3 ottimizzano automaticamente i dati vettoriali in essi archiviati per ottenere il rapporto prezzo-prestazioni ottimale, anche se i set di dati si ridimensionano ed evolvono.

Amazon archivia i dati e tiene traccia del loro uso a scopi di fatturazione. Amazon non accede ai dati per alcuno scopo estraneo al servizio Amazon S3, salvo nel caso in cui ciò le sia imposto dalla legge. Per i dettagli, consulta l’Accordo sul livello di servizio (SLA) di Amazon Web Services.

Sì. Le organizzazioni di Amazon utilizzano Amazon S3 per una vasta gamma di progetti. Per molti di questi progetti Amazon S3 è l'archivio dati principale di riferimento su cui ci si basa per le operazioni di importanza critica.

Amazon S3 è un semplice spazio di archiviazione di oggetti basato su chiavi. Quando si archiviano dei dati, si assegna loro una chiave oggetto unica che serve per recuperarli in seguito. Le chiavi possono essere costituite da qualsiasi stringa e possono essere formulate in modo da riprodurre attributi gerarchici. In alternativa, è possibile utilizzare l'applicazione di tag agli oggetti S3 per organizzare i dati in tutti i bucket S3 e/o i prefissi.

Amazon S3 utilizza una semplice interfaccia di servizio Web REST basata su standard, progettata per operare con qualsiasi kit di strumenti per lo sviluppo Web. Il funzionamento è stato semplificato per facilitare l'aggiunta di nuovi protocolli di distribuzione e livelli funzionali.

Con Amazon S3, è possibile accedere alla stessa infrastruttura di archiviazione di dati altamente scalabile, disponibile, veloce ed economica che Amazon impiega per gestire la sua rete globale di sito Web. La classe di archiviazione S3 Standard è progettata per offrire una disponibilità del 99,99%, le classi S3 Standard-IA, S3 Intelligent-Tiering e S3 Glacier Instant Retrieval del 99,9% e la classe S3 One Zone-IA del 99,5%, mentre le classi S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive sono progettate per offrire una disponibilità del 99,99% e uno SLA del 99,9%. Tutte le classi di archiviazione sono soggette all'Accordo sul livello di servizio (SLA) di Amazon S3.

Amazon S3 è stato progettato sin dall'inizio per gestire il traffico di qualsiasi applicazione Internet. Il pagamento in base al consumo e le capacità illimitata assicurano la regolarità dei costi incrementali e la disponibilità del servizio. Le ingenti risorse di Amazon S3 consentono di distribuire il carico uniformemente, in modo che nessuna applicazione subisca conseguenze negative in caso di picchi di traffico.

Sì. L’Accordo sul livello di servizio (SLA) di Amazon S3 offre un credito sui servizi qualora la percentuale di disponibilità mensile del sistema durante qualsiasi ciclo di fatturazione sia inferiore a quella dichiarata da Amazon.

Amazon S3 offre automaticamente una consistenza forte per la lettura e la scrittura, senza modifiche alle prestazioni o alla disponibilità, senza sacrificare l'isolamento regionale per le applicazioni e senza costi aggiuntivi. Dopo la scrittura di un nuovo oggetto o la sovrascrittura di un oggetto esistente, ogni richiesta di lettura successiva riceve immediatamente l'ultima versione dell'oggetto. S3 fornisce anche una consistenza forte per le operazioni di elenchi, così dopo la scrittura è possibile eseguire immediatamente un elenco degli oggetti in un bucket con le eventuali modifiche applicate.

Una forte coerenza read-after-write (ovvero, lettura dopo scrittura) è utile quando si ha bisogno di leggere immediatamente un oggetto dopo una scrittura, ad esempio, quando spesso si leggono e si creano elenchi subito dopo aver scritto gli oggetti. È un vantaggio anche per i carichi di lavoro di calcolo ad alte prestazioni: quando un oggetto viene sovrascritto e poi letto più volte contemporaneamente, la forte coerenza per la lettura e la scrittura assicura che l'ultima scrittura venga letta in tutte le letture. La forte coerenza per la lettura e la scrittura costituisce automaticamente un vantaggio immediato per queste applicazioni. Inoltre, la forte coerenza di S3 riduce i costi perché non sono più necessarie infrastrutture aggiuntive.

Regioni AWS

Apri tutto

Al momento della creazione di un bucket Amazon S3 per uso generico è possibile specificare una regione AWS. Per le classi di archiviazione S3 Standard, AI S3 Standard, Piano intelligente S3, Recupero istantaneo S3 Glacier, Recupero flessibile S3 Glacier e S3 Glacier Deep Archive, gli oggetti vengono archiviati automaticamente su più dispositivi in un minimo di tre zone di disponibilità (AZ). Le zone di disponibilità sono fisicamente separate tra loro da una distanza significativa, di molti chilometri, pur restando nel raggio di 100 km (60 miglia) l'una dall'altra. Gli oggetti archiviati nella classe di archiviazione AI a zona unica S3 vengono archiviati in modo ridondante all'interno di una singola zona di disponibilità nella regione AWS scelta. Al momento della creazione di un bucket di directory è possibile specificare una singola zona di disponibilità o zona locale AWS dedicata. Gli oggetti nei bucket di directory sono archiviati in modo ridondante in una singola zona di disponibilità o zona locale. Quando utilizzi le classi di archiviazione S3 per le zone locali dedicate, gli oggetti rimangono nella zona scelta a meno che tu non li trasferisca in una regione AWS. Per S3 su Outposts, i dati vengono memorizzati nel tuo ambiente Outpost on-premises, a meno che tu non decida di trasferirli manualmente in una regione AWS. Per maggiori dettagli sulla disponibilità dei servizi di Amazon S3 per regione AWS, consulta l'elenco dei servizi AWS disponibili per regione.

Le classi di archiviazione S3 per le zone locali AWS dedicate sono indicate per dati sensibili e applicazioni che devono essere eseguite su un'infrastruttura fisicamente separata, riservata per l'utilizzo esclusivo e posizionata all'interno di una giurisdizione normativa per soddisfare i requisiti legislativi in merito di sicurezza e conformità. Ad esempio, alcune normative prevedono che i dati debbano essere archiviati in un paese o stato specifico per motivi legislativi, contrattuali o di sicurezza delle informazioni comuni ai settori pubblico, sanitario, petrolifero, dei gas naturali e altri settori altamente regolamentati. AWS collabora con te per configurare le tue zone private con le funzionalità di sicurezza e governance avanzate necessarie per aiutarti a soddisfare i requisiti normativi.

Una Regione AWS è una posizione fisica in tutto il mondo in cui si trovano i data center dei cluster AWS. Ogni gruppo di data center logici all'interno di una Regione è detto zona di disponibilità (AZ). Ogni regione AWS è costituita da un minimo di tre zone di disponibilità isolate e fisicamente separate all'interno di un'area geografica. A differenza di altri provider di cloud che spesso definiscono una regione come un singolo data center, la struttura composta da varie zone di disponibilità di ogni Regione AWS offre molti vantaggi ai clienti. Ogni zona dispone di capacità di alimentazione, raffreddamento e sicurezza fisica proprie ed è connessa grazie a reti ridondanti e a latenza bassissima.

Una zona di disponibilità (AZ) consiste in uno o più data center provvisti di alimentazione, rete e connettività ridondanti in una regione AWS. Le zone di disponibilità (AZ) consentono ai clienti di eseguire applicazioni e database in ambienti di produzione con elevata disponibilità, tolleranza ai guasti e scalabilità, altrimenti impossibili da ottenere all'interno di un singolo data center. Tutte le zone di disponibilità in una regione AWS sono interconnesse tramite una rete a elevata larghezza di banda e a bassa latenza, su una fibra metropolitana dedicata completamente ridondante che distribuisce reti a alto throughput e bassa latenza tra esse. Le classi di archiviazione Amazon S3 Standard, S3 Standard -Infrequent Access, S3 Intelligent-Tiering, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive replicano i dati in un minimo di tre zone di disponibilità per proteggerli in caso di guasto di un'intera zona. Queste condizioni valgono anche per le regioni in cui sono disponibili pubblicamente meno di tre zone. Gli oggetti memorizzati in queste classi di storage sono accessibili da tutte le zone di disponibilità presenti nella regione AWS.
La classe di archiviazione Amazon S3 One Zone-IA replica i dati in una singola zona di disponibilità. I dati archiviati in S3 One Zone-IA non sono resilienti alla perdita fisica di una zona di disponibilità dovuta a calamità come terremoti, incendi e alluvioni.

Vi sono diversi i fattori da considerare a seconda dell'applicazione specifica. Per esempio, potresti voler archiviare i tuoi dati in una regione vicina ai tuoi clienti, data center o ad altre risorse AWS per ridurre le latenze di accesso ai dati. Potresti anche voler archiviare i dati in una regione distante dalle altre operazioni, per motivi di ridondanza geografica e di ripristino di sicurezza. Dovresti anche considerare le Regioni che ti permettono di affrontare specifici requisiti legali e normativi e/o di ridurre i costi di archiviazione: per risparmiare, puoi scegliere una Regione con un prezzo più basso. Per informazioni sui prezzi di S3, consulta la pagina dei prezzi di Amazon S3.

Amazon S3 è disponibile in tutte le regioni AWS; è inoltre possibile utilizzare il servizio indipendentemente dalla posizione. È solo necessario decidere in quale regione o in quali regioni AWS memorizzare i dati di Amazon S3. Per un elenco delle regioni AWS in cui è disponibile S3, consulta l'elenco dei servizi regionali AWS.

Fatturazione

Apri tutto

I prezzi di Amazon S3 sono calcolati solo in base all'uso effettivo. Non è prevista una tariffa minima. È possibile calcolare la fattura mensile con il Calcolatore dei prezzi AWS. I servizi AWS sono meno caro nelle zone in cui i nostri costi sono inferiori. Alcuni prezzi possono variare in base alle regioni Amazon S3. I costi di fatturazione sono calcolati in base alla sede del bucket S3. Non è previsto alcun costo di trasferimento dei dati per i dati trasferiti all'interno di una regione Amazon S3 attraverso una richiesta COPY. I dati trasferiti tramite una richiesta COPY tra Regioni AWS sono addebitati alle tariffe specificate sulla prezzi dei prezzi di Amazon S3. Non è previsto alcun costo di trasferimento dei dati per i dati trasferiti tra Amazon EC2 (o qualsiasi servizio AWS) e Amazon S3 all'interno della stessa regione, ad esempio all'interno della regione Stati Uniti orientali (Virginia settentrionale). Tuttavia, Il trasferimento di dati tra Amazon EC2 (o qualsiasi servizio AWS) e Amazon S3 tra tutte le altre Regioni, ad esempio tra Amazon EC2 Stati Uniti orientali (Virginia settentrionale) e Amazon S3 Stati Uniti occidentali (California settentrionale), viene invece addebitato alle tariffe specificate nella pagina dei prezzi di Amazon S3. I costi di trasferimento dei dati vengono fatturati al proprietario del bucket di origine. Per i prezzi di S3 su Outposts, visita la pagina dei prezzi di Outposts.

L'utilizzo di Amazon S3 non richiede alcun impegno di lungo termine né costi di configurazione. Alla fine del mese, verrà automaticamente addebitato il costo delle risorse utilizzate nel corso del mese. È possibile visualizzare in qualunque momento gli addebiti per il periodo di fatturazione in corso accedendo al tuo account Amazon Web Services e selezionando il pannello di controllo della fatturazione associato al profilo della console. Con il Piano di utilizzo gratuito di AWS* puoi cominciare a usare Amazon S3 gratuitamente in tutte le Regioni ad eccezione di quelle AWS GovCloud. Dopo la registrazione, i nuovi clienti AWS riceveranno 5 GB di archiviazione Amazon S3 Standard, 20.000 richieste GET, 2.000 richieste PUT e 100 GB di trasferimento dati in uscita (verso Internet, altre regioni AWS o Amazon CloudFront) al mese per un anno. Le risorse mensili non usate non saranno trasferite al mese successivo. Amazon S3 prevede l'addebito per i tipi d'uso riportati di seguito. Nota: i calcoli riportati sotto valgono nel caso il piano gratuito AWS non sia attivo.

I servizi AWS sono meno caro nelle zone in cui i nostri costi sono inferiori. Ad esempio, i nostri costi sono inferiori nella Regione Stati Uniti orientali (Virginia settentrionale) che nella Regione Stati Uniti occidentali (California settentrionale).

Per ogni versione di un oggetto salvata o richiesta vengono addebitati i normali costi di Amazon S3. Ad esempio, esaminiamo il seguente scenario per illustrare i costi di archiviazione quando si utilizza il versionamento (supponiamo che il mese corrente duri 31 giorni): 1) Giorno 1 del mese: si esegue un PUT di 4 GB (4.294.967.296 byte) sul bucket.
2) Giorno 16 del mese: viene eseguita una richiesta PUT di 5 GB (5.368.709.120 byte) sullo stesso bucket tramite la stessa chiave usata il primo giorno del mese.

Durante l'analisi dei costi di storage per le operazioni descritte, è necessario tenere conto che l'oggetto da 4 GB caricato il primo giorno del mese non viene eliminato dal bucket quando l'oggetto da 5 GB viene aggiunto a metà mese. L'oggetto da 4 GB viene anzi conservato come versione precedente, mentre l'oggetto da 5 GB diventa la versione scritta più recente dello stesso oggetto nel bucket. Alla fine del mese: utilizzo totale in byte/ora
= [4.294.967.296 byte x 31 giorni x (24 ore al giorno)] + [5.368.709.120 byte x 16 giorni x (24 ore al giorno)] = 5.257.039.970.304 ore-byte. GB al mese totali
5.257.039.970.304 byte/ora x (1 GB/1.073.741.824 byte) x (1 mese/744 ore) = 6,581 GB al mese Il costo viene calcolato in base alle tariffe correnti per la tua regione nella pagina dei prezzi di Amazon S3.

Quando si accede al servizio attraverso la Console di gestione AWS si applicano le normali tariffe di Amazon S3. Per migliorare la fruibilità, la Console di gestione AWS potrebbe eseguire richieste in modo proattivo. Inoltre, alcune operazioni interattive richiedono l'esecuzione di più richieste al servizio.

L'accesso allo spazio di archiviazione da un altro account AWS viene fatturato secondo le tariffe standard di Amazon S3. È possibile scegliere di configurare un bucket con pagamento a carico del richiedente, nel qual caso sarà l'account che esegue l'accesso a farsi carico dei costi delle richieste e dei download dei dati in Amazon S3. Per ulteriori informazioni sulla configurazione dei bucket con pagamento a carico del richiedente, consulta la documentazione di Amazon S3.

Salvo diversamente specificato, i prezzi sono al netto di eventuali tasse e imposte doganali, inclusa l'IVA ed eventuali imposte sulle vendite. Per i clienti con indirizzo di fatturazione in Giappone, l'utilizzo dei servizi AWS è soggetto all'imposta sul consumo giapponese. Ulteriori informazioni sulle imposte per i servizi AWS »

AWS offre ai clienti idonei il trasferimento gratuito dei dati su Internet quando spostano tutti i loro dati da AWS, secondo la procedura riportata di seguito.

Completa le seguenti operazioni: 1) Se disponi di un team dedicato all'account AWS, per prima cosa contattalo e informalo dei tuoi piani. In alcuni casi, se hai un impegno negoziato con AWS, ti consigliamo di discutere le opzioni con il tuo team per l’account AWS. 2) Rivedi i criteri e il processo descritti in questa pagina. 3) Contatta l'assistenza clienti AWS e indica che la tua richiesta riguarda il "trasferimento gratuito dei dati per lo spostamento da AWS". L'assistenza clienti AWS ti chiederà di fornire informazioni, in modo da poter esaminare i tuoi piani di spostamento, valutare l’idoneità al trasferimento gratuito dei dati e calcolare un importo di credito adeguato. 4) Se l'assistenza clienti AWS approva lo spostamento, riceverai un credito temporaneo per il costo del trasferimento dei dati in uscita in base al volume di tutti i dati archiviati nei servizi AWS al momento del calcolo di AWS. L'assistenza clienti AWS notificherà l’eventuale approvazione e da quel momento avrai 60 giorni per completare il trasferimento da AWS. Il credito verrà conteggiato solo per il trasferimento dei dati all'esterno e non verrà applicato ad altri usi del servizio. Dopo aver abbandonato i servizi AWS, entro il periodo di 60 giorni devi eliminare tutti i dati e i carichi di lavoro rimanenti dal tuo account AWS, oppure chiudere il tuo account AWS. I trasferimenti di dati gratuiti per i fornitori IT in trasferta sono inoltre soggetti ai seguenti criteri: a) Solo i clienti con un account AWS attivo in regola hanno diritto al trasferimento gratuito dei dati in esterno. b) Se hai meno di 100 GB di dati archiviati nel tuo account AWS, puoi spostare questi dati da AWS gratuitamente nell'attuale piano gratuito mensile di AWS da 100 GB per il trasferimento di dati in uscita. I clienti con meno di 100 GB di dati archiviati nel proprio account AWS non hanno diritto a crediti aggiuntivi. c) AWS ti fornirà il trasferimento gratuito dei dati su Internet quando sposti tutti i tuoi dati da AWS. Se desideri spostare solo l'utilizzo totale di un singolo servizio, ma non tutto, contatta l'assistenza clienti AWS. d) Se i tuoi piani cambiano o non riesci a completare il trasferimento da AWS entro 60 giorni, devi notificare l'assistenza clienti AWS. e) I costi dei servizi standard per l'utilizzo dei servizi AWS non sono inclusi. Solo le spese di trasferimento dei dati a sostegno del trasferimento da AWS sono idonee per i crediti. Tuttavia, il trasferimento di dati da servizi di trasferimento dati specializzati, come Amazon CloudFront, AWS Direct Connect, AWS Snowball e AWS Global Accelerator, non è incluso. f) AWS può esaminare l'utilizzo del servizio per verificare la conformità a questi requisiti. Se stabiliamo che l'utilizzo del trasferimento dei dati in uscita è stato utilizzato per uno scopo diverso dal trasferimento da AWS, potremmo addebitarti il trasferimento dei dati che erano stati accreditati. g) AWS può apportare modifiche rispetto ai trasferimenti gratuiti di dati verso Internet in qualsiasi momento.

I clienti AWS effettuano centinaia di milioni di trasferimenti di dati ogni giorno e, generalmente, non conosciamo il motivo di un determinato trasferimento dati. Ad esempio, i clienti potrebbero trasferire dati a un utente finale della loro applicazione, a un visitatore del loro sito Web o a un altro ambiente cloud o on-premises per scopi di backup. Di conseguenza, l'unico modo per sapere che il trasferimento dei dati ha l'obiettivo di supportare il tuo spostamento da AWS è comunicarcelo in anticipo.

Tabelle S3

Apri tutto

Amazon S3 Tables offre un'archiviazione S3 appositamente ottimizzata per i carichi di lavoro di analisi, che migliora le prestazioni delle query riducendo al contempo i costi. È possibile accedere alle funzionalità di analisi avanzate di Iceberg e interrogare i dati utilizzando servizi AWS familiari come Amazon Athena, Redshift ed EMR tramite l'integrazione di Tabelle S3 con Amazon SageMaker Lakehouse. Inoltre, è possibile utilizzare applicazioni di terze parti compatibili con Iceberg REST come Apache Spark, Apache Flink, Trino, DuckDB e PyIceberg per leggere e scrivere dati nelle Tabelle S3. È possibile utilizzare i bucket di tabelle per archiviare dati tabulari, come transazioni di acquisto giornaliere, dati dei sensori di streaming o impressioni degli annunci, sotto forma di tabella Iceberg in Amazon S3 e poi interagire con questi dati utilizzando funzionalità di analisi, come transazioni a livello di riga, snapshot di tabelle interrogabili e molte altre, il tutto gestito da Amazon S3. Inoltre, i bucket di tabelle eseguono una manutenzione continua delle tabelle, in modo da ottimizzare automaticamente l'efficienza delle query nel tempo, anche se il data lake si scala e si evolve.

S3 Tables è indicato perché è un modo semplice, performante e conveniente per archiviare dati tabulari in Amazon S3. Tabelle S3 dà la possibilità di organizzare i dati strutturati in tabelle e poi interrogarli utilizzando istruzioni SQL, virtualmente senza configurazione. Inoltre, S3 Tables offre le stesse caratteristiche di durabilità, disponibilità, scalabilità e prestazioni di S3 stesso e ottimizza automaticamente l'archiviazione per massimizzare le prestazioni delle query e minimizzare i costi.

S3 Tables fornisce uno spazio S3 dedicato per l'archiviazione di dati strutturati nel formato Apache Parquet, Avro e ORC. All'interno di un bucket di tabelle, è possibile creare tabelle come risorse di prima classe direttamente in S3. Queste tabelle possono essere protette con autorizzazioni a livello di tabella definite in policy basate sull'identità o sulle risorse, e sono accessibili da applicazioni o strumenti che supportano lo standard Apache Iceberg. Quando si crea una tabella nel bucket di tabelle, i dati sottostanti in S3 vengono archiviati come file Parquet, Avro o ORC. Quindi, S3 utilizza lo standard Apache Iceberg per archiviare i metadati necessari affinché le applicazioni possano interrogare i dati. S3 Tables include una libreria client utilizzata dai motori di query per navigare e aggiornare i metadati Iceberg delle tabelle del bucket di tabelle. Questa libreria, insieme alle API S3 aggiornate per le operazioni sulle tabelle, consente a più client di leggere e scrivere dati nelle tabelle in modo sicuro. Nel tempo, S3 ottimizza automaticamente i dati Parquet, Avro o ORC sottostanti riscrivendo o “compattando” gli oggetti. La compattazione ottimizza i dati su S3 per migliorare le prestazioni delle query.

È possibile iniziare a usare S3 Tables in soli tre passaggi e senza dover creare alcuna infrastruttura all'esterno di S3. Innanzitutto, crea un bucket da tavolo nella console S3. Come parte della creazione del primo bucket di tabelle tramite la console, l'integrazione con i servizi AWS Analytics avviene automaticamente, il che consente a S3 di popolare automaticamente tutti i bucket e le tabelle del tuo account e della tua regione nel catalogo dati AWS Glue. Dopodiché, S3 Tables sarà quindi accessibile ai motori di query AWS come Amazon Athena, EMR e Redshift. Successivamente, puoi fare clic per creare una tabella utilizzando Amazon Athena dalla console S3. Una volta in Athena, puoi iniziare rapidamente a popolare nuove tabelle e a interrogarle.

In alternativa, puoi accedere a S3 Tables utilizzando l'endpoint di catalogo REST di Iceberg tramite il Catalogo dati AWS Glue, che ti consente di scoprire l'intero patrimonio di dati, comprese tutte le risorse delle tabelle. Puoi anche connetterti direttamente a un singolo endpoint del bucket di tabelle per scoprire tutte le risorse di S3 Tables all'interno di quel bucket. Ciò consente di utilizzare S3 Tables con qualsiasi applicazione o motore di query che supporti la specifica del catalogo REST di Apache Iceberg.

È possibile creare una tabella nel bucket di tabelle utilizzando l'API CreateTable in S3. In alternativa, è anche possibile utilizzare un motore di query. Per eliminare una tabella da un bucket di tabelle, è possibile utilizzare l'API DeleteTable in S3. In alternativa, è anche possibile utilizzare un motore di query. Dopo questa operazione, la tabella non sarà più accessibile dal motore di query.

S3 Tables supporta lo standard Apache Iceberg ed è possibile utilizzare motori di query come Amazon Athena, Amazon Redshift e Apache Spark per interrogare le tabelle Iceberg nei bucket di tabelle con lo standard SQL.

Le prestazioni delle query sono fino a 3 volte più veloci e le transazioni al secondo (TPS) sono fino a 10 volte superiori rispetto all'archiviazione delle tabelle Iceberg in bucket Amazon S3 per uso generico. Queste prestazioni sono dovute al fatto che i bucket di tabelle compattano automaticamente i dati Parquet, Avro oppure ORC sottostanti delle tabelle per ottimizzare le prestazioni delle query. Inoltre, l'archiviazione progettata appositamente supporta TPS fino a 10 volte superiori per impostazione predefinita.

No. Per evitare di compromettere accidentalmente l'integrità delle tabelle o interrompere le applicazioni a valle, i bucket di tabelle non consentono di sovrascrivere o eliminare manualmente gli oggetti. I bucket di tabelle supportano solamente il sottoinsieme di API S3 necessarie per accedere e aggiornare le tabelle Iceberg. Per eliminare i dati, è invece possibile configurare la rimozione dei file senza riferimenti e la scadenza degli snapshot nelle tabelle.

I bucket di tabelle offrono la possibilità di applicare policy di risorse all'intero bucket o a singole tabelle. Le policy di bucket di tabelle possono essere applicate utilizzando le API PutTablePolicy e PutTableBucketPolicy. Le policy a livello di tabella consentono di gestire le autorizzazioni al bucket di tabelle in base alla logica delle tabelle a cui è associato, senza la necessità di conoscere la posizione fisica dei singoli file Parquet, Avro o ORC. Inoltre, Blocco dell'accesso pubblico S3 è sempre applicato ai bucket di tabelle.

Sì. I bucket di tabelle sono basati sulla funzionalità snapshot di Iceberg per mantenere le tabelle coerenti quando ci sono più scritture simultanee.

I bucket di tabelle supportano il formato di tabelle Apache Iceberg con dati Parquet.

I bucket di tabelle offrono tre operazioni di manutenzione: compattazione, gestione di snapshot e rimozione dei file senza riferimenti. La compattazione combina periodicamente gli oggetti più piccoli in un numero inferiore di oggetti più grandi per migliorare le prestazioni delle query. La gestione degli snapshot fa scadere e rimuove gli snapshot delle tabelle in base alla configurazione di conservazione degli snapshot. La rimozione dei file senza riferimenti elimina i file a cui non fa riferimento alcuno snapshot in base alla policy di rimozione dei file senza riferimenti, ottimizzando così i costi di archiviazione.

Sì, Tabelle S3 supporta AWS CloudTrail. È possibile configurare eventi di dati e di gestione di CloudTrail per i bucket di tabelle, proprio come si farebbe per un bucket S3 per uso generico. I log CloudTrail per i bucket di tabelle includono informazioni sia sulle tabelle che sugli oggetti dati.

Sì, i dati nei bucket di tabelle sono crittografati per impostazione predefinita tramite la crittografia lato server, garantendo la protezione di base per i dati a riposo. Per una maggiore sicurezza, hai la possibilità di crittografare i tuoi dati nelle tabelle S3 utilizzando le tue chiavi di crittografia. Queste chiavi vengono create e gestite all'interno del tuo account AWS tramite il Servizio AWS di gestione delle chiavi (AWS KMS). KMS prevede autorizzazioni separate per utilizzare la chiave KMS, il che fornisce un ulteriore livello di controllo e protezione contro l'accesso non autorizzato alle tabelle archiviate nei bucket di tabelle. Inoltre, KMS genera un audit trail dettagliato, che consente di tenere traccia di chi ha effettuato l'accesso a quale tabella e quando, utilizzando la chiave. KMS offre anche controlli di sicurezza aggiuntivi per supportare gli sforzi di conformità ai requisiti di settore come PCI-DSS, HIPAA/HITECH e FedRAMP. Questo approccio completo alla crittografia e alla gestione delle chiavi offre la sicurezza e la flessibilità necessarie per proteggere efficacemente i dati sensibili.

Con le tabelle S3, paghi lo spazio di archiviazione, le richieste e una tariffa di monitoraggio degli oggetti per ciascun oggetto archiviato nei bucket tabulari. Inoltre, sono previsti costi aggiuntivi per la manutenzione delle tabelle. Per maggiori dettagli sui prezzi, consulta la pagina dei prezzi di S3.

La compattazione combina gli oggetti più piccoli in un numero inferiore di oggetti più grandi per migliorare le prestazioni delle query Iceberg. Amazon S3 compatta le tabelle in base alle dimensioni del file di destinazione ottimali per il modello di accesso ai dati o a un valore specificato. I file compattati vengono scritti come snapshot più recente della tabella. La compattazione è supportata per impostazione predefinita per tutte le tabelle S3, con una dimensione predefinita dei file di 512 MB. È possibile modificare la dimensione dei file di destinazione da 64 MB a 512 MB utilizzando l'API PutTableMaintenanceConfiguration.

La gestione degli snapshot fa scadere e rimuove gli snapshot delle tabelle secondo la configurazione di conservazione degli snapshot. La gestione degli snapshot determina il numero di snapshot attivi per le tabelle in base a MinimumSnapshots (snapshot minimi, 1 per impostazione predefinita) e MaximumSnapshotAge (età massima degli snapshot, 120 ore per impostazione predefinita). Quando uno snapshot scade, Amazon S3 crea contrassegni di eliminazione per rendere non correnti i file di dati e metadati nei quali sono presenti riferimenti di tale snapshot. I file non correnti vengono eliminati dopo il numero di giorni specificato dalla proprietà NoncurrentDays nella policy di rimozione dei file senza riferimenti. È possibile modificare i valori predefiniti per lo snapshot utilizzando l'API PutTableMaintenanceConfiguration. La gestione degli snapshot non supporta i valori di conservazione configurati nel file di metadati Iceberg .json, inclusa la conservazione basata su branch o tag. La gestione degli snapshot per S3 Tables è disabilitata quando si configura una policy di conservazione basata su branch o tag oppure una policy di conservazione per il file metadati .json più lunga dei valori configurati tramite l'API PutTableMaintenanceConfiguration.

La rimozione dei file senza riferimenti identifica ed elimina tutti gli oggetti a cui non fa riferimento alcuno snapshot della tabella. Nell'ambito della policy di rimozione dei file senza riferimenti, è possibile configurare due proprietà: ExpireDays (giorni di scadenza, 3 giorni per impostazione predefinita) e NoncurrentDays (giorni prima di diventare non correnti, 10 giorni per impostazione predefinita). Per qualsiasi oggetto senza riferimenti nella tabella e più vecchio della proprietà ExpireDays, S3 elimina definitivamente gli oggetti dopo il numero di giorni specificato dalla proprietà NoncurrentDays. È possibile configurare la rimozione di file senza riferimenti a livello di bucket di tabelle. È possibile modificare i valori predefiniti per la conservazione degli snapshot utilizzando l'API PutTableBucketMaintenanceConfiguration.

S3 Vectors

Apri tutto

Puoi iniziare a usare S3 Vectors in quattro semplici passaggi, senza dover configurare alcuna infrastruttura al di fuori di Amazon S3. Innanzitutto, crea un bucket vettoriale in una regione AWS specifica tramite l'API CreateVectorBucket o nella console S3. In secondo luogo, per organizzare i dati vettoriali in un bucket vettoriale, crei un indice vettoriale con l'API CreateIndex o nella console S3. Quando si crea un indice vettoriale, si specifica il parametro della distanza (coseno o euclidea) e il numero di dimensioni che un vettore deve avere (fino a 4.092). Per risultati più accurati, seleziona il parametro della distanza consigliata dal tuo modello di embedding. Terzo, aggiungi dati vettoriali a un indice vettoriale con l'API PutVectors. Facoltativamente, puoi collegare metadati come coppie chiave-valore a ciascun vettore per filtrare le query. In quarto luogo, esegui una query di somiglianza utilizzando l'API QueryVectors, specificando il vettore da cercare e il numero dei risultati più simili da restituire.

Puoi creare un indice vettoriale utilizzando la console S3 o l'API CreateIndex. Durante la creazione dell'indice, specifichi il bucket vettoriale, l'indice, il parametro della distanza, le dimensioni e, facoltativamente, un elenco di campi di metadati che desideri escludere dal filtro durante le query di somiglianza. Ad esempio, se desideri archiviare i dati associati ai vettori esclusivamente come riferimento, puoi specificarli come campi di metadati non filtrabili. Al momento della creazione, a ciascun indice viene assegnato un nome della risorsa Amazon (ARN) univoco. Successivamente, quando si effettua una richiesta di scrittura o di interrogazione, la si indirizza a un indice vettoriale all'interno di un bucket vettoriale.

Puoi aggiungere vettori a un indice vettoriale utilizzando l'API PutVectors. Ogni vettore è costituito da una chiave, che identifica in modo univoco ogni vettore in un indice vettoriale (ad esempio è possibile generare un UUID a livello di codice). Per massimizzare il throughput di scrittura, si consiglia di inserire vettori in batch di grandi dimensioni, fino alla dimensione massima della richiesta. Inoltre, puoi collegare metadati (ad esempio anno, autore, genere e località) come coppie di valori chiave a ciascun vettore. Quando si includono i metadati, per impostazione predefinita tutti i campi possono essere utilizzati come filtri in una query di similarità, a meno che non siano specificati come metadati non filtrabili al momento della creazione dell'indice vettoriale. Per generare nuovi embedding vettoriali dei tuoi dati non strutturati, puoi utilizzare l'API InvokeModel di Amazon Bedrock, specificando l'ID del modello di embedding che desideri utilizzare.

Puoi utilizzare l'API GetVectors per cercare e restituire vettori e metadati associati tramite la chiave vettoriale.

È possibile eseguire una query di somiglianza con l'API QueryVectors, specificando il vettore di query, il numero di risultati pertinenti da restituire (i primi k vicini più vicini) e l'ARN dell'indice. Quando si genera il vettore di interrogazione, è necessario utilizzare lo stesso modello di embedding utilizzato per generare i vettori iniziali memorizzati nell'indice vettoriale. Ad esempio, se utilizzi Embedding di testo Amazon Titan v2 in Amazon Bedrock per generare incorporamenti dei tuoi documenti, ti consigliamo di utilizzare lo stesso modello per convertire una domanda in un vettore. Inoltre, puoi utilizzare i filtri dei metadati in una query per cercare i vettori che corrispondono al filtro. Quando si esegue la query di similarità, per impostazione predefinita vengono restituite le chiavi vettoriali. Puoi facoltativamente includere la distanza e i metadati nella risposta.

S3 Vectors offre un'archiviazione vettoriale altamente duratura e disponibile. I dati scritti su S3 Vectors vengono archiviati su S3, progettato per una durabilità dei dati del 99,999999999%. S3 Vectors è progettato per offrire una disponibilità del 99,99% con un Accordo sul livello di servizio per la disponibilità del 99.9%.

S3 Vectors offre tempi di latenza delle query inferiori al secondo. Utilizza il throughput elastico di Amazon S3 per gestire le ricerche su milioni di vettori ed è ideale per carichi di lavoro di query poco frequenti.

Per eseguire query di somiglianza per gli embedding vettoriali, diversi fattori possono influire sul richiamo medio, tra cui il modello di embedding, la dimensione del set di dati vettoriali (numero di vettori e dimensioni) e la distribuzione delle query. S3 Vectors offre un richiamo medio di oltre il 90% per la maggior parte dei set di dati. Il richiamo medio misura la qualità dei risultati delle query: il 90% significa che la risposta contiene il 90% dei vettori di verità fondamentale più vicini, memorizzati nell'indice, al vettore di query. Tuttavia, poiché le prestazioni effettive possono variare a seconda del caso d'uso specifico, consigliamo di condurre test personalizzati con dati e domande rappresentativi per verificare che gli indici vettoriali S3 soddisfino i requisiti di richiamo.

Puoi visualizzare un elenco di vettori in un indice vettoriale con l'API ListVectors, che restituisce fino a 1.000 vettori alla volta con un indicatore se la risposta viene troncata. La risposta include la data dell'ultima modifica, la chiave vettoriale, i dati vettoriali e i metadati. Puoi anche utilizzare l'API ListVectors per esportare facilmente dati vettoriali da un indice vettoriale specificato. L'operazione ListVectors è fortemente coerente. Quindi, dopo una scrittura, puoi immediatamente elencare i vettori con tutte le modifiche riflesse.

Con S3 Vectors, paghi per lo spazio di archiviazione e per qualsiasi richiesta di scrittura e lettura applicabile (ad esempio, inserimento di vettori ed esecuzione di operazioni di interrogazione sui vettori in un indice vettoriale). Per maggiori dettagli sui prezzi, consulta la pagina dei prezzi di S3.

Sì. Durante la creazione di una knowledge base Bedrock tramite la console o l'API Bedrock, puoi configurare un indice vettoriale S3 esistente come archivio vettoriale per risparmiare sui costi di archiviazione vettoriale per i casi d'uso RAG. Se preferisci lasciare che Bedrock crei e gestisca l'indice vettoriale per te, usa il flusso di lavoro Quick Create nella console Bedrock. Inoltre, puoi configurare un nuovo indice vettoriale S3 come archivio vettoriale per i flussi di lavoro RAG in Amazon SageMaker Unified Studio.

Sì. Esistono due modi per utilizzare S3 Vectors con il Servizio OpenSearch di Amazon. Innanzitutto, i clienti S3 possono esportare tutti i vettori da un indice vettoriale S3 a OpenSearch serverless come nuova raccolta serverless utilizzando la console S3 o OpenSearch. Se costruisci nativamente su S3 Vectors, trarrai vantaggio dalla possibilità di utilizzare OpenSearch serverless in modo selettivo per carichi di lavoro con esigenze di interrogazione in tempo reale. In secondo luogo, se sei un cliente OpenSearch gestito, ora puoi scegliere S3 Vectors come motore per i dati vettoriali che possono essere interrogati con una latenza inferiore al secondo. OpenSearch utilizzerà quindi automaticamente S3 Vectors come motore sottostante per i vettori e potrai aggiornare e cercare i tuoi dati vettoriali utilizzando le API OpenSearch. Ottieni i vantaggi in termini di costi di S3 Vectors, senza modifiche alle tue applicazioni.

Amazon S3 e IPv6

Apri tutto

Tutti i server e i dispositivi connessi a Internet devono avere un indirizzo univoco. Lo schema di indirizzamento originale a 32 bit era l'Intel Protocol Version 4 (IPv4). La crescita esponenziale di Internet, tuttavia, in futuro saturerà tutti gli indirizzi IPv4 disponibili. Il protocollo IPv6 (Internet Protocol Version 6) è un meccanismo progettato per superare le limitazioni di assegnazione di indirizzi del protocollo IPv4.

Con il supporto di Amazon S3 per IPv6, le applicazioni possono connettersi ad Amazon S3 senza software o sistemi di conversione degli indirizzi IPv4 o IPv6. In questo modo è più semplice soddisfare i requisiti di conformità, eseguire l'integrazione con applicazioni basate su IPv6 esistenti in locale ed evitare l'acquisto di costose apparecchiature di rete per gestire la conversione degli indirizzi. Ora è anche possibile utilizzare le caratteristiche di filtro dell'indirizzo sorgente esistente in policy di IAM e di bucket con indirizzi IPv6, ampliando le opzioni per proteggere le applicazioni che interagiscono con Amazon S3.

È possibile iniziare indirizzando l'applicazione verso l'endpoint "dual stack" di Amazon S3, che supporta l'accesso tramite sia IPv4 sia IPv6. Nella maggior parte di casi non è necessario procedere ad alcuna configurazione aggiuntiva per accedere su IPv6, perché in molti client di rete il protocollo IPv6 è quello predefinito. Le applicazioni che riscontrano problemi usando IPv6 possono tornare in qualsiasi momento a collegarsi a endpoint standard compatibili esclusivamente con IPv4. IPv6 con Amazon S3 è supportato in tutte le Regioni AWS commerciali, tra cui le regioni AWS GovCloud (Stati Uniti), la regione Amazon Web Services Cina (Pechino), gestita da Sinnet, e la regione Amazon Web Services Cina (Ningxia), gestita da NWCD.

No, le prestazioni di Amazon S3 sono identiche a prescindere che il protocollo in uso sia IPv4 o IPv6.

Notifiche degli eventi S3

Apri tutto

È possibile utilizzare le notifiche degli eventi di Amazon S3 per ricevere notifiche quando si verificano determinati eventi nel bucket S3, come gli eventi PUT, POST, COPY e DELETE. Le notifiche possono essere pubblicate in Amazon EventBridge, Amazon SNS, Amazon SQS o direttamente in AWS Lambda.

Le notifiche degli eventi di Amazon S3 consentono di eseguire flussi di lavoro, inviare avvisi o eseguire altre operazioni in risposta a modifiche negli oggetti archiviati in S3. È possibile usare le notifiche degli eventi S3 per configurare l'attivazione di operazioni quali la transcodifica di file multimediali durante il caricamento, l'elaborazione di file di dati non appena risultano disponibili e la sincronizzazione di oggetti S3 con altri archivi di dati. È anche possibile configurare notifiche degli eventi in base ai prefissi e ai suffissi del nome dell'oggetto. Ad esempio, è possibile scegliere di ricevere notifiche sui nomi di oggetto che iniziano con "images/".

Per una descrizione dettagliata delle informazioni incluse nei messaggi di notifica degli eventi di Amazon S3, consulta la sezione Configurazione delle notifiche degli eventi di Amazon S3.

Per istruzioni dettagliate su come configurare le notifiche degli eventi, consulta la sezione Configurazione delle notifiche degli eventi di Amazon S3. Per ulteriori informazioni sui servizi di messaggistica di AWS, consulta la documentazione di Amazon SNS e la documentazione di Amazon SQS.

Non sono previsti costi aggiuntivi per l'uso delle notifiche degli eventi di Amazon S3. Vengono addebitati solo i costi di invio dei messaggi di Amazon SNS o di Amazon SQS o i costi di esecuzione delle funzioni AWS Lambda. Consulta le pagine relative ai prezzi di Amazon SNS, Amazon SQS e AWS Lambda per avere informazioni dettagliate sulle relative tariffe.

Accelerazione del trasferimento Amazon S3

Apri tutto

Accelerazione del trasferimento Amazon S3 consente il trasferimento rapido, semplice e sicuro di file a lunga distanza tra il tuo client e il tuo bucket Amazon S3. Accelerazione del trasferimento S3 sfrutta le posizioni edge di AWS di Amazon CloudFront distribuite in tutto il mondo. Quando i dati raggiungono una posizione edge AWS, vengono instradati verso il bucket Amazon S3 selezionato seguendo un percorso di rete ottimizzato.

Per iniziare a usare Accelerazione del trasferimento S3, abilita il servizio in un bucket S3 tramite la console Amazon S3, l'API di Amazon S3 oppure AWS CLI. Una volta abilitata la S3 Transfer Acceleration, è possibile selezionare come destinazione delle richieste PUT e GET di Amazon S3 il nome di dominio dell'endpoint s3-accelerate. Il tipo di endpoint che l'applicazione di trasferimento dei dati deve utilizzare per accedere al bucket con una velocità di trasferimento superiore è uno dei seguenti: .s3-accelerate.amazonaws.com oppure .s3-accelerate.dualstack.amazonaws.com per un endpoint "dual stack". Se desideri utilizzare il trasferimento di dati standard, puoi continuare a utilizzare gli stessi endpoint. Sono previste alcune restrizioni in relazione ai bucket compatibili con Accelerazione del trasferimento S3. Per i dettagli, consulta la documentazione di Amazon S3.

La funzione S3 Transfer Acceleration consente di sfruttare l'intera larghezza di banda, riducendo al minimo gli effetti della distanza sul throughput, ed è progettata per garantire trasferimenti di dati veloci e costanti verso Amazon S3 indipendentemente dalla posizione del client. L'accelerazione dipende dalla larghezza di banda disponibile, dalla distanza tra fonte e destinazione e dal tasso di perdita dei pacchetti sul percorso di rete. In generale, l'accelerazione sarà più evidente quando la fonte è più lontana dalla destinazione, quando la larghezza di banda disponibile è maggiore e/o quando le dimensioni degli oggetti trasferire sono superiori. Uno dei nostri clienti ha registrato una riduzione del 50% nel tempo medio di inoltro di 300 MB di file dalla propria base utenti globale distribuita tra Stati Uniti, Europa e Asia in un bucket nella regione Asia Pacifico (Sydney). Un altro cliente ha visto il trasferimento dati migliorare di oltre il 500% per alcuni utenti nel Sud-est asiatico e in Australia che caricano 250 MB di file (in parti da 50 MB) in un bucket S3 nella regione Stati Uniti orientali (Virginia settentrionale). Accedi allo strumento di confronto delle velocità di S3 Transfer Acceleration per ottenere un'anteprima dei vantaggi alle prestazioni dalla tua posizione.

S3 Transfer Acceleration è una funzione progettata per ottimizzare le velocità di trasferimento dei dati in tutto il mondo verso bucket S3. Quando occorre caricare dati in un bucket centralizzato a partire da diverse posizioni distanti tra loro, oppure quando occorre spostare regolarmente GB o TB di dati tra continenti diversi, con S3 Transfer Acceleration è possibile ridurre i tempi di trasferimento di ore o di giorni.

S3 Transfer Acceleration fornisce lo stesso livello di sicurezza dei normali trasferimenti verso Amazon S3. Sono infatti supportate tutte le funzionalità di sicurezza di Amazon S3, ad esempio le restrizioni di accesso basate sull'indirizzo IP del client. S3 Transfer Acceleration comunica con i client tramite protocollo TCP standard e non richiede modifiche del firewall. I dati trasferiti non vengono mai salvati nelle posizioni edge AWS.

Ogni volta che usi Accelerazione del trasferimento S3 per caricare un oggetto, verificheremo che il trasferimento sia effettivamente più rapido rispetto ai comuni trasferimenti in Amazon S3. Se il caricamento con Accelerazione del trasferimento S3 non dovesse risultare più veloce del normale trasferimento con Amazon S3 dello stesso oggetto verso la stessa regione AWS di destinazione, non sarà addebitato alcun costo per il servizio e il sistema non sarà utilizzato per tale trasferimento.

Sì, S3 Transfer Acceleration supporta tutte le caratteristiche a livello di bucket, incluso il caricamento in più parti.

S3 Transfer Acceleration consente di ottimizzare il protocollo TCP e fornisce ulteriore intelligence tra il cliente e il bucket S3, perciò è una scelta migliore quando è necessario un throughput superiore. Quando gli oggetti o i set di dati da trasferire hanno dimensioni inferiori a 1 GB, consigliamo di impiegare i comandi PUT/POST di Amazon CloudFront per ottenere prestazioni ottimali.

AWS Direct Connect rappresenta una buona soluzione per i clienti che necessitano di una rete privata o che hanno accesso al traffico di AWS Direct Connect. S3 Transfer Acceleration è invece più utile per inoltrare dati da client sparsi in diverse posizioni su connessioni Internet pubbliche, oppure quando la velocità effettiva è inficiata da condizioni di rete variabili. Alcuni clienti di AWS Direct Connect si avvalgono di S3 Transfer Acceleration per velocizzare i trasferimenti di dati da filiali remote, dove la connessione Internet potrebbe essere rallentata.

È possibile ottenere vantaggi configurando la destinazione di bucket nel gateway di terze parti, in modo che utilizzi un dominio di endpoint S3 Transfer Acceleration.
Per ulteriori informazioni sull'implementazione di AWS, consulta la sezione File delle Domande frequenti su Storage Gateway.

Sì. I pacchetti software che si connettono direttamente in Amazon S3 possono utilizzare S3 Transfer Acceleration quando inoltrano processi in Amazon S3. Ulteriori informazioni sulle soluzioni dei partner di archiviazione »

Sì, AWS ha esteso il proprio programma di conformità agli standard HIPAA in modo da includere S3 Transfer Acceleration. Se disponi di un contratto di società in affari con AWS, puoi utilizzare S3 Transfer Acceleration per trasferire i dati in modo rapido, facile e sicuro, incluse le informazioni sanitarie protette su grandi distanze tra il client e il bucket Amazon S3.

Sicurezza

Apri tutto

La sicurezza è una delle caratteristiche primarie di Amazon S3. Al momento della creazione, puoi accedere soltanto ai bucket Amazon S3 da te creati e hai il controllo assoluto di chi è autorizzato ad accedere ai tuoi dati. Amazon S3 è provvisto di funzionalità di autenticazione per controllare l'accesso ai dati. È possibile usare meccanismi di controllo degli accessi come policy dei bucket per autorizzare l'accesso in modo selettivo a utenti e gruppi di utenti. La console di Amazon S3 mostra i bucket accessibili pubblicamente, indica l'origine di tale accessibilità e avvisa qualora le modifiche di policy o liste di controllo degli accessi dei bucket ne rendessero pubblico l'accesso. È opportuno attivare il blocco dell'accesso pubblico Amazon S3 per tutti gli account e i bucket che non si desidera rendere accessibili al pubblico. Per impostazione predefinita, in tutti i nuovi bucket è attivato il Blocco dell'accesso pubblico. Puoi caricare o scaricare in modo sicuro i propri dati su Amazon S3 attraverso endpoint con crittografia SSL impiegando il protocollo HTTPS. Amazon S3 crittografa automaticamente tutti i caricamenti di oggetti sul tuo bucket (a partire dal 5 gennaio 2023). In alternativa, puoi utilizzare le tue librerie di crittografia per codificare i dati prima di archiviarli in Amazon S3.
Per ulteriori informazioni sulla sicurezza in AWS, consulta la pagina sulla sicurezza di AWS e per informazioni sulla sicurezza di S3, visita la pagina sulla sicurezza di S3 o la guida alle best practice di sicurezza di S3.

I clienti possono usare una serie di meccanismi per controllare l'accesso alle risorse di Amazon S3, fra cui policy di AWS Identity and Access Management (IAM), policy di bucket, policy dei punti di accesso, liste di controllo accessi (ACL), autenticazione stringa della query, policy degli endpoint Amazon Virtual Private Cloud (Amazon VPC), policy di controllo dei servizi (SCP) in AWS Organizations e il blocco dell'accesso pubblico Amazon S3.

Sì. È possibile configurare i bucket di Amazon S3 in modo che vengano creati, nel log degli accessi, record di tutte le richieste che li riguardano. In alternativa, se occorre acquisire informazioni su IAM e sulle identità degli utenti nei fil di log, è possibile configurare gli eventi sui dati di AWS CloudTrail. I record dei log di accesso contengono dettagli della richiesta, quali tipo di richiesta, risorse specificate e ora e data in cui la richiesta è stata elaborata, pertanto possono essere utilizzati a fini di audit.

Amazon S3 crittografa tutti i nuovi dati caricati su qualsiasi bucket. Amazon S3 applica la crittografia lato server gestita da S3 (SSE-S3) come livello base di crittografia a tutti gli oggetti caricati (a partire dal 5 gennaio 2023). SSE-S3 rappresenta una soluzione completamente gestita: Amazon gestisce le chiavi e la loro protezione utilizzando molteplici livelli di sicurezza. È consigliabile continuare a utilizzare SSE-S3 se si preferisce affidare ad Amazon la gestione delle chiavi. Inoltre, i dati possono essere crittografati mediante le tecnologie SSE-C, SSE-KMS, DSSE-KMS oppure mediante una libreria come il client di crittografia Amazon S3. Ciascuna opzione consente di archiviare i dati sensibili crittografati a riposo in Amazon S3. SSE-C consente ad Amazon S3 di eseguire la crittografia e la decrittografia degli oggetti, mantenendo il controllo delle chiavi di crittografia. Con SSE-C non occorre implementare o utilizzare una libreria lato client per eseguire la crittografia e la decrittografia degli oggetti archiviati in Amazon S3, ma è necessario gestire le chiavi che si inviano ad Amazon S3 per crittografare e decrittografare gli oggetti. Utilizza SSE-C se si desidera gestire le proprie chiavi di crittografia, ma non si desidera implementare o sfruttare una libreria di crittografia lato client. SSE-KMS consente al Servizio AWS di gestione delle chiavi (AWS KMS) di gestire le tue chiavi di crittografia. L'impiego di AWS KMS per gestire le chiavi fornisce ulteriori vantaggi. AWS KMS prevede autorizzazioni separate per utilizzare la chiave KMS, il che fornisce un ulteriore livello di controllo e protezione contro l'accesso non autorizzato agli oggetti archiviati in Amazon S3. AWS KMS offre tracce di controllo per visualizzare chi abbia utilizzato la chiave per accedere agli oggetti, a quali oggetti e quando, nonché i tentativi di accesso ai dati non riusciti da parte di utenti sprovvisti di autorizzazione a decriptare i dati. Infine, AWS KMS offre ulteriori controlli di sicurezza per agevolare l'adeguamento ai requisiti di settore PCI-DSS, HIPAA/HITECH e FedRAMP. DSSE-KMS semplifica il processo di applicazione di due livelli di crittografia ai dati, senza dover investire nell'infrastruttura necessaria per la crittografia lato client. Ogni livello di crittografia utilizza un'implementazione diversa dell'Advanced Encryption Standard a 256 bit con algoritmo Galois Counter Mode (AES-GCM) ed è controllato e accettato per l'uso su carichi di lavoro top secret. DSSE-KMS utilizza AWS KMS per generare chiavi dati e consente ad AWS KMS di gestire le tue chiavi di crittografia. AWS KMS prevede autorizzazioni separate per utilizzare la chiave KMS, il che fornisce un ulteriore livello di controllo e protezione contro l'accesso non autorizzato agli oggetti archiviati in Amazon S3. AWS KMS offre tracce di controllo per visualizzare chi abbia utilizzato la chiave per accedere agli oggetti, a quali oggetti e quando, nonché i tentativi di accesso ai dati non riusciti da parte di utenti sprovvisti di autorizzazione a decriptare i dati. Infine, AWS KMS offre ulteriori controlli di sicurezza per agevolare l'adeguamento ai requisiti di settore PCI-DSS, HIPAA/HITECH e FedRAMP. Con una libreria di crittografia client, è possibile mantenere il controllo delle chiavi e completare la crittografia e la decrittografia degli oggetti lato client utilizzando una libreria di crittografia a scelta. Alcuni clienti preferiscono avere il controllo completo della crittografia e decrittografia degli oggetti; in questo modo, attraverso Internet ad Amazon S3 vengono trasmessi soltanto oggetti crittografati. Se desideri mantenere il controllo delle chiavi di crittografia, hai la possibilità di implementare o utilizzare una libreria file crittografato lato client e hai intenzione di crittografare gli oggetti prima che siano inviati ad Amazon S3 per l'archiviazione, consigliamo l'uso di una libreria di crittografia lato client. Per maggiori informazioni sull'uso di Amazon S3 SSE-S3, SSE-C o SSE-KMS, consulta la sezione relativa alla protezione dei dati tramite la crittografia.

I clienti possono decidere i archiviare tutti i dati in Europa utilizzando la regione Europa (Francoforte), Europa (Irlanda), Europa (Parigi), Europa (Stoccolma), Europa (Milano), Europa (Spagna), Europa (Londra) o Europa (Zurigo). Puoi anche utilizzare Amazon S3 su Outpostsper mantenere tutti i dati on-premises nell'AWS Outpost e puoi anche scegliere di trasferire i dati tra AWS Outposts o a una Regione AWS. Garantire il rispetto delle leggi sulla privacy europee è responsabilità del cliente. Visualizza il Centro per il Regolamento generale sulla protezione dei dati (GDPR) AWS e Centro sulla privacy dei dati AWS per ulteriori informazioni. Se sono presenti requisiti più specifici relativi alla posizione o altre normative sulla privacy dei dati che impongono di conservare i dati un una posizione in cui non è presente una regione AWS, puoi usare le classi di archiviazione S3 per le zone locali AWS dedicate o S3 su Outposts.

Per impostazione predefinita, i dati e i metadati degli oggetti rimangono all'interno della singola zona locale dedicata nella quale si trova l'oggetto. I dati di gestione e telemetria del bucket, compresi i nomi, i parametri di capacità, i log di CloudTrail, i parametri di CloudWatch, le chiavi gestite del cliente delle policy del Servizio AWS di gestione delle chiavi (KMS) e di Identity and Access Management (IAM), sono archiviati nella regione AWS parent. Facoltativamente, altre funzionalità di gestione del bucket, come Operazioni in batch S3, archiviano metadati di gestione con il nome del bucket e dell'oggetto nella regione AWS parent.

Un endpoint Amazon VPC per Amazon S3 è un'entità logica all'interno di un VPC che consente la connettività a S3 tramite la rete globale di AWS. Esistono due tipi di endpoint VPC per S3: endpoint VPC del gateway ed endpoint VPC di interfaccia. Gli endpoint gateway sono un gateway che specifichi nella tabella di instradamento per accedere a S3 dal tuo VPC tramite la rete AWS. Gli endpoint di interfaccia estendono la funzionalità degli endpoint gateway utilizzando IP privati per instradare le richieste a S3 dall'interno del VPC, on-premise o da una Regione AWS diversa. Per ulteriori informazioni, visita la pagina della documentazione di AWS PrivateLink per Amazon S3.

Utilizzando le policy dei bucket Amazon S3 puoi limitare l'accesso al bucket da un endpoint Amazon VPC specifico o da un set di endpoint. Le policy dei bucket S3 supportano la condizione aws:sourceVpce, che consente di restringere gli accessi. Per maggiori dettagli e le policy di esempio, consulta la documentazione degli endpoint gateway per S3.

AWS PrivateLink per S3 fornisce connettività privata tra Amazon S3 e gli ambienti on-premises. Puoi eseguire il provisioning degli endpoint VPC di interfaccia per S3 nel tuo VPC per connettere le applicazioni on-premise direttamente a S3 tramite AWS Direct Connect o AWS VPN. Non è più necessario utilizzare IP pubblici, modificare le regole del firewall o configurare un gateway Internet per accedere a S3 da ambienti on-premise. Per ulteriori informazioni, consulta la documentazione di AWS PrivateLink per S3.

Puoi creare un endpoint VPC di interfaccia utilizzando la console di gestione VPC di AWS, l'interfaccia della linea di comando AWS (AWS CLI), l'SDK AWS o l'API. Per ulteriori informazioni, consulta la documentazione.

AWS consiglia di utilizzare endpoint VPC di interfaccia per accedere a S3 da ambienti on-premises o da un VPC situato in un'altra Regione AWS. Per le risorse che accedono a S3 da un VPC situato nella stessa regione AWS di S3, consigliamo di utilizzare endpoint VPC gateway poiché il loro utilizzo non comporta costi. Per ulteriori informazioni, consulta la documentazione.

Sì. Se già disponi di un endpoint VPC gateway, crea un endpoint VPC di interfaccia nel tuo VPC e aggiorna le applicazioni client con i nomi endpoint specifici dell'endpoint VPC. Ad esempio, se l'ID dell'endpoint VPC di interfaccia è vpce-0fe5b17a0707d6abc-29p5708s nella Regione us-east-1, il nome DNS specifico dell'endpoint sarà vpce-0fe5b17a0707d6abc-29p5708s.s3.us-east-1.vpce.amazonaws.com. In questo caso, solo le richieste ai nomi specifici dell'endpoint VPC verranno instradate attraverso gli endpoint VPC di interfaccia a S3, mentre tutte le altre richieste continueranno a essere instradate attraverso l'endpoint VPC gateway. Per ulteriori informazioni, consulta la documentazione.

Amazon Macie è un servizio di sicurezza basato sull'IA che aiuta a prevenire la perdita di dati perché rileva, classifica e protegge i dati sensibili archiviati in Amazon S3. Amazon Macie utilizza il machine learning per riconoscere dati sensibili quali le informazioni di identificazione personale (PII) o i dati soggetti a proprietà intellettuale, vi assegna un valore e fornisce visibilità su relativi percorsi di memorizzazione e modalità di utilizzo in azienda. Amazon Macie monitora costantemente le attività di accesso ai dati per rilevare eventuali anomalie e invia avvisi quando individua rischi di accesso non autorizzato o di divulgazione accidentale di informazioni. Amazon Macie costituisce una protezione contro le minacce alla sicurezza perché monitora costantemente i dati e le credenziali di un account. Amazon Macie è un servizio automatizzato con cui è possibile individuare e classificare i dati aziendali. I controlli sono disponibili tramite modelli di funzioni Lambda, che permettono di revocare l'accesso o attivare le policy di reimpostazione della password quando vengono individuati comportamenti sospetti o accessi non autorizzati ai dati con entità o applicazioni di terze parti. Quando viene generato un avviso, si può usare Amazon Macie per fornire una prima risposta, sfruttando Amazon CloudWatch Events per eseguire operazioni immediate a protezione dei dati. Per ulteriori informazioni, consulta la documentazione di Amazon Macie

Sistema di analisi degli accessi per S3 è una funzionalità che semplifica la gestione delle autorizzazioni impostando, verificando e perfezionando le policy per i bucket S3 e i punti di accesso. Sistema di analisi degli accessi per S3 monitora le policy di accesso esistenti per verificare che forniscano solo l'accesso richiesto alle proprie risorse S3. Sistema di analisi degli accessi per S3 valuta le policy di accesso ai bucket e aiuta a identificare e risolvere rapidamente i bucket che non richiedono l'accesso. Sistema di analisi degli accessi per S3 avvisa quando un bucket è configurato per consentire l'accesso pubblico o è condiviso con altri account AWS. Riceverai risultati sull'origine e sul livello di accesso pubblico o condiviso. Ad esempio, Sistema di analisi degli accessi per S3 ti informerà in modo proattivo in caso di accesso in lettura o scrittura indesiderato attraverso una lista di controllo accessi o una policy di bucket. Grazie a questi risultati potrai impostare o ripristinare immediatamente la policy di accesso necessaria. Quando esamini i risultati relativi a un potenziale accesso condiviso a un bucket, ti basterà un solo clic per bloccare tutti gli accessi pubblici al bucket dalla console di S3. Inoltre, puoi eseguire il drill-down delle singole impostazioni relative alle autorizzazioni di accesso al bucket per configurare livelli di accesso granulari. Ai fini della verifica, è possibile scaricare i risultati di Access Analyzer for S3 come report CSV. Inoltre, la console S3 riporta avvisi di sicurezza, errori e suggerimenti da IAM Access Analyzer mentre si creano le policy S3. La console esegue automaticamente più di 100 controlli per convalidare le tue policy. Questi controlli ti fanno risparmiare tempo, ti guidano nella risoluzione degli errori e ti aiutano ad applicare le best practice di sicurezza.
Per ulteriori informazioni, consulta la documentazione del Sistema di analisi degli accessi IAM.

S3 Access Grants

Apri tutto

Amazon S3 Access Grants associa le identità in directory come Active Directory o i principali AWS Identity and Access Management (IAM) ai set di dati in S3. Questo ti aiuta a gestire le autorizzazioni dei dati su larga scala concedendo automaticamente l'accesso S3 agli utenti finali in base alla loro identità aziendale. Inoltre, S3 Access Grants registra l'identità dell'utente finale e l'applicazione utilizzata per accedere ai dati S3 in AWS CloudTrail. Ciò consente di fornire una cronologia dettagliata degli audit fino all'identità dell'utente finale per tutti gli accessi ai dati nei bucket S3.

Dovresti utilizzare S3 Access Grants se i tuoi dati S3 sono condivisi e accessibili da molti utenti e applicazioni, in cui alcune delle loro identità si trovano nella tua directory aziendale, come Okta o Entra ID, e hai bisogno di un modo scalabile, semplice e verificabile per concedere l'accesso a questi set di dati S3 su larga scala.

Puoi iniziare a utilizzare S3 Access Grants in quattro passaggi. Innanzitutto, configura un'istanza S3 Access Grants. In questo passaggio, se desideri utilizzare S3 Access Grants con utenti e gruppi nella tua directory aziendale, abilita il Centro identità AWS e collega S3 Access Grants alla tua istanza del Centro identità. In secondo luogo, registra la posizione con S3 Access Grants. Durante questo processo, assegni a S3 Access Grants un ruolo IAM che viene utilizzato per creare credenziali S3 temporanee che utenti e applicazioni possono utilizzare per accedere a S3. In terzo luogo, definisci le concessioni di autorizzazione che specificano chi può accedere a cosa. Infine, al momento dell'accesso, chiedi alla tua applicazione di richiedere una credenziale temporanea a S3 Access Grants e di utilizzare le credenziali vendute da Access Grants per accedere a S3.

S3 Access Grants supporta due tipi di identità: identità di utenti o di gruppi aziendali del Centro identità AWS e principali AWS IAM, inclusi utenti e ruoli IAM. Durante l'utilizzo di S3 Access Grants con il Centro identità AWS, è possibile definire le autorizzazioni per i dati sulla base delle appartenenze ai gruppi di directory. Il Centro identità AWS è un servizio AWS che si connette a provider di identità di uso comune, tra cui Entra ID, Okta, Ping e altri. Oltre a supportare le identità delle directory tramite il Centro identità AWS, S3 Access Grants supporta anche le regole di autorizzazione per il principale AWS IAM, inclusi utenti e ruoli IAM. Si tratta di casi d'uso che danno la possibilità sia di gestire una federazione delle identità personalizzata non tramite il Centro identità AWS ma tramite asserzioni IAM e SAML (esempio di implementazione) o di gestire le identità delle applicazioni basate su principali IAM, permettendo comunque l'utilizzo di S3 Access Grants grazie alla sua scalabilità e verificabilità.

S3 Access Grants offre tre livelli di accesso, READ, WRITE e READWRITE. READ consente di visualizzare e recuperare oggetti da S3. WRITE consente di scrivere ed eliminare da S3. READWRITE consente di eseguire sia READ che WRITE.

No. È possibile utilizzare solo i tre livelli di accesso predefiniti (READ/WRITE/READWRITE) offerti da S3 Access Grants.

Sì. Puoi creare fino a 100.000 concessioni per istanza di S3 Access Grants e fino a 1.000 posizioni per istanza di S3 Access Grants.

No. La latenza per ottenere credenziali temporanee da S3 Access Grants è simile a quella utilizzata oggi per ottenere credenziali temporanee da AWS STS. Dopo aver ottenuto le credenziali da S3 Access Grants, è possibile riutilizzarle, se non sono scadute, per le richieste successive. Rispetto ad altri metodi, non è prevista alcuna latenza aggiuntiva per le richieste successive autenticate tramite le credenziali di S3 Access Grants rispetto ad altri metodi.

Se si intende utilizzare S3 Access Grants per le identità delle directory, occorre prima configurare il Centro identità AWS IAM. Il Centro identità AWS IAM aiuta a creare o connettere le identità della forza lavoro, sia che siano create e archiviate nel Centro identità che in un provider di identità esterno di terze parti. Consulta la documentazione del Centro identità per il processo di configurazione. Una volta configurata l'istanza del Centro identità, è possibile connetterla a S3 Access Grants. Successivamente, S3 Access Grants si affida al Centro identità per recuperare gli attributi dell'utente, come l'appartenenza al gruppo, per valutare le richieste e prendere decisioni in materia di autorizzazioni.

Sì. Mentre attualmente il client S3 si inizializza con le credenziali IAM associate all'applicazione (ad esempio, credenziali del ruolo IAM per EC2 o IAM Roles Anywhere; o utilizzando credenziali utente IAM a lungo termine), l'applicazione dovrà invece ottenere le credenziali S3 Access Grants prima di inizializzare il client S3. Queste credenziali saranno specifiche per l'utente autenticato nell'applicazione. Una volta inizializzato con queste credenziali S3 Access Grants, il client S3 può regolarmente effettuare richieste di dati S3 utilizzando le credenziali.

Attualmente, S3 Access Grants si integra già con EMR e Spark open source tramite il connettore S3A. Inoltre, si integra con software di terze parti, tra cui Immuta e Informatica, in modo da poter centralizzare la gestione delle autorizzazioni. Infine, S3 Access Grants supporta Terraform e CloudFormation per consentire il provisioning programmatico di S3 Access Grants.

No. S3 Access Grants non sostituisce IAM e in effetti funziona bene con le strategie di protezione dei dati esistenti basate su IAM (regole di crittografia, rete, perimetro dei dati). S3 Access Grants è basato su primitivi IAM e consente di esprimere autorizzazioni S3 più granulari su larga scala.

Sì. Per utilizzare S3 Access Grants per oggetti crittografati con KMS, i proprietari dei bucket includono nel ruolo IAM le autorizzazioni KMS necessarie che concedono a S3 Access Grants come parte della registrazione della posizione. S3 Access Grants può quindi utilizzare quel ruolo IAM in seguito per accedere agli oggetti crittografati con KMS nei bucket.

È possibile utilizzare l'esperienza della console di S3 Access Grants nella Console di gestione AWS o le API SDK e CLI per visualizzare e gestire le autorizzazioni di S3 Access Grants.

No, non è possibile concedere l'accesso pubblico ai dati con S3 Access Grants.

La richiesta dell'applicazione di avviare una sessione di accesso ai dati con S3 Access Grants verrà registrata su CloudTrail. CloudTrail distinguerà l'identità dell'utente che effettua la richiesta da quella dell'applicazione che accede ai dati per conto dell'utente. Ciò consente di verificare l'identità dell'utente finale per stabilire chi ha avuto accesso a quali dati e in quale momento.

S3 Access Grants viene addebitato in base al numero di richieste a S3 Access Grants. Per i dettagli sui prezzi, consulta la pagina dei prezzi.

AWS Lake Formation è indicato per i casi d'uso in cui è necessario gestire l'accesso ai dati tabulari (come le tabelle Glue), in cui potrebbe esserci la necessità di imporre l'accesso a livello di riga e colonna. S3 Access Grants serve a gestire l'accesso per le autorizzazioni S3 dirette, come i dati non strutturati, inclusi video, immagini, log, ecc.

No. Al momento, S3 Access Grants non è integrato con il Sistema di analisi degli accessi IAM. Non è ancora possibile utilizzare il Sistema di analisi degli accessi IAM per analizzare le concessioni di autorizzazioni di S3 Access Grants. I clienti possono controllare le concessioni di autorizzazioni di S3 Access Grants direttamente accedendo alla pagina S3 Access Grants nella console S3 oppure utilizzando programmaticamente l'API ListAccessGrants.

Punti di accesso S3

Apri tutto

I punti di accesso Amazon S3 sono endpoint che semplificano la gestione dell'accesso ai dati per qualsiasi applicazione o servizio AWS che funziona con S3. I punti di accesso S3 funzionano con i bucket S3 e i file system Amazon FSx per OpenZFS. Puoi controllare e semplificare il modo in cui diverse applicazioni o utenti possono accedere ai dati creando punti di accesso con nomi e autorizzazioni personalizzati per ogni applicazione o utente.

Grazie ai punti di accesso S3 con i bucket S3 non è più necessario gestire una singola e complessa policy di bucket con centinaia di diverse regole di autorizzazione che devono essere scritte, lette, tracciate e verificate. È invece possibile creare centinaia di punti di accesso per bucket, ognuno dei quali fornisce un percorso personalizzato in un bucket, con un nome host unico e una policy di accesso che implementa le autorizzazioni specifiche e i controlli di rete per qualsiasi richiesta avanzata attraverso il punto di accesso.

Utilizzando i punti di accesso S3 con FSx per OpenZFS, puoi accedere ai tuoi dati FSx utilizzando l'API S3 come se i dati fossero in S3. Grazie a questa funzionalità, i dati dei file in FSx per OpenZFS sono accessibili per l'utilizzo con l'ampia gamma di servizi e applicazioni di intelligenza artificiale, machine learning e analisi compatibili con S3, pur continuando a risiedere nel file system FSx per OpenZFS.

I punti di accesso S3 semplificano la gestione delle modalità di accesso ai set di dati condivisi su S3. Non è più necessario gestire una singola e complessa policy di bucket con centinaia di diverse regole di autorizzazione che devono essere scritte, lette, tracciate e verificate. Grazie ai Punti di accesso S3, puoi creare punti di accesso o delegare autorizzazioni per account affidabili in modo da creare punti di accesso multi-account sul tuo bucket. Ciò consente di accedere ai set di dati condivisi con policy specifiche per l'applicazione. Utilizzando i Punti di accesso, puoi scomporre una policy di bucket di grandi dimensioni in policy di punti di accesso separate e discrete per ogni applicazione che accede al set di dati condiviso. Ciò rende più semplice la creazione della giusta policy di accesso per un'applicazione, senza doversi preoccupare di interrompere l'attività di un'altra applicazione all'interno del dataset condiviso. Inoltre, puoi creare una policy di controllo dei servizi (SCP) e richiedere che tutti i punti di accesso vengano limitati a un Virtual Private Cloud (VPC), proteggendo i dati all'interno delle tue reti private.

Con i punti di accesso S3, puoi accedere ai dati dei file in Amazon FSX per OpenZFS utilizzando le API S3 e senza spostare i dati su S3. I punti di accesso S3 collegati ai file system FSx per OpenZFS funzionano in modo simile a come funzionano i punti di accesso S3 collegati ai bucket S3, fornendo l'accesso ai dati tramite S3 con accesso controllato da policy di accesso, mentre i dati continuano a essere archiviati nei file system FSX per OpenZFS o nei bucket S3. Ad esempio, una volta collegato un punto di accesso S3 a un file system FSx per OpenZFS, i clienti possono utilizzare il punto di accesso con servizi e applicazioni di IA generativa, machine learning e analisi che funzionano con S3 per accedere ai propri dati FSx per OpenZFS.

Ogni punto di accesso S3 è configurato con una policy di accesso specifica per un caso d'uso o un'applicazione e un bucket può disporre di migliaia di punti di accesso. Ad esempio, puoi creare un punto di accesso per il bucket S3 che conceda a gruppi di utenti o applicazioni l'accesso al data lake. Un Punto di accesso potrebbe supportare un singolo utente o un'applicazione, oppure gruppi di utenti o applicazioni, consentendo una gestione separata di ciascun punto di accesso. Inoltre, puoi delegare autorizzazioni per account affidabili in modo da creare punti di accesso multi-account sul tuo bucket. I punti di accesso multi-account non garantiscono l'accesso ai dati finché non viene concessa l'autorizzazione dal proprietario del bucket. Il proprietario del bucket mantiene sempre il controllo finale sui dati e deve aggiornare la policy di bucket per autorizzare le richieste dal punto di accesso multi-account. Nella guida per l'utente è riportato un esempio di policy di bucket. Ogni punto di accesso è associato a un singolo bucket e contiene un controllo dell'origine della rete e un controllo di tipo Blocco dell'accesso pubblico. Ad esempio, puoi creare un punto di accesso con un controllo dell'origine della rete che permetta l'accesso all'archiviazione solo dal tuo cloud privato virtuale, una sezione logicamente isolata di AWS Cloud. Inoltre, puoi creare un punto di acceso configurandone la policy in modo da permettere l'accesso solo agli oggetti con un prefisso definito o ad oggetti con tag specifici. Puoi accedere ai dati nei bucket condivisi tramite un punto di accesso in due modi. Per le operazioni sugli oggetti S3, puoi utilizzarel’ARN del punto di accesso al posto di un nome di bucket. Per le richieste con un nome bucket nel formato del nome bucket S3 standard, puoi invece utilizzare un alias del punto di accesso. Gli alias per i punti di accesso S3 vengono generati automaticamente e sono intercambiabili con i nomi dei bucket S3 ovunque utilizzi un nome di bucket per l'accesso ai dati. Ogni volta che crei un punto di accesso per un bucket, S3 genera automaticamente un nuovo alias del punto di accesso. Per il set completo di operazioni e servizi AWS compatibili, consulta la documentazione di S3.

Per impostazione predefinita, è possibile creare 10.000 punti di accesso S3 per ogni regione per ciascun account sui bucket nell'account e tra più account. Non esiste un limite fisso al numero di punti di accesso S3 per account AWS. Visita la pagina Service Quotas per richiedere un aumento di questa quota.

I punti di accesso S3 hanno una propria policy di accesso IAM. Scrivi le policy degli access point come per una policy di bucket, utilizzando l'ARN dell'access point come risorsa. Le policy degli access point possono concedere o limitare l'accesso ai dati S3 richiesti tramite l'access point. Amazon S3 valuta tutte le policy rilevanti, incluse quelle relative a utente, bucket, punto di accesso, endpoint VPC, e le policy di controllo dei servizi per decidere se autorizzare o meno la richiesta.

Le policy per un punto di accesso si scrivono esattamente come le policy di bucket, usando le regole IAM per gestire le autorizzazioni e l'ARN del punto di accesso nel documento della policy.

Puoi continuare ad utilizzare policy di bucket per limitarne l'accesso a VPC specificati. Gli access point offrono un modo più facile e controllabile per bloccarli tutti o un subset di dati in un set di dati condivisi a un traffico esclusivo VPC per tutte le applicazioni nella tua organizzazione che si avvalgono di controlli API. Puoi utilizzare una policy SCP AWS Organizations per esigere che qualsiasi access point creato nella tua organizzazione imposti il valore del parametro API "controllo dell'origine della rete" su "vpc". Qualsiasi nuovo access point creato automaticamente limita così l'accesso dei dati al traffico esclusivo VPC. Per assicurarsi che le richieste di dati siano elaborate solo dai VPC specificati, non è richiesta alcuna policy di accesso supplementare.

Sì. Per applicare una policy "Nessun accesso a dati Internet" per i punti di accesso nella tua organizzazione, dovresti assicurarti che tutti i punti di accesso implementino un accesso esclusivo VPC. Affinché questo accada, scriverai una policy di controllo dei servizi AWS che supporti solo il valore "vpc" per il parametro "controllo dell'origine della rete" nell'API create_access_point(). In caso di punti di accesso connessi a Internet creati da te in precedenza, questi possono essere eliminati. Dovrai anche modificare la policy di bucket in ciascuno dei tuoi bucket per limitare ulteriormente l'accesso Internet al tuo bucket tramite il nome host del bucket. Dato che altri servizi AWS possono accedere direttamente al tuo bucket, assicurati di configurare l'accesso per abilitare i servizi AWS che desideri modificando la policy per abilitarli. Consulta la documentazione S3 per esempi su come farlo.

Al momento non ancora, ma puoi collegare una policy di bucket che rifiuti le richieste non avanzate utilizzando un punto di accesso. Consulta la documentazione S3 per ulteriori dettagli.

Sì. Quando si rimuove un access point, l'accesso al bucket associato attraverso altri access point e l'host name del bucket non sarà interrotto.

Non sono previste spese aggiuntive per punti di accesso o bucket che utilizzano i punti di accesso. Si applicano le normali tariffe per richieste Amazon S3.

Puoi iniziare a creare punti di accesso S3 sui bucket nuovi ed esistenti mediante la Console di gestione AWS, l'Interfaccia a riga di comando AWS (CLI), l'interfaccia di programmazione dell'applicazione (API) e il client del Software Development Kit (SDK) di AWS. Per ulteriori informazioni sui punti di accesso S3, consulta la Guida per l'utente.

Durabilità e protezione dei dati

Apri tutto

Amazon S3 offre l'archiviazione più duratura nel cloud. Basato sulla sua unica architettura, S3 è progettato per superare il 99,999999999% (11 nove) di durabilità dei dati. Inoltre, per impostazione predefinita S3 archivia i dati in modo ridondante in un minimo di 3 zone di disponibilità (AZ), fornendo resilienza integrata contro i disastri diffusi. I clienti possono archiviare i dati in un'unica zona di disponibilità per ridurre al minimo i costi di archiviazione o la latenza, in più zone di disponibilità per la resilienza contro la perdita permanente di un intero data center o in più Regioni AWS per soddisfare i requisiti di resilienza geografica.

La progettazione di Amazon S3 per la durabilità dipende dalla frequenza di guasto dei dispositivi di archiviazione e dalla velocità con cui S3 è in grado di rilevare i guasti e quindi replicare nuovamente i dati su tali dispositivi. S3 esegue un controllo dell'integrità end-to-end su ogni caricamento di oggetti e verifica che tutti i dati siano archiviati in modo corretto e ridondante su più dispositivi di archiviazione prima di considerare il caricamento riuscito. Una volta archiviati i dati in S3, S3 monitora continuamente la durata dei dati nel tempo con controlli periodici sull'integrità di tutti i dati a riposo. Inoltre, S3 monitora attivamente la ridondanza dei dati per verificare che gli oggetti siano in grado di tollerare il guasto simultaneo di più dispositivi di archiviazione.

Nell'improbabile caso di perdita o danneggiamento di tutta o di parte di una zona di disponibilità AWS, i dati in una classe di archiviazione One Zone potrebbero andare perduti. Questa perdita potrebbe essere provocata da eventi come incendi e danni causati dall'acqua. Oltre a questi tipi di eventi, le classi di archiviazione One Zone utilizzano design ingegneristici simili alle classi di archiviazione regionali per proteggere gli oggetti da guasti indipendenti a livello di disco, host e rack, e ciascuna è progettata per offrire una durabilità dei dati del 99,999999999%.

Amazon S3 ha una solida cultura della durabilità e le migliori pratiche di durabilità sono integrate nei sistemi e nei software sin dall'inizio. Ad AWS abbiamo più esperienza nella gestione di archiviazione ad alta durabilità rispetto a qualsiasi altro provider di cloud e la utilizziamo per ridimensionare il rischio connesso alla durabilità e per aggiungere misure di protezione della durabilità in tutto ciò che facciamo.

Sì. Il sistema di durabilità di Amazon S3 non protegge da eliminazioni accidentali o intenzionali. S3 si affida ai clienti per decidere quali dati conservare, quali dati eliminare e quali controlli opzionali devono proteggere da eliminazioni errate, dovute a incidenti o danni intenzionali. Ordinando ad Amazon S3 di eliminare i dati, tali dati vengono immediatamente eliminati e AWS non può recuperarli. Rispettare una richiesta di eliminazione in questo modo è una caratteristica importante del servizio.

S3 Object Versioning, Replica S3 ed S3 Object Lock sono tutte funzionalità opzionali da utilizzare per aggiungere ulteriore protezione dei dati, oltre alla durabilità fornita automaticamente da S3. Inoltre, è possibile utilizzare un'applicazione di backup per eseguire il backup di tutti o di parte dei dati nei bucket S3.

Per verificare l'integrità dei dati, Amazon S3 impiega una combinazione di checksum Content-MD5, Secure Hash Algorithm (SHA) e controlli di ridondanza ciclici (CRC). Amazon S3 esegue il checksum sui dati a riposo e corregge gli eventuali errori utilizzando i dati ridondanti. Inoltre, gli SDK AWS più recenti calcolano automaticamente checksum efficienti basati su CRC per tutti i caricamenti. S3 verifica in modo indipendente tale checksum e accetta gli oggetti solo dopo aver confermato che l'integrità dei dati è stata mantenuta durante il transito sulla rete Internet pubblica. Quando, per caricare un oggetto, viene utilizzata una versione dell'SDK che non fornisce checksum precalcolati, S3 ne calcola uno basato sul CRC dell'intero oggetto, anche per i caricamenti in più parti. I checksum sono memorizzati nei metadati degli oggetti e sono quindi disponibili per verificare l'integrità dei dati in qualsiasi momento. È possibile scegliere tra cinque algoritmi di checksum supportati per la verifica dell'integrità dei dati sulle richieste di caricamento e download. A seconda delle esigenze dell'applicazione, è possibile scegliere tra gli algoritmi di checksum SHA-1, SHA-256, CRC32, CRC32C o CRC64NVME. È possibile calcolare e verificare automaticamente i checksum durante l'archiviazione o il recupero dei dati da S3 e accedere alle informazioni relative al checksum in qualunque momento tramite l'API S3 HeadObject, l'API S3 GetObjectAttributes o il report sull'inventario S3. Il calcolo del checksum durante la trasmissione dei dati in S3 consente di risparmiare tempo, perché la verifica e la trasmissione dei dati sono riunite in unico passaggio anziché richiedere due operazioni successive. L'utilizzo dei checksum per la convalida dei dati è una best practice per la durata dei dati e queste funzionalità aumentano le prestazioni e riducono i costi associati.

La funzione Versioni multiple consente di conservare, recuperare e ripristinare qualsiasi versione di ogni oggetto archiviato in un bucket Amazon S3. Quando si abilita la funzione Versioni multiple per un bucket, Amazon S3 conserva gli oggetti esistenti tutte le volte che si esegue un'operazione PUT, POST, COPY o DELETE su di essi. Di default, le richieste GET recuperano la versione più recente. Le versioni precedenti di un oggetto sovrascritto o eliminato possono essere recuperate specificando la versione nella richiesta.

Amazon S3 mette a disposizione dei clienti un'infrastruttura di storage estremamente durevole. La funzione Versioni multiple offre un ulteriore livello di protezione in quanto consente di recuperare un oggetto sovrascritto o eliminato accidentalmente. In questo modo è possibile eseguirne il ripristino sia in seguito ad errori da parte dell'utente, sia in seguito a guasti dell'applicazione. È inoltre possibile utilizzare la funzione Versionamento a fini di conservazione e archiviazione dei dati.

È possibile iniziare a utilizzare il versionamento abilitando un'impostazione sul bucket di Amazon S3. Per ulteriori informazioni su come abilitare il versionamento, consulta la documentazione di Amazon S3.

Quando un utente effettua un'operazione DELETE su un oggetto, le successive richieste semplici (che quindi non specificano la versione) non recupereranno più quell'oggetto. Tuttavia, tutte le versioni di quell'oggetto continueranno ad essere mantenute nel bucket di Amazon S3 e potranno essere recuperate o ripristinate. Soltanto il proprietario del bucket Amazon S3 può eliminare definitivamente una versione. È possibile impostare delle regole del ciclo di vita per gestire la durata e il costo di archiviazione di molteplici versioni degli oggetti.

È possibile usare regole del ciclo di vita di Amazon S3 insieme alla funzione di Controllo delle versioni S3 per definire un intervallo per il ripristino dello stato precedente degli oggetti S3. Ad esempio, in un bucket con la funzione di controllo delle versioni abilitata, è possibile impostare una regola che determini l'archiviazione di tutte le versioni precedenti nella classe di archiviazione S3 Glacier Flexible Retrieval, la più economica, e la loro eliminazione dopo 100 giorni; in tal modo si avrà un intervallo di ripristino dello stato precedente di cento giorni per annullare le modifiche, riducendo allo stesso tempo i costi di archiviazione. Inoltre, puoi risparmiare sui costi eliminando le vecchie versioni (non correnti) di un oggetto dopo cinque giorni e quando ci sono almeno due nuove versioni dell'oggetto. Puoi modificare il numero di giorni o il numero di nuove versioni in base ai tuoi requisiti di ottimizzazione dei costi. Questo ti permette di mantenere versioni aggiuntive dei tuoi oggetti quando necessario ma ti fa risparmiare sui costi spostandole o rimuovendole dopo un certo periodo di tempo.

La funzionalità di eliminazione dell'autenticazione a più fattori (MFA) del versionamento può essere utilizzata per aggiungere un ulteriore livello di sicurezza. Di default, tutte le richieste verso il bucket Amazon S3 necessitano l'inserimento delle credenziali dell'account AWS. Abilitando il controllo delle versioni con l'eliminazione MFA sul bucket Amazon S3, per eliminare definitivamente una versione di un oggetto sono necessarie due forme di autenticazione: le credenziali dell'account AWS e un codice a sei cifre comprensivo di numero di serie proveniente da un dispositivo di autenticazione di proprietà dell'utente. Per ulteriori informazioni sul versionamento con l'eliminazione MFA e su come acquistare e attivare un dispositivo di autenticazione, consulta la documentazione di Amazon S3.

Per ogni versione di un oggetto salvata o richiesta vengono addebitati i normali costi di Amazon S3. Ad esempio, esaminiamo il seguente scenario per illustrare i costi di archiviazione quando si utilizza il versionamento (supponiamo che il mese corrente duri 31 giorni): 1) Giorno 1 del mese: si esegue un PUT di 4 GB (4.294.967.296 byte) sul bucket.
2) Giorno 16 del mese: viene eseguita una richiesta PUT di 5 GB (5.368.709.120 byte) sullo stesso bucket tramite la stessa chiave usata il primo giorno del mese.

Durante l'analisi dei costi di storage per le operazioni descritte, è necessario tenere conto che l'oggetto da 4 GB caricato il primo giorno del mese non viene eliminato dal bucket quando l'oggetto da 5 GB viene aggiunto a metà mese. L'oggetto da 4 GB viene anzi conservato come versione precedente, mentre l'oggetto da 5 GB diventa la versione scritta più recente dello stesso oggetto nel bucket. Alla fine del mese: utilizzo totale in byte/ora
= [4.294.967.296 byte x 31 giorni x (24 ore al giorno)] + [5.368.709.120 byte x 16 giorni x (24 ore al giorno)] = 5.257.039.970.304 ore-byte. GB al mese totali
5.257.039.970.304 byte/ora x (1 GB/1.073.741.824 byte) x (1 mese/744 ore) = 6,581 GB al mese Il costo viene calcolato in base alle tariffe correnti per la tua regione nella pagina dei prezzi di Amazon S3.

Amazon S3 Object Lock è una caratteristica di Amazon S3 che impedisce l'eliminazione o la sovrascrittura della versione di un oggetto per un periodo di tempo fisso o indeterminato e che consente di applicare policy di conservazione come livello aggiuntivo di protezione dei dati o per adempiere alla conformità alle normative. È possibile migrare i carichi di lavoro dai sistemi WORM (Write-Once-Read-Many) esistenti in Amazon S3 e configurare S3 Object Lock a livello di oggetto e di bucket per prevenire l'eliminazione della versione di un oggetto prima della data di fine conservazione predefinita o a tempo indeterminato (date di fermo di legge). La protezione S3 Object Lock viene mantenuta indipendentemente dalla classe di storage in cui risiede la versione dell'oggetto e per tutte le transizioni del ciclo di vita di S3 tra le classi di storage. Si consiglia di usare S3 Object Lock se i requisiti normativi specificano che i dati devono essere protetti da WORM o se si desidera un ulteriore livello di protezione per i dati in Amazon S3. S3 Object Lock può aiutarti a soddisfare i requisiti normativi che stabiliscono di archiviare i dati in un formato non modificabile e a proteggere i dati da eliminazioni accidentali o dolose in Amazon S3.
Ulteriori informazioni sono disponibili nella Guida per l'utente di S3 Object Lock.

Amazon S3 Object Lock impedisce l'eliminazione della versione di un oggetto per la durata di un periodo di conservazione specificato o a tempo indeterminato fino alla revoca del fermo di legge. Con S3 Object Lock è possibile garantire che la versione di un oggetto sia immodificabile finché viene applicata la protezione WORM. È possibile applicare la protezione WORM assegnando la scadenza della conservazione o un fermo di legge alla versione di un oggetto, usando la console di gestione S3, l'API REST, la CLI o l'SDK di AWS. È possibile applicare le impostazioni di conservazione in una richiesta PUT o applicarle a un oggetto esistente dopo averlo creato. La scadenza della conservazione definisce il periodo di tempo durante il quale la versione di un oggetto non sarà modificabile. Se all'oggetto è stata assegnata una scadenza della conservazione, la versione non potrà essere modificata o eliminata fino alla data indicata. Se un utente cerca di eliminare un oggetto prima che sia trascorsa tale data, l'operazione non sarà consentita. In alternativa, è possibile rendere un oggetto non modificabile applicando un fermo di legge. Il fermo di legge impedisce la modifica o l'eliminazione della versione di un oggetto a tempo indeterminato finché non viene revocata esplicitamente. Per applicare o rimuovere il fermo di legge, l'account AWS deve avere l'autorizzazione in scrittura per l'operazione PutObjectLegalHold. Il fermo di legge può essere applicato a qualsiasi oggetto in un bucket abilitato per S3 Object Lock, indipendentemente dal fatto che l'oggetto sia protetto da WORM per un periodo di conservazione.
Per configurare S3 Object Lock è possibile scegliere tra due modalità. Se distribuiti in modalità di governance, gli account AWS con autorizzazioni IAM specifiche sono in grado di rimuovere la protezione WORM dalla versione di un oggetto. Qualora siano necessari requisiti di non modificabilità più severi per adempiere alle normative vigenti, è possibile usare a modalità di conformità. Nella modalità di conformità, la protezione WORM non può essere rimossa da alcun utente, neppure dall'account root.

No, non è possibile disabilitare S3 Object Lock o S3 Versioning per i bucket una volta abilitato S3 Object Lock.

Per iniziare a replicare oggetti con Replica da bucket con S3 Object Lock abilitato, è possibile aggiungere una configurazione di replica sul bucket di origine specificando un bucket di destinazione nella stessa Regione AWS o in una Regione AWS diversa e nello stesso account AWS o in uno diverso. È possibile scegliere di replicare tutti gli oggetti a livello di bucket S3 o filtrarli su un livello di prefisso condiviso o su uno di oggetto utilizzando i tag di oggetti S3. Inoltre, sarà necessario specificare un ruolo AWS Identity and Access Management (IAM) con le autorizzazioni necessarie per eseguire l'operazione di replica. È possibile utilizzare la console S3, l'API AWS, l'AWS CLI, gli SDK AWS o AWS CloudFormation per abilitare la replica ed è necessario che S3 Versioning sia abilitato sia per i bucket di origine che per quelli di destinazione. Inoltre, per replicare oggetti dai bucket abilitati per S3 Object Lock, è necessario che nel bucket di destinazione anche S3 Object Lock sia abilitato. Per ulteriori informazioni, consulta la documentazione sulla configurazione di Replica S3 e sull'utilizzo di S3 Object Lock con Replica S3.

Sì, per replicare oggetti dai bucket abilitati per S3 Object Lock è necessario concedere due nuove autorizzazioni, s3:GetObjectRetention e s3:GetObjectLegalHold, sul bucket di origine nel ruolo IAM utilizzato per configurare la replica. In alternativa, se il ruolo IAM dispone di un'autorizzazione S3:Get*, soddisfa il requisito. Per ulteriori informazioni, consulta la documentazione sull'utilizzo di S3 Object Lock con Replica S3.

No, tutte le funzionalità di S3 Replication, come la replica nella stessa Regione di S3 (S3 SRR), la replica tra Regioni di S3 (S3 CRR), le metriche di replica di S3 per tenere traccia dell'avanzamento, il controllo del tempo di replica di S3 (S3 RTC) e la replica in batch di S3, sono supportate durante la replica dai bucket S3 Object Lock.

È possibile utilizzare la replica in batch S3 per replicare oggetti esistenti da bucket abilitati per S3 Object Lock. Per ulteriori informazioni sulla replica di oggetti esistenti, consulta la documentazione sulla Replica in batch S3.

Classi di archiviazione

Apri tutto

Amazon S3 offre una gamma di classi di archiviazione che puoi scegliere in base ai requisiti di accesso ai dati, resilienza e costi dei tuoi carichi di lavoro. Le classi di archiviazione S3 sono costruite appositamente per fornire l’archiviazione più economica per diversi modelli di accesso. Le classi di archiviazione S3 sono ideali per qualsiasi caso d'uso, compresi quelli con esigenze di prestazioni impegnative, requisiti di residenza dei dati, modelli di accesso sconosciuti o variabili, o spazio di archiviazione. Ciascuna classe di archiviazione S3 prevede un costo per l'archiviazione dei dati e tariffe per l'accesso ai dati. Quando devi scegliere la classe di archiviazione S3 più adatta al tuo carico di lavoro, considera i modelli di accesso e il tempo di conservazione dei tuoi dati per ottimizzare il costo totale per tutta la vita utile dei dati.

Per la scelta della classe di archiviazione S3 più adatta al carico di lavoro, considera i modelli di accesso e il tempo di conservazione dei dati per ottimizzare il costo totale per tutto il ciclo di vita dei dati. Molti carichi di lavoro presentano modelli di accesso variabili (contenuto generato dagli utenti), imprevedibili (analisi, data lake) o sconosciuti (nuove applicazioni): ecco perché il Piano intelligente S3 dovrebbe essere la classe di archiviazione di default per risparmiare automaticamente sui costi di archiviazione. Se conosci i modelli di accesso dei tuoi dati, puoi seguire queste linee guida. La classi di archiviazione S3 Standard è l'ideale per i dati ad accesso frequente; si tratta della scelta migliore se si accede ai dati più di una volta al mese. S3 Standard-Infrequent Access è l'ideale per i dati mantenuti per almeno un mese e a cui si accede una volta al mese od ogni due mesi. Le classi di archiviazione di Amazon S3 Glacier sono dedicate all'archiviazione dei dati e forniscono le prestazioni migliori, la massima flessibilità in termini di recupero e il costo di archiviazione più basso nel cloud. Puoi scegliere fra tre classi di archiviazione ottimizzate a seconda dei modelli di accesso e della durata dell'archiviazione. Per i dati di archivio che richiedono l'accesso immediato, come le immagini mediche, le risorse della stampa o i dati sulla genomica, scegli la classe di archiviazione S3 Glacier Instant Retrieval, una classe di archiviazione che offre il recupero in millisecondi a un costo irrisorio. Per i dati di archivio che non richiedono l'accesso immediato ma per cui è necessaria la flessibilità per recuperare grandi set di dati a un costo irrisorio, come backup o casi d'uso di ripristino di emergenza, scegli S3 Glacier Flexible Retrieval, che eseguirà il recupero in pochi minuti oppure recuperi in massa gratuiti dalle 5 alle 12 ore. Per risparmiare ulteriormente sull'archiviazione a lungo termine come archivi di conformità e conservazione dei media digitali, scegli S3 Glacier Deep Archive, il servizio di archiviazione cloud più conveniente che ti permette di recuperare i dati entro 12 ore. Tutte queste classi di archiviazione offrono la resilienza su più zone di disponibilità archiviando i dati in modo ridondante su molteplici dispositivi e zone di disponibilità AWS fisicamente separate all'interno di una regione AWS.

Per i dati che presentano requisiti di resilienza inferiori, puoi ridurre i costi selezionando una classe di archiviazione a zona di disponibilità singola, ad esempio Accesso infrequente a zona unica S3. Se hai requisiti di isolamento o residenza dei dati che non possono essere soddisfatti da una regione AWS esistente, puoi utilizzare le classi di archiviazione S3 per le zone locali AWS dedicate o i rack S3 on Outposts per archiviare i tuoi dati in un perimetro specifico.

S3 Intelligent-Tiering

Apri tutto

S3 Intelligent-Tiering è la prima soluzione di archiviazione nel cloud che riduce i costi di archiviazione a livello di oggetto granulare spostando automaticamente i dati al livello di accesso più conveniente in base alla frequenza di accesso, senza impatto su prestazioni, tariffe di recupero o investimenti operativi. S3 Intelligent-Tiering offre prestazioni con latenza nell'ordine dei millisecondi e velocità effettiva elevata per dati ad accesso frequente, infrequente e raro nei livelli Frequent, Infrequent e Archive Instant Access. Al costo di una tariffa mensile modica per il monitoraggio e l'automazione degli oggetti, S3 Intelligent-Tiering monitora i modelli di accesso e sposta gli oggetti automaticamente da un livello all'altro. S3 Intelligent-Tiering non prevede costi di recupero, pertanto non si verificano aumenti imprevisti degli importi delle fatture relative all'archiviazione al cambiamento dei modelli di accesso. È possibile usare S3 Intelligent-Tiering come classe di archiviazione di default per qualsiasi carico di lavoro, in particolare per i data lake, l'analisi dei dati, il machine learning, le nuove applicazioni e i contenuti generati dagli utenti.

La classe di archiviazione Amazon S3 Intelligent-Tiering è progettata per ottimizzare i costi di archiviazione attraverso lo spostamento automatico dei dati nel livello di accesso più conveniente, quando si verifica un cambiamento nei modelli di accesso. Al costo di una tariffa mensile modica per il monitoraggio e l'automazione degli oggetti, S3 Intelligent-Tiering monitora i modelli di accesso e sposta automaticamente gli oggetti a cui non è stato effettuato l'accesso per trenta giorni consecutivi nel livello Infrequent Access per risparmiare fino al 40% sui costi di archiviazione. Dopo novanta giorni consecutivi senza accesso, gli oggetti vengono spostati nel livello Archive Instant Access per risparmiare fino al 68% sui costi di archiviazione. S3 Intelligent-Tiering non influisce sulle prestazioni e non prevede costi di recupero. Se successivamente viene effettuato l'accesso a un oggetto nel livello Infrequent Access o Archive Instant Access, l'oggetto viene ritrasferito automaticamente nel livello Frequent Access. Per ottenere il costo di archiviazione minimo sui dati a cui è consentito l'accesso asincrono, si può scegliere di attivare ulteriori funzionalità di archiviazione. Una volta abilitato un livello di accesso all'archivio asincrono oppure entrambi, S3 Intelligent-Tiering sposterà gli oggetti a cui non è stato effettuato l'accesso per un minimo di novanta giorni nel livello Archive Access per risparmiare fino al 71% e, dopo centottanta giorni senza accesso, nel livello Deep Archive Access per risparmiare fino al 95% per gli oggetti a cui si accede raramente. Se in seguito viene ripristinato, un oggetto nei livelli opzionali Archive o Deep Access viene spostato nuovamente nel livello Frequent Access e, prima di poterlo recuperare, è necessario ripristinarlo usando RestoreObject. Per informazioni sul ripristino di oggetti archiviati, consulta Ripristino di oggetti archiviati. In S3 Intelligent-Tiering non sono previsti costi di recupero. Lo spostamento di oggetti tra i livelli di accesso all'interno della classe di archiviazione S3 Intelligent-Tiering non comporta l'applicazione di costi di livello o del ciclo di vita aggiuntivi.

S3 Intelligent-Tiering non prevede una dimensione minima degli oggetti, ma gli oggetti più piccoli di 128 KB non sono idonei per l'assegnazione di livelli automatica. È possibile archiviare tali oggetti di dimensioni inferiori in S3 Intelligent-Tiering, ma si applicheranno sempre le tariffe del livello di Frequent Access e non quelle per monitoraggio e automazione. Se desideri standardizzare S3 Intelligent-Tiering come classe di archiviazione di default per i dati appena creati, puoi modificare le applicazioni specificando INTELLIGENT-TIERING nell'header di richiesta dell'API PUT S3. S3 Intelligent-Tiering è progettata per garantire una disponibilità del 99,9% e una durabilità del 99,999999999%; allo stesso tempo, offre automaticamente le stesse prestazioni con bassa latenza e velocità effettiva elevata della classe S3 Standard. Puoi usare AWS Cost Explorer per misurare i risparmi aggiuntivi rispetto al livello Archive Instant Access.

È possibile usare S3 Intelligent-Tiering come classe di archiviazione di default per qualsiasi carico di lavoro, in particolare per i data lake, l'analisi dei dati, il machine learning, le nuove applicazioni e i contenuti generati dagli utenti. S3 Intelligent-Tiering è la prima soluzione di archiviazione nel cloud che riduce i costi di archiviazione a livello di oggetto granulare spostando automaticamente i dati al livello di accesso più conveniente in base alla frequenza di accesso, senza impatto su prestazioni, tariffe di recupero o investimenti operativi. Se disponi di dati con modelli di accesso sconosciuti o variabili, tra cui data lake, analisi dei dati e nuove applicazioni, consigliamo l'uso di S3 Intelligent-Tiering. Se disponi di dati che non richiedono il recupero immediato, consigliamo di attivare il livello Deep Archive Access, che prevede il modico costo di 1 USD per TB al mese per i dati a cui si prevede di accedere raramente in periodi di tempo lunghi. S3 Intelligent-Tiering è indicato per i dati con modelli di accesso sconosciuti o variabili. L'uso della classe di archiviazione S3 Intelligent-Tiering non prevede l'addebito di tariffe per il recupero.

S3 Intelligent-Tiering ottimizza automaticamente i costi di archiviazione senza incidere sulle prestazioni. I livelli di accesso Frequent, Infrequent e Archive Instant Access di S3 Intelligent-Tiering offrono prestazioni con latenza nell'ordine dei millisecondi e throughput elevato.

Per i dati che consentono l'accesso asincrono, il livello opzionale Archive Access ha le stesse prestazioni di S3 Glacier Flexible Retrieval, mentre il livello Deep Archive Access ha le stesse prestazioni della classe di archiviazione S3 Glacier Deep Archive. È consigliabile attivare le funzionalità di archivio asincrono soltanto se l'applicazione può attendere da minuti a ore. Se l'oggetto da recuperare è archiviato nei livelli Archive o Deep Archive Access, prima di recuperarlo, dovrai ripristinare un oggetto usando RestoreObject. Per informazioni sul ripristino di oggetti archiviati, consulta Ripristino di oggetti archiviati. Gli oggetti del livello Archive Access vengono spostati nel livello Frequent Access in un lasso di tempo dalle 3 alle 5 ore, mentre quelli del livello Deep Archive Access entro 12 ore. Se hai bisogno di accedere più rapidamente a un oggetto nel livello di accesso Archive, puoi pagare il recupero più rapido utilizzando la console per selezionare l'opzione velocità di recupero maggiore.

S3 Intelligent-Tiering è progettato per avere la stessa durabilità (99,999999999%) della classe di archiviazione S3 Standard. S3 Intelligent-Tiering è progettato per fornire il 99,9% di disponibilità ed è coperto da un contratto sul livello di servizio che offre al cliente dei crediti se durante un ciclo di fatturazione la disponibilità è inferiore a quella dichiarata.

Sono disponibili due metodi per ottenere i dati in S3 Intelligent-Tiering. Puoi effettuare il PUT direttamente in S3 Intelligent-Tiering specificando INTELLIGENT_TIERING nell'intestazione x-amz-storage-class o impostando le policy del ciclo di vita per eseguire la transizione degli oggetti da S3 Standard o S3 Standard-IA a S3 INTELLIGENT_TIERING.

I costi di S3 Intelligent-Tiering dipendono dall'archiviazione mensile, dalle richieste e dal trasferimento dei dati. È inoltre previsto un costo mensile modico per il monitoraggio e l'automazione dei singoli oggetti. La classe di archiviazione S3 Intelligent-Tiering archivia automaticamente gli oggetti in tre livelli di accesso: un livello Frequent Access al costo delle tariffe di archiviazione di S3 Standard, un livello Infrequent Access al costo delle tariffe di archiviazione di S3 Standard - Infrequent Access e un livello Archive Instant Access al costo delle tariffe di archiviazione di S3 Glacier Instant Retrieval. Inoltre, S3 Intelligent-Tiering offre due livelli di archiviazione opzionali progettati per l'accesso asincrono: un livello Archive Access al costo delle tariffe di archiviazione di S3 Glacier Flexible Retrieval e un livello Deep Archive Access al costo delle tariffe di archiviazione di S3 Glacier Deep Archive.

Pagando una tariffa di monitoraggio e automazione contenuta, S3 Intelligent-Tiering monitora i modelli di accesso e sposta automaticamente gli oggetti fra livelli di accesso a bassa latenza e velocità effettiva elevata, nonché fra due livelli di accesso all'archivio asincrono opzionali in cui i clienti ottengono i costi più bassi di archiviazione nel cloud per i dati che ammettono l'accesso asincrono.

S3 Intelligent-Tiering non prevede una dimensione minima degli oggetti fatturabile, ma gli oggetti più piccoli di 128 KB non sono idonei per l'assegnazione di livelli automatica. Questi oggetti di piccole dimensioni non saranno monitorati e saranno applicate le tariffe del livello Frequent Access, senza costi per monitoraggio e automazione. Per ogni oggetto archiviato nei livelli Archive Access o Deep Archive Access in S3 Intelligent-Tiering, Amazon S3 usa 8 KB di archiviazione per il nome dell'oggetto e altri metadati (fatturati alle tariffe di archiviazione di S3 Standard) e 32 KB di archiviazione per l'indice e i relativi metadati (fatturati alle tariffe di archiviazione di S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive).

No. S3 Intelligent-Tiering non prevede costi di recupero. S3 Intelligent-Tiering monitora i modelli di accesso dei dati e se si accede a un oggetto nei livelli Infrequent Access, Archive Instant Access o di archivio asincrono, S3 Intelligent-Tiering lo sposta automaticamente nel livello Frequent Access.

Per accedere a un oggetto nei livelli di accesso Archive o Deep Archive, devi emettere una richiesta di ripristino e l'oggetto inizierà a tornare nel livello di accesso frequente, sempre nella classe di storage S3 Intelligent-Tiering. Gli oggetti del livello di accesso Archive vengono spostati nel livello di Accesso frequente in 3-5 ore, mentre gli oggetti del livello Deep Archive entro 12 ore. Quando gli oggetti sono di nuovo nel livello Frequent Access, puoi inviare una richiesta GET per recuperarli.

Puoi usare Inventario Amazon S3 per segnalare il livello di accesso degli oggetti archiviati nella classe di archiviazione S3 Intelligent-Tiering. Amazon S3 Inventory genera file di output CSV, ORC o Parquet che elencano i tuoi oggetti e i metadati corrispondenti giornalmente o settimanalmente per un bucket S3 o un prefisso condiviso. Inoltre, è possibile effettuare una richiesta HEAD sugli oggetti per riportare i livelli di accesso Archive di S3 Intelligent-Tiering.

Sì. È possibile modificare il ciclo di vita degli oggetti dai livelli Frequent Access, Infrequent e Archive Instant Access di S3 Intelligent-Tiering a S3 One-Zone Infrequent Access, S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive. Inoltre, puoi modificare il ciclo di vita degli oggetti dai livelli di accesso Archive opzionali di S3 Intelligent-Tiering a S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive, così come dal livello Deep Archive Access di S3 Intelligent-Tiering a S3 Glacier Deep Archive.

No. La classe di archiviazione di S3 Intelligent-Tiering non prevede una durata di archiviazione minima.

No. La classe di archiviazione di S3 Intelligent-Tiering non prevede una dimensione minima degli oggetti fatturabile, ma gli oggetti più piccoli di 128 KB non sono idonei per il tiering automatico. A questi oggetti di piccole dimensioni saranno applicate le tariffe del livello Frequent Access, senza costi per monitoraggio e automazione. Per ogni oggetto archiviato nei livelli opzionali Archive Access e Deep Archive Access in S3 Intelligent-Tiering, Amazon S3 usa 8 KB di archiviazione per il nome dell'oggetto e altri metadati (fatturati alle tariffe di archiviazione di S3 Standard) e 32 KB di archiviazione per l'indice e i relativi metadati (fatturati alle tariffe di archiviazione di S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive). Per ulteriori dettagli, visita la pagina dei prezzi di Amazon S3.

S3 Standard

Apri tutto

Amazon S3 Standard è una soluzione di archiviazione durevole che offre prestazioni con latenza nell'ordine dei millisecondi e throughput elevato per i dati ad accesso frequente, in genere superiore a una volta al mese. S3 Standard è progettata per i casi d'uso in cui le prestazioni sono fondamentali, ad esempio data lake, applicazioni native per il cloud, website dinamici, distribuzione di contenuti, applicazioni per dispositivi mobili e per il gaming, analisi dei dati e modelli di machine learning. S3 Standard è progettata per offrire una disponibilità dei dati pari al 99,99% e una durabilità del 99,999999999% degli oggetti su più zone di disponibilità in un determinato anno. Si possono usare policy del ciclo di vita di S3 per controllare con precisione quando i dati vengono trasferiti fra S3 Standard e classi di archiviazione a costo inferiore senza modifiche all'applicazione.

S3 Standard è l'ideale per i dati a cui si accede o che si modificano più di frequente, per i quali sono necessari l'accesso entro millisecondi e un throughput elevato. S3 Standard è la soluzione migliore per i dati frequentemente sottoposti a lettura o scrittura, in quanto non prevede costi di recupero. Per questo motivo, S3 Standard è una classe ottimizzata per un'ampia gamma di casi d'uso, ad esempio data lake, applicazioni native per il cloud, siti Web dinamici, distribuzione di contenuti, applicazioni per dispositivi mobili e di gioco e analisi dei dati.

S3 Express One Zone

Apri tutto

Amazon S3 Express One Zone è una classe di archiviazione Amazon S3 ad alte prestazioni e a disponibilità singola creata appositamente per fornire un accesso coerente ai dati in millisecondi per le applicazioni più sensibili alla latenza dei clienti. Amazon S3 Express One Zone è la classe di archiviazione di oggetti cloud con la latenza più bassa attualmente disponibile, con una velocità di accesso ai dati fino a 10 volte superiore e con costi di richiesta più bassi del 80% rispetto ad Amazon S3 Standard. Con S3 Express One Zone, è possibile selezionare una specifica zona di disponibilità AWS all'interno di una Regione AWS per l'archiviazione dei dati. È possibile scegliere di co-localizzare l'archiviazione con le risorse di calcolo nella stessa zona di disponibilità per ottimizzare ulteriormente le prestazioni.

S3 Express One Zone è la classe di archiviazione ideale per le applicazioni che richiedono la massima velocità di accesso ai dati e le massime prestazioni per applicazioni sensibili alla latenza. S3 Express One Zone è la migliore classe di archiviazione per operazioni ad alta intensità di richieste, come l'addestramento e l'inferenza di machine learning (ML), l'analisi interattiva e la creazione di contenuti multimediali.

È possibile iniziare creando un bucket di directory S3 in una zona di disponibilità (AZ) AWS a scelta. È possibile scegliere di co-localizzare l'archiviazione e le risorse di calcolo nella stessa AZ per ottimizzare ulteriormente le prestazioni. Per impostazione predefinita, i bucket di directory hanno il Block dell'accesso pubblico S3 attivo. Dopo aver creato il bucket di directory, è possibile caricare oggetti direttamente nella classe di archiviazione S3 Express One Zone o copiarli su S3 Express One Zone dalle classi di archiviazione S3 esistenti. Inoltre, è possibile importare i dati con un solo clic nella Console di gestione AWS su S3 Express One Zone o utilizzare Operazioni in batch S3 per copiare su S3 Express One Zone un intero bucket, prefisso o sottoinsiemi di dati da una classe di archiviazione S3 esistente.

È possibile importare i dati dalla stessa Regione AWS nella classe di archiviazione S3 Express One Zone tramite la console S3 utilizzando l'opzione Importa dopo aver creato un bucket di directory. L'importazione semplifica la copia dei dati nei bucket di directory S3 consentendo di scegliere un prefisso o un bucket da cui importare i dati senza dover specificare singolarmente tutti gli oggetti da copiare. S3 Batch Operations copia gli oggetti nel prefisso o nel bucket per uso generico selezionato; è possibile monitorare lo stato di avanzamento del processo di copia di importazione tramite la relativa pagina dei dettagli.

Gli oggetti di S3 Express One Zone sono archiviati in un'unica zona di disponibilità (AZ) AWS a scelta. L'archiviazione degli oggetti in una zona consente di archiviare i dati localmente nel computer per ridurre al minimo la latenza. È possibile accedere ai dati da tutte le zone di disponibilità, anche se la latenza aumenterà.

S3 Express One Zone offre un'elasticità delle prestazioni simile a quella delle altre classi di archiviazione S3, ma con latenze di millisecondi a una cifra per richieste di latenza di lettura e scrittura costanti al primo byte, fino a 10 volte più veloci rispetto alle classi di archiviazione S3 esistenti. Con S3 Express One Zone, i clienti non devono pianificare o fornire in anticipo i requisiti di capacità o di velocità di trasmissione effettiva e beneficiano immediatamente del completamento più rapido delle richieste fino a un certo ordine di grandezza. S3 Express One Zone è ideale per i lavori di analisi in cui la latenza di archiviazione accelera i tempi di completamento dei lavori e riduce il costo totale di proprietà (TCO) complessivo. È ideale anche per carichi di lavoro interattivi, come l'editing video, in cui i professionisti creativi hanno bisogno dell'accesso più reattivo possibile ai dati S3.

S3 Express One Zone utilizza un'architettura unica per ottimizzare le prestazioni e offrire una latenza delle richieste costantemente bassa. S3 Express One Zone archivia i dati su hardware ad alte prestazioni e il suo protocollo a oggetti è stato migliorato per semplificare l'autenticazione e il sovraccarico dei metadati. Inoltre, per aumentare ulteriormente la velocità di accesso e supportare fino a 2 milioni di richieste al secondo, i dati vengono archiviati in un nuovo tipo di bucket - un bucket di directory Amazon S3. Con S3 Express One Zone, è possibile selezionare una specifica zona di disponibilità AWS all'interno di una Regione AWS per l'archiviazione dei dati. È possibile scegliere di co-localizzare l'archiviazione con le risorse di calcolo nella stessa zona di disponibilità per ottimizzare ulteriormente le prestazioni.

Ogni bucket di directory S3 può supportare fino a 2 milioni di operazioni di lettura e fino a 200.000 operazioni di scrittura al secondo per bucket di directory S3, indipendentemente dal numero di directory all'interno del bucket. Per impostazione predefinita, ogni bucket di directory S3 supporta fino a 200.000 operazioni di lettura e fino a 100.000 operazioni di scrittura al secondo. Se il carico di lavoro richiede un valore superiore ai limiti TPS predefiniti, è possibile richiederne un aumento tramite Supporto AWS.

I bucket di directory S3 che non hanno attività di richiesta per un periodo di almeno 3 mesi passeranno a uno stato inattivo. Mentre è in uno stato inattivo, un bucket di directory è temporaneamente inaccessibile per le letture e le scritture. I bucket inattivi conservano tutto lo storage, i metadati degli oggetti e i metadati dei bucket. Le tariffe di archiviazione esistenti verranno applicate ai bucket inattivi. In caso di richiesta di accesso a un bucket inattivo, il bucket passerà a uno stato attivo, in genere entro pochi minuti. Durante questo periodo di transizione, le operazioni di lettura e scrittura restituiranno un codice di errore 503 SlowDown.

S3 Express One Zone offre un throughput elastico ed elevato simile a quella delle altre classi di archiviazione Amazon S3. S3 Express One Zone è progettato da zero per consentire ai singoli clienti di portare la velocità di trasmissione effettiva a livelli aggregati molto elevati. Ad esempio, le applicazioni di addestramento dei modelli di machine learning possono essere addestrate su milioni di oggetti e petabyte di dati. È possibile ottenere le massime prestazioni distribuendo queste richieste su connessioni separate per massimizzare la larghezza di banda accessibile.

Con S3 Express One Zone, le richieste vengono autenticate e autorizzate tramite un nuovo meccanismo basato sulle sessioni, S3 CreateSession, ottimizzato per fornire la latenza più bassa. È possibile utilizzare CreateSession per richiedere credenziali temporanee che forniscono un accesso a bassa latenza al bucket. Queste credenziali temporanee sono assegnate a un bucket di directory S3 specifico. Per ulteriori informazioni su questo modello basato su sessioni, consulta S3 Create Session nella guida per gli sviluppatori.

S3 Express One Zone è progettato per offrire una disponibilità del 99,95% all'interno di una singola zona di disponibilità, con un accordo sul livello di servizio (SLA) di disponibilità del 99,9%.

Con S3 Express One Zone, i dati vengono archiviati in modo ridondante su più dispositivi all'interno di una singola zona di disponibilità. Il servizio è stato concepito per far fronte al guasto concomitante di più dispositivi, rilevando e riparando rapidamente l'eventuale ridondanza persa. Ciò significa che S3 Express One Zone sposta automaticamente le richieste ai nuovi dispositivi all'interno di una zona di disponibilità se il dispositivo esistente riscontra un guasto. Questa ridondanza consente l'accesso ininterrotto ai dati all'interno di una zona di disponibilità.

L'utilizzo di S3 Express One Zone non richiede alcun impegno di lungo termine né costi di configurazione. S3 Express One Zone addebita i costi per archiviazione e richieste. Il volume di archiviazione fatturato in un mese viene accumulato in base all'archiviazione totale utilizzata all'ora, misurata in gigabyte al mese (GB/mese). Inoltre, viene addebitata una tariffa per richiesta per l'accesso in base al tipo di richiesta, come PUT e GET. È previsto un costo aggiuntivo per GB per il caricamento e il recupero dei dati. Esempio 1:
Supponiamo di archiviare 10 GB di dati su S3 Express One Zone per 30 giorni, per un totale di 1.000.000 di scritture e 9.000.000 di letture, accedendo con Athena con una richiesta di 10 KB. Poi, eliminiamo 1.000.000 di file entro il termine di 30 giorni. Supponendo che il bucket si trovi nella Regione Stati Uniti orientali (Virginia settentrionale), il costo delle richieste è il seguente: Costi di archiviazione
Consumo totale di bite/ora = 10 GB/mese
Costo totale di archiviazione = 10 GB al mese x 0,11 USD = 1,10 USD di costi di richiesta
1.000.000 di richieste PUT: 1.000.000 di richieste x 0,00113 USD/1.000 = 1,13 USD
9.000.000 di richieste GET: 9.000.000 di richieste x 0,00003 USD/1.000 = 0,27 USD
1.000.000 di richieste DELETE = 1.000.000 di richieste x 0,00 USD (senza costi) = 0 USD Costo di caricamento dati: 10 KB/1.048.576 x 1.000.000 x 0,0032 USD = 0,03 USD
Costo per il recupero dei dati: 10 KB/1.048.576 x 9.000.000 x 0,0006 USD = 0,05 USD
Spese totali = 1,10 USD + 1,13 USD + 0,27 USD + 0,03 USD + 0,05 USD = 2,58 USD Esempio 2:
Supponiamo di archiviare 10 TB di dati per l'addestramento del machine learning per un carico di lavoro di 8 ore al giorno per poi eliminarli. Durante il carico di lavoro di 8 ore, effettuiamo 5.242.880 scritture e 10.485.760 letture per una richiesta di 2 MB. Supponiamo di farlo per 30 giorni (un mese). Costi di archiviazione
Utilizzo totale di byte/ora = [10.995.116.277.760 byte x 30 giorni x (8 ore/giorno)] = 2.638.827.906.662.400 byte/ora = 3.303,77 GB/mese
Costo totale di archiviazione = 3303,77 GB x 0,11 USD = 363,41 USD Costi di richiesta
5.242.880 richieste PUT al giorno: 5.242.880 richieste x 30 x 0,00113 USD/1.000 = 177,73 USD
10.485.760 richieste GET al giorno: 10.485.760 richieste x 30 x 0,00003 USD/1,000 = 9,44 USD
5.242.880 richieste DELETE al giorno: 5.242.880 richieste x 0,00 USD (nessun costo) = 0 USD Costo di caricamento dati: 2 MB/1024 x 5.242.880 x 30 x 0,0032 USD = 983,04 USD
Costo per il recupero dei dati: 2 MB/1024 x 10.485.760 x 30 x 0,0006 USD = 368,64 USD
Costi totali = 363,41 USD + 177,73 USD + 9,44 USD + 983,04 USD + 368,64 USD = 1.902,26 USD

I costi di richiesta per accedere ai dati su S3 Express One Zone includono i costi per il trasferimento dei dati all'interno della rete AWS in una Regione e non sono previsti costi aggiuntivi per il trasferimento di dati tra Amazon EC2 (o qualsiasi servizio AWS) ed S3 Express One Zone all'interno della stessa Regione, come per esempio i dati trasferiti all'interno della Regione Stati Uniti orientali (Virginia settentrionale).

I costi di richiesta per l'accesso ai dati su S3 Express One Zone includono i costi per l'utilizzo degli endpoint VPC del gateway e non sono previsti costi aggiuntivi per l'utilizzo degli endpoint Gateway con S3 Express One Zone.

Accesso Infrequente S3 Standard (AI S3 Standard)

Apri tutto

Accesso Infrequente Amazon S3 Standard (AI S3 Standard) è una classe di archiviazione di Amazon S3 per i dati a cui si accede con minore frequenza, ma che necessitano di risposta rapida in caso di necessità. La classe S3 Standard-IA offre durabilità e velocità effettiva elevate, nonché la bassa latenza della classe di archiviazione Amazon S3 Standard, con un costo di archiviazione per GB e una tariffa di recupero dei dati inferiori. Questa combinazione di costi ridotti e prestazioni elevate rendono S3 Standard-IA la soluzione ideale per archiviazione a lungo termine, backup e datastore per il ripristino di emergenza. La classe di archiviazione AI S3 Standard è configurata a livello di oggetto e può coesistere nello stesso bucket insieme alle classi S3 Standard o AI a zona unica S3, consentendo l'impiego di policy del ciclo di vita con cui trasferire automaticamente gli oggetti da una classe a un'altra senza dover apportare modifiche alle applicazioni.

La classe S3 Standard-IA è la soluzione ideale per i dati a cui si accede con minore frequenza, ma che necessitano di risposta rapida in caso di necessità. È uno strumento ideale per l'archiviazione di file a lungo termine e il salvataggio di dati provenienti da condivisioni e sincronizzazioni e altri dati obsoleti.

S3 Standard-IA offre prestazioni di latenza nell'ordine dei millisecondi e throughput elevato identiche a quelle della classe di archiviazione S3 Standard.

Sono disponibili due metodi per caricare dati nella classe AI S3 Standard. Il primo consiste nel creare richieste PUT direttamente in S3 Standard-IA specificando STANDARD_IA nell'intestazione x-amz-storage-class. Il secondo prevede l'impostazione di policy sul ciclo di vita con cui trasferire gli oggetti dalla classe S3 Standard alla classe di archiviazione AI S3 Standard.

Saranno addebitati costi per una richiesta COPY S3 Standard (classe di archiviazione di destinazione) e un recupero di dati S3 Standard-IA (classe di archiviazione di origine). Per ulteriori informazioni, consulta la pagina dei prezzi di Amazon S3.

La classe AI S3 Standard è progettata per l'archiviazione a lungo termine di dati a cui si accede con minore frequenza e che è necessario conservare per mesi o anni. Ai dati eliminati da S3 Standard-IA entro trenta giorni sarà applicata la tariffa intera di trenta giorni. Per informazioni sui prezzi di AI S3 Standard, consulta la pagina dei prezzi di Amazon S3.

La classe AI S3 Standard è stata progettata per il salvataggio di oggetti di grandi dimensioni e prevede una tariffa minima per lo storage di oggetti corrispondente a 128 KB. Agli oggetti di dimensioni inferiori a 128 KB sarà applicata una tariffa di archiviazione pari a quella degli oggetti da 128 KB. Ad esempio, a un oggetto di 6 KB nella classe di archiviazione S3 Standard-IA sarà applicata la normale tariffa per i 6 KB di archiviazione e una tariffa aggiuntiva per gli oggetti di dimensioni inferiore pari a 122KB al costo di archiviazione di S3 Standard-IA. Per informazioni sui prezzi di AI S3 Standard, consulta la pagina dei prezzi di Amazon S3.

Sì. Oltre che per trasferire gli oggetti da S3 Standard a S3 Standard-IA, è possibile impostare policy del ciclo di vita per spostare di livello gli oggetti da S3 Standard-IA a S3 One Zone-IA, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval e alla classe di archiviazione S3 Glacier Deep Archive.

Accesso infrequente a zona unica S3 (AI a zona unica S3)

Apri tutto

La classe di archiviazione AI a zona unica S3 è una classe di archiviazione di Amazon S3 che permette ai clienti di memorizzare gli oggetti in una singola zona di disponibilità. In questo modo, pur utilizzando strumenti di ridondanza, il costo dell'archiviazione risulta minore del 20% rispetto ai servizi che offrono ridondanza su più zone separate, ad esempio S3 Standard-IA. La classe di archiviazione S3 One Zone-IA offre una disponibilità del 99% secondo il contratto sul livello di servizio e una durabilità del 99,999999999% all'interno della zona di disponibilità scelta. Tuttavia, i dati nella classe di archiviazione S3 One Zone-IA non sono resilienti alla perdita fisica di un'intera zona di disponibilità. S3 One Zone-IA offre le stesse caratteristiche offerte dalle classi S3 Standard e S3 Standard-IA e può essere usata mediante l'API, la CLI e la console Amazon S3. La classe di storage S3 One Zone-IA è configurata a livello di oggetto e può coesistere nello stesso bucket insieme alle classi S3 Standard ed S3 Standard-IA. Per trasferire oggetti in modo automatico da una classe di archiviazione a un'altra senza apportare modifiche alle applicazioni, è possibile utilizzare le policy sul ciclo di vita di S3.

La classe di archiviazione S3 One Zone-IA è consigliata per lo storage di contenuti a cui non si accede in modo frequente, ad esempio copie di backup o di disaster recovery e altri dati che è possibile ricreare con facilità.

La classe di archiviazione S3 One Zone-IA offre prestazioni di latenza e throughput identiche a quelle delle classi di archiviazione S3 Standard e S3 Standard-IA

La classe di archiviazione S3 One Zone-IA è progettata per garantire una durabilità del 99,999999999% all'interno di una zona di disponibilità. Tuttavia, i dati nella classe di archiviazione S3 One Zone-IA non sono resilienti alla perdita di disponibilità o alla perdita fisica di una zona di disponibilità. Le classi di archiviazione S3 Standard, S3 Intelligent-Tiering, S3 Standard - Infrequent Access e S3 Glacier, invece, sono in grado di superare la perdita di disponibilità o l'eliminazione di una zona di disponibilità. La classe S3 One Zone-IA offre durabilità e disponibilità paragonabili, se non migliori, alla maggior parte dei data center fisici moderni, oltre a una maggiore elasticità di archiviazione e al pacchetto di caratteristiche di Amazon S3.

Sì. Ogni regione AWS si trova in un'area geografica differente. Ciascuna regione dispone di diverse zone di utilizzo isolate, note come zone di disponibilità. La classe di archiviazione Amazon S3 One Zone-IA impiega una sola zona di disponibilità all'interno di una regione AWS.

Ciascuna zona di disponibilità impiega fonti di alimentazione e connessioni di rete ridondanti. All'interno di una regione AWS, le zone di disponibilità si trovano in aree soggette a diversi gradi di rischio per quanto riguarda inondazioni e terremoti, e sono distanti tra loro per evitare che siano soggette ad esempio a grandi incendi. La classi S3 Standard e S3 Standard-IA offrono protezione da questo genere di eventi perché archiviano i dati in modo ridondante su più zone di disponibilità. S3 One Zone-IA offre protezione dal guasto dell'apparecchiatura all'interno di una zona di disponibilità, ma i dati non sono resilienti alla perdita fisica della zona di disponibilità dovuta a calamità come terremoti o alluvioni. Le opzioni S3 One Zone-IA, S3 Standard e S3 Standard-IA permettono di scegliere la classe di archiviazione più adatta alle singole esigenze di durabilità e disponibilità.

Classe di archiviazione Amazon S3 Glacier Instant Retrieval

Apri tutto

La classe di archiviazione S3 Glacier Instant Retrieval offre l'archiviazione al costo minore per i dati di lunga durata a cui si accede raramente e che richiedono il recupero entro millisecondi. S3 Glacier Instant Retrieval offre l'accesso più veloce allo spazio di archiviazione, con la stessa velocità effettiva e lo stesso accesso entro millisecondi delle classi di archiviazione S3 Standard e S3 Standard-IA. S3 Glacier Instant Retrieval è progettata per offrire il 99,999999999% (undici nove) di durata dei dati e il 99,9% di disponibilità archiviando in modo ridondante i dati in un minimo di tre zone di disponibilità AWS fisicamente separate.

S3 Glacier Instant Retrieval è l'ideale se si dispone di dati a cui si accede raramente (una volta a trimestre) e che richiedono il recupero entro millisecondi. È la classe di archiviazione ideale se si cercano le stesse prestazioni con bassa latenza e throughput elevato di S3 Standard-IA, ma si desidera archiviare i dati a cui si accede meno frequentemente rispetto a S3 Standard-IA, con un prezzo di archiviazione inferiore e costi di accesso ai dati leggermente superiori.

La classe S3 Glacier Instant Retrieval è progettata per offrire una durabilità del 99,999999999% (undici nove) e una disponibilità del 99,9%, in modo analogo a S3 Standard-IA, e dispone di un Accordo sul Livello di Servizio (SLA) che garantisce crediti sul servizio se la disponibilità è inferiore al 99% in qualsiasi ciclo di fatturazione.

S3 Glacier Instant Retrieval offre prestazioni di latenza nell'ordine dei millisecondi e throughput elevato identici a quelli delle classi di archiviazione S3 Standard e AI S3 Standard. A differenza delle classi di archiviazione S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive, che sono progettate per l'accesso asincrono, è necessario inviare una richiesta di ripristino per poter accedere ad un oggetto archiviato in S3 Glacier Instant Retrieval.

Esistono due modi per inserire i dati in S3 Glacier Instant Retrieval. Il primo consiste nel creare richieste PUT direttamente in S3 Glacier Instant Retrieval specificando GLACIER_IR nell'header x-amz-storage-class. Il secondo prevede di impostare le policy del ciclo di vita di S3 affinché gli oggetti siano trasferiti da S3 Standard o S3 Standard-IA a S3 Glacier Instant Retrieval.

La classe S3 Glacier Instant Retrieval è progettata per l'archiviazione a lungo termine di dati a cui si accede raramente e che è necessario conservare per mesi o anni. Gli oggetti archiviati in S3 Glacier Instant Retrieval hanno un minimo di novanta giorni di archiviazione e gli oggetti eliminati, sovrascritti o trasferiti prima di tale termine comportano un addebito proporzionale pari al costo di archiviazione per i giorni rimanenti. Per informazioni sui prezzi di Amazon S3 Glacier Instant Retrieval, consulta la pagina dei prezzi di Amazon S3.

S3 Glacier Instant Retrieval è progettato per oggetti di grandi dimensioni e prevede un costo per l'archiviazione di oggetti con dimensione minima di 128 KB. Agli oggetti di dimensioni inferiori a 128 KB sarà applicata una tariffa di archiviazione pari a quella degli oggetti da 128 KB. Ad esempio, a un oggetto di 6 KB in S3 Glacier Instant Retrieval saranno applicate le tariffe di archiviazione di S3 Glacier Instant Retrieval per 6 KB e un costo per dimensione minima di un oggetto pari a 122 KB al prezzo di archiviazione di S3 Glacier Instant Retrieval. Per informazioni sui prezzi di Amazon S3 Glacier Instant Retrieval, consulta la pagina dei prezzi di Amazon S3.

S3 Glacier Instant Retrieval prevede un addebito per l'archiviazione mensile, le richieste in base al tipo di richiesta e i recuperi di dati. Il volume di archiviazione fatturato in un mese si basa sulla media dell'archiviazione usata nel mese di riferimento, misurata in gigabyte al mese (GB-mese). Le richieste vengono addebitate in base al tipo, ad esempio PUT, COPY e GET. È inoltre previsto il pagamento di una tariffa a GB per ogni gigabyte di dati restituiti all'utente.

Classe di archiviazione Amazon S3 Glacier Flexible Retrieval

Apri tutto

La classe di archiviazione S3 Glacier Flexible Retrieval offre archiviazione a basso costo, fino al 10% in meno (rispetto a S3 Glacier Instant Retrieval), per dati di archivio a cui si accede una o due volte all'anno e che vengono recuperati in modo asincrono, con recuperi di tipo Bulk gratuiti. Per i dati di archivio che non richiedono l'accesso immediato ma per cui è necessaria la flessibilità per recuperare grandi set di dati a costo zero, come backup o casi d'uso di ripristino di emergenza, S3 Glacier Flexible Retrieval è la classe di archiviazione ideale. S3 Glacier Flexible Retrieval offre le opzioni di recupero più flessibili in assoluto, che bilanciano i costi con tempi di accesso compresi tra minuti e ore e recuperi di tipo Bulk gratuiti. È una soluzione ideale per il backup, il ripristino di emergenza, le esigenze di archiviazione dati fuori sede e nelle occasioni in cui alcuni dati devono essere recuperati entro pochi minuti senza il pensiero dei costi. S3 Glacier Flexible Retrieval è progettata per offrire il 99,999999999% (undici nove) di durata dei dati e il 99,99% di disponibilità archiviando in modo ridondante i dati in più zone di disponibilità AWS fisicamente separate in un dato anno.

Per i dati di archivio che non richiedono l'accesso immediato ma per cui è necessaria la flessibilità per recuperare grandi set di dati a costo zero, come backup o casi d'uso di disaster recovery, S3 Glacier Flexible Retrieval è la classe di archiviazione ideale. S3 Glacier Flexible Retrieval offre le opzioni di recupero più flessibili in assoluto, che bilanciano i costi con tempi di accesso compresi tra minuti e ore e recuperi di tipo Bulk gratuiti. È una soluzione ideale per il backup, il disaster recovery, le esigenze di archiviazione di dati fuori sede e nelle occasioni in cui alcuni dati devono essere recuperati entro pochi minuti senza il pensiero dei costi di recupero.

Esistono due modi per inserire i dati in S3 Glacier Flexible Retrieval. Il primo consiste nel creare richieste PUT direttamente in Amazon S3 Glacier Flexible Retrieval specificando GLACIER nell'header x-amz-storage-class. Il secondo prevede di usare le regole del ciclo di vita di S3 per trasferire gli oggetti da una qualsiasi delle classi di archiviazione S3 per dati attivi (S3 Standard, S3 Intelligent-Tiering, S3 Standard-IA, S3 One Zone-IA e S3 Glacier Instant Retrieval) ad Amazon S3 Glacier Flexible Retrieval in base all'età degli oggetti. Usa la console di gestione di Amazon S3, i kit SDK AWS o le API di Amazon S3 per creare direttamente richieste PUT in Amazon S3 Glacier o definire regole per l'archiviazione.

Nota: S3 Glacier Flexible Retrieval è disponibile anche attraverso le API di Glacier dirette originali e attraverso la console di gestione di Amazon S3 Glacier. Per un'esperienza migliore, completa di accesso all'intero set di funzionalità S3, tra cui la gestione del ciclo di vita, Replica S3, S3 Storage Lens e altro ancora, si consiglia di usare le API S3 e la console di gestione di S3 per approfittare delle caratteristiche di S3 Glacier.

Gli oggetti archiviati in S3 Glacier Flexible Retrieval consentono l'accesso asincrono. Per recuperare i dati archiviati in S3 Glacier Flexible Retrieval, è necessario avviare una richiesta di recupero mediante le API di Amazon S3 o la console di Amazon S3. La richiesta di recupero crea una copia temporanea dei dati nella classe di archiviazione S3 Standard e lascia intatti i dati archiviati in S3 Glacier Flexible Retrieval. È possibile specificare l'intervallo di tempo, in giorni, durante il quale la copia temporanea sarà archiviata in Amazon S3. Per accedervi da S3 è quindi necessaria una richiesta GET di Amazon S3 sull'oggetto archiviato. Nelle Regioni AWS in cui l’archiviazione con ridondanza ridotta ha un prezzo inferiore rispetto a S3 Standard, i dati disponibili temporaneamente vengono fatturati come archiviazione con ridondanza ridotta. Tuttavia, la classe di archiviazione con fatturazione con ridondanza ridotta non riflette il modo in cui i dati vengono archiviati. Con le notifiche di ripristino, si riceve una notifica di evento S3 quando un oggetto viene ripristinato correttamente da S3 Glacier Flexible Retrieval e ne viene resa disponibile una copia temporanea. Il proprietario del bucket (o altri, secondo quanto consentito da una policy IAM) può chiedere che le notifiche vengano emesse ad Amazon Simple Queue Service (SQS) o ad Amazon Simple Notification Service (SNS). Le notifiche possono essere inviate anche ad AWS Lambda affinché vengano elaborate da una funzione Lambda.

Durante un'attività di recupero, Amazon S3 prima di tutto recupera i dati richiesti da S3 Glacier Flexible Retrieval, quindi ne crea una copia temporanea in Amazon S3. Ciò richiede generalmente alcuni minuti. La rapidità di accesso della richiesta dipende dall'opzione di recupero selezionata: Expedited, Standard o Bulk. Per gli oggetti con dimensioni inferiori ai 250 MB, i tempi di recupero dell'opzione Expedited sono in genere compresi tra 1 e 5 minuti. Gli oggetti ottenuti mediante recuperi Standard richiedono in genere dalle 3 alle 5 ore. I recuperi standard in genere iniziano in pochi minuti se avviati utilizzando Operazioni in batch S3. I tempi per i recuperi Bulk sono solitamente compresi tra le 5 e le 12 ore e non prevedono addebiti. Per ulteriori informazioni sulle opzioni di recupero di S3 Glacier Flexible Retrieval, consulta la sezione sul ripristino di un oggetto archiviato nella guida per l'utente di S3.
Con le unità di capacità assegnate della classe di archiviazione S3 Glacier, è possibile pagare una quota fissa anticipata per un determinato mese per garantire la disponibilità di capacità di recupero per i recuperi di tipo Expedited da S3 Glacier Flexible Retrieval. Puoi acquistare due unità di capacità assegnate al mese per aumentare la quantità di dati da recuperare. Ogni unità di capacità consente almeno tre recuperi di tipo Expedited a intervalli di 5 minuti e fornisce fino a 150 MB al secondo di velocità effettiva. Se il tuo carico di lavoro richiede un accesso altamente affidabile e prevedibile a un sottoinsieme di dati in pochi minuti, dovresti acquistare la capacità di recupero assegnata. Senza capacità assegnata, i recuperi di tipo expedited potrebbero non essere accettati durante i periodi di elevato afflusso di domande. Se hai bisogno di accedere a recuperi di tipo expedited in qualsiasi circostanza, ti raccomandiamo di acquistare capacità di recupero assegnata.
È possibile acquistare capacità assegnata utilizzando la Console Amazon S3, l'API REST di acquisto di capacità assegnata, i kit SDK AWS o AWS CLI. Un'unità di capacità assegnata dura un mese a partire dalla data e ora di acquisto, che rappresenta la data di inizio. L'unità scade alla data di scadenza, che è esattamente un mese dopo la data di inizio al secondo più vicino. Per informazioni sui costi della capacità assegnata, consulta prezzi di Amazon S3.

Il volume di archiviazione fatturato in un mese si basa sulla media dell'archiviazione utilizzata in tale mese, misurata in gigabyte al mese (GB-mese). Amazon S3 calcola le dimensioni dell'oggetto sommando alle dimensioni dei dati archiviati 32 KB di dati per S3 Glacier e 8 KB di dati per la classe di archiviazione Amazon S3 Standard. S3 Glacier Flexible Retrieval richiede 32 KB di dati aggiuntivi per oggetto per l'indice e i metadati di S3 Glacier in modo da poter identificare e recuperare i dati. Amazon S3 richiede 8 KB per archiviare e mantenere il nome e i metadati definiti dall'utente per gli oggetti archiviati in S3 Glacier Flexible Retrieval. In questo modo puoi avere un elenco aggiornato in tempo reale di tutti gli oggetti Amazon S3, inclusi quelli archiviati con S3 Glacier Flexible Retrieval, usando l'API LIST di Amazon S3 o il report S3 Inventory. Ad esempio, se hai archiviato 100.000 oggetti da 1 GB ciascuno, i costi di archiviazione sono i seguenti:
1,000032 gigabyte per oggetto x 100.000 oggetti = 100.003,2 gigabyte di archiviazione in S3 Glacier.
0,000008 gigabyte per oggetto x 100.000 oggetti = 0,8 gigabyte di archiviazione in S3 Standard.
I costi sono calcolati in base alle tariffe correnti nella regione AWS in uso secondo la pagina dei prezzi di Amazon S3. Per altri esempi sui prezzi di Amazon S3, visita la pagina delle Domande frequenti sulla fatturazione di S3 o usa il calcolatore dei prezzi AWS.

Gli oggetti archiviati in Recupero flessibile Amazon S3 Glacier hanno una durata di archiviazione minima di 90 giorni. Se un oggetto viene eliminato, sovrascritto o trasferito prima dello scadere dei 90 giorni, sarà addebitato un costo ripartito proporzionalmente pari alla tariffa di archiviazione per i giorni rimanenti.

Il recupero flessibile Amazon S3 Glacier richiede anche 40 KB di metadati aggiuntivi per ogni oggetto archiviato. Sono inclusi 32 KB di metadati addebitati alla tariffa di Recupero flessibile Amazon S3 Glacier necessari per identificare e recuperare i dati. Inoltre, 8 KB di dati aggiuntivi addebitati alla tariffa S3 Standard, necessari per mantenere il nome e i metadati definiti dall'utente per gli oggetti archiviati in Recupero flessibile Amazon S3 Glacier. Puoi così ottenere un elenco aggiornato di tutti gli oggetti di S3 utilizzando l’API S3 LIST o il report S3 Inventory. Per informazioni sui prezzi di Amazon S3 Glacier Flexible Retrieval, consulta la pagina dei prezzi di Amazon S3.

Ci sono tre modalità per recuperare i dati da S3 Glacier Flexible Retrieval: Expedited, Standard e Bulk Retrieval. Expedited e Standard prevedono una tariffa di recupero per GB ed una tariffa per richiesta (ad esempio, i prezzi sono elaborati in base alle richieste fatte per i propri oggetti di Amazon S3). I recuperi di tipo Bulk da S3 Glacier Flexible Retrieval sono gratuiti. Per ulteriori informazioni sui costi di S3 Glacier per regione AWS, consulta la pagina dei prezzi di Amazon S3.

Le classi di archiviazione di Amazon S3 Glacier sono dedicate all'archiviazione dei dati e forniscono le prestazioni migliori, la massima flessibilità in termini di recupero e il costo di archiviazione più basso nel cloud. Puoi scegliere fra tre classi di archiviazione ottimizzate a seconda dei modelli di accesso e della durata dell'archiviazione. Per i dati di archivio che richiedono l'accesso immediato, come le immagini mediche, le risorse della stampa o i dati sulla genomica, scegli la classe di archiviazione S3 Glacier Instant Retrieval, una classe di archiviazione che offre il recupero in millisecondi a un costo irrisorio. Per i dati di archivio che non richiedono l'accesso immediato ma per cui è necessaria la flessibilità per recuperare grandi set di dati a un costo irrisorio, come backup o casi d'uso di ripristino di emergenza, scegli S3 Glacier Flexible Retrieval, che eseguirà il recupero in pochi minuti oppure recuperi in massa gratuiti dalle 5 alle 12 ore. Per risparmiare ulteriormente sull'archiviazione a lungo termine come archivi di conformità e conservazione dei media digitali, scegli S3 Glacier Deep Archive, il servizio di archiviazione cloud più conveniente che ti permette di recuperare i dati entro 12 ore.

Preferiamo concentrarci sui risultati in termini di prestazioni, durata, disponibilità e sicurezza per il cliente. Tuttavia, questa domanda viene spesso posta dai nostri clienti. Utilizziamo diverse tecnologie che ci permettono di offrire ai nostri clienti le tariffe che proponiamo. I nostri servizi sono realizzati usando tecnologie per l'archiviazione dei dati comuni, specificatamente assemblate in sistemi ottimizzati per quanto riguarda i costi attraverso un software sviluppato da AWS. Le classi di archiviazione di S3 Glacier traggono vantaggio dalla nostra capacità di ottimizzare la sequenza di input e output per massimizzare l'efficienza nell'accesso all'archiviazione sottostante.

Amazon S3 Glacier Deep Archive

Apri tutto

S3 Glacier Deep Archive è una classe di archiviazione di Amazon S3 che fornisce un servizio di archiviazione di oggetti sicuro e duraturo, per la conservazione a lungo termine dei dati a cui si accede una o due volte l'anno. A partire da soli 0,00099 USD per GB al mese (meno di un decimo di un centesimo o circa 1 USD per TB al mese), S3 Glacier Deep Archive offre le tariffe per l'archiviazione sul cloud più basse in assoluto, a costi nettamente inferiori rispetto all'archiviazione e alla gestione di dati su librerie a nastro magnetico on-premise o all'archiviazione di dati in remoto.

S3 Glacier Deep Archive è una classe di archiviazione ideale per fornire protezione offline delle risorse dati più importanti dell'azienda o quando è richiesta la conservazione dei dati a lungo termine per i requisiti di conformità alle policy aziendali, contrattuali o alle normative. I clienti trovano S3 Glacier Deep Archive come una scelta convincente per proteggere la proprietà intellettuale, i registri finanziari e medici, i risultati di ricerca, documenti legali, studi di esplorazione sismica e backup a lungo termine, specialmente in settori altamente regolamentati, come i servizi finanziari, l'assistenza sanitaria, petrolio e gas e settori pubblici. Inoltre, ci sono organizzazioni come le società di media e intrattenimento, che desiderano conservare una copia di backup della proprietà intellettuale. Spesso i clienti che usano S3 Glacier Deep Archive riescono a ridurre o interrompere l'uso di librerie a nastro magnetico on-premises e di servizi di archiviazione su nastro in remoto.

S3 Glacier Deep Archive espande la nostra offerta relativa all'archiviazione dei dati e ti permette di scegliere la classe di archiviazione più adatta alle tue necessità in base a costi di archiviazione e recupero e tempi di recupero. È opportuno scegliere S3 Glacier Instant Retrieval quando è necessario l'accesso entro millisecondi ai dati archiviati a basso costo. Per i dati di archivio che non richiedono l'accesso immediato ma per cui è necessaria la flessibilità per recuperare grandi set di dati a un costo irrisorio, come backup o casi d'uso di ripristino di emergenza, scegli S3 Glacier Flexible Retrieval, che eseguirà il recupero in pochi minuti oppure recuperi in massa gratuiti dalle 5 alle 12 ore. S3 Glacier Deep Archive, al contrario, è progettato per dati meno attivi a cui è molto improbabile accedere, ma che richiedono comunque un'archiviazione a lungo termine e duratura. S3 Glacier Deep Archive costa fino al 75% in meno rispetto a S3 Glacier Flexible Retrieval e fornisce il recupero entro 12 ore utilizzando il livello di recupero standard. I recuperi standard iniziano in genere entro 9 ore se avviati utilizzando Operazioni in batch S3. I costi di recupero possono essere ulteriormente ridotti selezionando il recupero di tipo Bulk, che restituisce i dati entro 48 ore.

Il modo più semplice per archiviare i dati in S3 Glacier Deep Archive consiste nell'utilizzare l'API S3 per caricarvi i dati direttamente. Basta specificare "S3 Glacier Deep Archive" come classe di archiviazione. Puoi farlo utilizzando la Console di gestione AWS, l'API S3 REST, gli SDK AWS o l'interfaccia a riga di comando AWS. È inoltre possibile iniziare a utilizzare S3 Glacier Deep Archive creando policy per migrare i dati utilizzando S3 Lifecycle, che offre la possibilità di definire il ciclo di vita del proprio oggetto e riduce il costo dello storage. Queste politiche possono essere impostate per migrare oggetti in S3 Glacier Deep Archive in base all'età dell'oggetto. È possibile specificare la policy per un bucket S3 o per prefissi specifici. Le transizioni del ciclo di vita sono fatturate al prezzo di upload dell'archivio S3 Glacier Deep. Tape Gateway, una funzionalità di libreria nastro virtuale basata su cloud di AWS Storage Gateway, ora si integra con S3 Glacier Deep Archive, consentendo di archiviare i backup e gli archivi virtuali basati su nastro a lungo termine in S3 Glacier Deep Archive e fornire così il livello più basso dei costi di archiviazione per tali dati nel cloud. Per iniziare, crea un nuovo nastro virtuale usando la console o l'API di AWS Storage Gateway e imposta il target di archiviazione su S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive. Quando l'applicazione di backup espelle il nastro, questo verrà archiviato sulla destinazione di archiviazione selezionata.

Esistono diversi modi per migrare i dati dagli archivi nastro esistenti a S3 Glacier Deep Archive. È possibile utilizzare AWS Tape Gateway per l'integrazione con le applicazioni di backup esistenti utilizzando un'interfaccia VTL (Virtual Tape Library). L'interfaccia presenta nastri virtuali per l'applicazione di backup. Questi possono essere usati immediatamente per archiviare i dati in Amazon S3, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive.
È anche possibile usare AWS Snowball per migrare i dati. Snowball accelera lo spostamento di terabyte a petabyte di dati in entrata e in uscita da AWS utilizzando dispositivi di archiviazione fisici progettati per essere sicuri per il trasporto. L'utilizzo di Snowball consente di risolvere alcuni dei problemi più comuni dei trasferimenti di volumi elevati di dati, tra cui gli elevati costi di rete, la durata del trasferimento e la sicurezza. Infine, AWS Direct Connect si utilizza per stabilire connessioni di rete dedicate dai propri uffici ad AWS. In molti casi, Direct Connect può ridurre i costi di rete, aumentare il throughput della larghezza di banda e fornire un'esperienza di rete più coerente rispetto alle connessioni basate su Internet.

Per recuperare i dati archiviati in S3 Glacier Deep Archive, avvia una richiesta di "ripristino" utilizzando le API di Simple Storage Service (Amazon S3) o la console di gestione di Simple Storage Service (Amazon S3). La richiesta di recupero crea una copia temporanea dei dati nella classe di storage S3 Standard e lascia intatti i dati archiviati in S3 Glacier Deep Archive. È possibile specificare l'intervallo di tempo, in giorni, durante il quale la copia temporanea sarà conservata in S3. Per accedervi da S3 è quindi necessaria una richiesta GET di Amazon S3 sull'oggetto archiviato. Quando si ripristina un oggetto archiviato, è possibile specificare una delle seguenti opzioni nell'elemento Tier del corpo della richiesta: Standard è il livello predefinito e consente di accedere a qualsiasi oggetto archiviato entro 12 ore, con recuperi che iniziano in genere entro 9 ore se avviati utilizzando Operazioni in batch S3. Bulk consente di recuperare grandi quantità di dati, anche petabyte di dati, in modo economico e in genere viene completato entro 48 ore.

L'archiviazione di S3 Glacier Deep Archive è valutata in base alla quantità di dati archiviati in GB, al numero di richieste di transizione PUT/ciclo di vita, ai recuperi in GB e al numero di richieste di ripristino. Questo modello di prezzo è simile a quello di S3 Glacier Flexible Retrieval. Per informazioni sui prezzi di Deep Archive S3 Glacier, consulta la pagina dei prezzi di Amazon S3.

L'utilizzo e il costo dell'archivio S3 Glacier Deep vengono visualizzati come voce di un servizio indipendente sulla fattura AWS mensile, separati dall'utilizzo e dai costi di Amazon S3. Tuttavia, se si utilizza lo strumento Gestione costi AWS, l'utilizzo e il costo di S3 Glacier Deep Archive saranno inclusi nell'utilizzo e nel costo di Amazon S3 all'interno dei report dettagliati delle spese mensili, senza essere indicati come una voce di servizio separata.

Gli oggetti archiviati in Deep Archive Amazon S3 Glacier hanno un minimo di 180 giorni di archiviazione. Se un oggetto viene eliminato, sovrascritto o trasferito prima dello scadere dei 180 giorni, sarà addebitato un costo ripartito proporzionalmente pari alla tariffa di archiviazione per i giorni rimanenti. Deep Archive Amazon S3 Glacier richiede anche 40 KB di metadati aggiuntivi per ogni oggetto archiviato. Sono inclusi 32 KB di metadati addebitati alla tariffa di Deep Archive Amazon S3 Glacier necessari per identificare e recuperare i dati. Inoltre, 8 KB di dati aggiuntivi addebitati alla tariffa S3 Standard, necessari per mantenere il nome e i metadati definiti dall'utente per gli oggetti archiviati in Deep Archive Amazon S3 Glacier. È possibile così ottenere un elenco aggiornato di tutti gli oggetti di S3 utilizzando l'API LIST di S3 o il report dell'Inventario S3. Per informazioni sui prezzi di Deep Archive Amazon S3 Glacier, consulta la pagina dei prezzi di Amazon S3 .

S3 Glacier Deep Archive è integrata con le caratteristiche di Amazon S3, tra cui S3 Object Tagging, le policy del ciclo di vita di S3, S3 Object Lock e Replica S3. Con le caratteristiche di gestione dell'archiviazione S3, è possibile usare un singolo bucket Amazon S3 per archiviare una combinazione di dati S3 Glacier Deep Archive, S3 Standard, S3 Standard-IA, S3 One Zone-IA e S3 Glacier Flexible Retrieval. Ciò consente agli amministratori dell'archiviazione di prendere decisioni in base alla natura dei dati e ai modelli di accesso ai dati. I clienti possono utilizzare le politiche del ciclo di vita di Amazon S3 per migrare automaticamente i dati in classi di storage a costo inferiore con l'invecchiamento dei dati o le politiche di replica di S3 tra regioni diverse o all'interno della stessa regione per replicare i dati in un'altra regione. Il servizio AWS Storage Gateway integra Tape Gateway con la classe di archiviazione S3 Glacier Deep Archive, che consente di archiviare nastri virtuali nella classe di archiviazione Amazon S3 più economica, riducendo il costo mensile per l'archiviazione dei dati a lungo termine nel cloud del 75%. Grazie a questa funzionalità, Tape Gateway supporta l'archiviazione dei nastri virtuali direttamente su S3 Glacier Flexible Retrieval e S3 Glacier Deep Archive, così da aiutarti a rispettare i requisiti di backup, archiviazione e ripristino. Tape Gateway consente di spostare i backup basati su nastro in AWS senza apportare modifiche ai flussi di lavoro di backup esistenti. Gateway di nastri virtuali supporta la maggior parte delle principali applicazioni di backup come Veritas, Veeam, Commvault, Dell EMC NetWorker, IBM Spectrum Protect (su sistema operativo Windows) e Microsoft Data Protection Manager.

S3 su Outposts

Apri tutto

Amazon S3 on Outposts offre l'archiviazione degli oggetti nel tuo ambiente on-premises utilizzando le API S3 e le capacità che utilizzi oggi in AWS. AWS Outposts è un servizio completamente gestito che estende l'infrastruttura, i servizi, le API e gli strumenti AWS praticamente a qualsiasi data center, spazio di co-locazione o struttura on-premise. Utilizzando S3 on Outposts, puoi elaborare e archiviare in modo sicuro i dati dei clienti generati on-premise prima di spostarli in una Regione AWS, accedere ai dati a livello locale per le applicazioni eseguite on-premise o archiviare i dati sul tuo Outpost per le aziende in località con requisiti di posizione dei dati o per quelle nei settori regolamentati. Per ulteriori informazioni su S3 su Outposts, visita la pagina della panoramica.

Gestione dell'archiviazione

Apri tutto

I tag di oggetti S3 sono coppie di tipo chiave-valore applicate a oggetti S3 che si possono creare, aggiornare o eliminare in qualsiasi momento durante la vita dell'oggetto. I tag consentono di creare policy di AWS Identity and Access Management (IAM), configurare policy di ciclo di vita Amazon S3 e personalizzare parametri di archiviazione. Questi tag a livello di oggetto possono in seguito gestire trasferimenti fra classi di archiviazione e oggetti a scadenza in background. Si possono aggiungere tag a nuovi oggetti quando vengono caricati o aggiungerli a oggetti esistenti. A ciascun oggetto S3 possono essere aggiunti fino a dieci tag e per farlo si possono usare la Console di gestione AWS, REST API, l'interfaccia a riga di comando di AWS o i kit SDK AWS.
Ulteriori informazioni sono disponibili nella Guida per l'utente di S3 Object Tag.

I tag di oggetti sono uno strumento che può essere utilizzato per gestire in modo semplice l'archiviazione S3. Grazie alla possibilità di creare, aggiornare ed eliminare tag in qualunque momento durante la durata di vita dell'oggetto, lo storage può adattarsi alle necessità della tua attività. Questi tag permettono di controllare l'accesso a oggetti che contengono tag con coppie chiave-valore specifiche e di aumentare così la protezione dei dati confidenziali per un gruppo o un utente selezionato. I tag possono essere usati anche per etichettare gli oggetti appartenenti a un progetto specifico o a una business unit e in combinazione con le policy del ciclo di vita di S3 per gestire le transizioni verso altre classi di archiviazione (AI S3 Standard, AI a zona unica S3, Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval e Amazon S3 Glacier Deep Archive) o con Replica S3 per replicare selettivamente i dati tra regioni AWS.

I tag di oggetti possono essere modificati in qualunque momento durante il ciclo di vita di un oggetto S3, tramite la Console di gestione AWS, REST API, l'interfaccia a riga di comando di AWS o i kit SDK AWS. Le modifiche effettuate sui tag al di fuori della Console di gestione AWS vengono effettuate sull'intero gruppo di tag. Se disponi di cinque tag collegati a un oggetto particolare e ne vuoi aggiungere un sesto, devi includere i cinque tag originali nella richiesta.

Il costo dei tag di oggetti è calcolato in base alla quantità di tag impiegati e ai costi delle richieste necessarie per aggiungerli. Il costo delle richieste necessarie per aggiungere e aggiornare i tag di oggetti dipende dalle tariffe delle richieste esistenti. Per ulteriori informazioni, consulta la pagina dei prezzi di Amazon S3.

È possibile utilizzare la Console di gestione AWS o l'API PUT Bucket Analytics di S3 per configurare una policy di analisi della classe di archiviazione e identificare quindi i dati ad accesso infrequente che possono essere trasferiti nella classe AI S3 Standard o AI a zona unica S3 oppure archiviati nelle classi S3 Glacier. Apri la scheda Gestione nella console di S3 per gestire i parametri di Storage Class Analytics, Inventario S3 e CloudWatch.

Dovresti utilizzare Amazon S3 Metadata se desideri utilizzare SQL per interrogare le informazioni sui tuoi oggetti S3 per identificare rapidamente set di dati specifici per l'IA generativa, l'analisi e altri casi d'uso. S3 Metadata mantiene i metadati aggiornati quasi in tempo reale, quindi puoi utilizzare qualsiasi client compatibile con Iceberg per eseguire query SQL per trovare oggetti in base ai metadati degli oggetti. Ad esempio, puoi utilizzare una query SQL per restituire un elenco di oggetti che corrispondono a determinati filtri, ad esempio gli oggetti aggiunti negli ultimi 30 giorni in qualsiasi bucket.

S3 Metadata è progettato per generare automaticamente metadati che forniscono informazioni aggiuntive sugli oggetti caricati in un bucket e per rendere tali metadati interrogabili in una tabella di sola lettura. Queste tabelle di metadati sono archiviate in Amazon S3 Tables, che sono basate su Apache Iceberg e forniscono un modo gestito per archiviare e interrogare dati tabulari all'interno di S3. S3 Metadata crea e conserva metadati a livello di sistema come la dimensione degli oggetti, metadati personalizzati come i tag e i metadati definiti dagli utenti durante il caricamento degli oggetti, e i metadati di eventi come l'indirizzo IP che ha inviato la richiesta. Man mano che i dati nel bucket cambiano, S3 Metadata si aggiorna quasi in tempo reale per riflettere le ultime modifiche. È quindi possibile interrogare le tabelle di metadati utilizzando diversi servizi di analisi AWS e strumenti open source compatibili con Iceberg, compresi Amazon Athena, Amazon QuickSight e Apache Spark.

È possibile iniziare a utilizzare S3 Metadata con pochi clic nella Console di gestione S3. Basta selezionare il bucket S3 generico su cui si desidera abilitare S3 Metadata e S3 analizzerà i dati nel bucket e creerà una tabella Apache Iceberg completamente gestita che contiene i metadati per tutti i tuoi oggetti. In pochi minuti, puoi iniziare a interrogare i tuoi metadati utilizzando qualsiasi motore di query o strumento che supporti Apache Iceberg.

Le tue tabelle di metadati S3 sono archiviate in un bucket di tabelle gestito da AWS nel tuo account AWS chiamato aws-s3. Le tue tabelle saranno di sola lettura e solo S3 avrà il permesso di scrivere, aggiornare o eliminare i metadati.

S3 Metadata archivia i metadati in due tabelle gestite nel tuo account: tabelle del registro e tabelle di inventario live.

La tabella del registro di S3 Metadata fornisce una panoramica delle modifiche apportate all'interno del bucket. Man mano che gli oggetti vengono aggiunti, aggiornati e rimossi dai bucket S3 generici, le modifiche corrispondenti si riflettono nelle tabelle del registro quasi in tempo reale. Le tabelle del registro sono utili per comprendere il comportamento delle applicazioni e per identificare eventuali modifiche apportate ai set di dati. Ad esempio, puoi scrivere query SQL per le tabelle del registro per trovare oggetti S3 che corrispondono a un filtro, ad esempio oggetti aggiunti negli ultimi 30 giorni, oggetti aggiunti da richiedenti attivi o oggetti con modifiche ai metadati nell'ultima settimana.

La tabella di inventario live di S3 Metadata contiene un elenco completo di tutti gli oggetti nel bucket. Le tabelle di inventario in tempo reale vengono aggiornate ogni ora e contengono tutte le informazioni che S3 conosce sui tuoi oggetti. Le tabelle di inventario in tempo reale sono utili per scoprire o identificare i set di dati nel bucket, in base alle caratteristiche generate nei metadati degli oggetti. Ad esempio, puoi utilizzare tabelle di inventario in tempo reale per identificare i set di dati di formazione per il machine learning, da utilizzare in esercizi di ottimizzazione dei costi di archiviazione o per aiutare a far rispettare i controlli di governance.

Quando aggiungi nuovi oggetti al tuo bucket, vedrai le voci nella tabella del registro in pochi minuti e vedrai le voci nella tabella dell'inventario attivo al successivo aggiornamento orario. Quando abiliti i metadati S3 su un bucket esistente, S3 avvia automaticamente un'operazione di backfill per generare metadati per tutti gli oggetti esistenti. Questo backfill in genere termina in pochi minuti, ma può richiedere diverse ore se i set di dati esistenti contengono milioni o miliardi di oggetti S3.

Sì. È possibile creare le proprie tabelle Iceberg in bucket di tabelle che contengano metadati personalizzati per poi unirle a quelle generate da Metadati S3 utilizzando semplici query SQL.

Inventario S3 costituisce un'alternativa pianificata all'API List sincrona di Amazon S3. Inventario S3 può essere configurato per generare giornalmente o settimanalmente un output di file CSV, ORC o Parquet dei tuoi oggetti e dei metadati corrispondenti per un prefisso o bucket S3. L'utilizzo di Inventario S3 consente di semplificare e accelerare i flussi di lavoro aziendali e le attività di big data. Inventario S3 può inoltre essere impiegato per verificare la crittografia e lo stato di replica degli oggetti e soddisfare le esigenze aziendali e di conformità alle normative. Ulteriori informazioni sono disponibili nella Guida per l'utente di Inventario Amazon S3.

È possibile usare la console di gestione AWS o l'API PUT Bucket Inventory Configuration per configurare un inventario giornaliero o settimanale di tutti gli oggetti in un bucket S3 o di un sottoinsieme di oggetti sotto un prefisso condiviso. Durante la fase di configurazione, è possibile specificare un bucket S3 di destinazione per il report S3 Inventory, il formato del file di output (CSV, ORC o Parquet) e i metadati specifici di oggetto necessari all'applicazione aziendale, ad esempio nome, dimensioni, data dell'ultima modifica, classe di storage, ID della versione, contrassegno di eliminazione, contrassegno di versione non corrente, contrassegno di caricamento in più parti, stato di replica o stato di crittografia dell'oggetto. S3 Inventory può essere usato come input diretto nei flussi di lavoro delle applicazioni o nei processi relativi ai Big Data. È anche possibile eseguire query in S3 Inventory attraverso il linguaggio SQL standard con Amazon Athena, Amazon Redshift Spectrum e altri strumenti quali Presto, Hive e Spark. Ulteriori informazioni sono disponibili nella Guida per l'utente di Inventario Amazon S3.

Per informazioni sui prezzi di S3 Inventory, consulta la pagina dei prezzi di Amazon S3. Per la crittografia con SSE-KMS vengono addebitate le tariffe standard di AWS KMS. Per ulteriori dettagli, consulta la pagina dei prezzi di KMS.