Todas las preguntas frecuentes sobre S3

Preguntas frecuentes sobre los aspectos generales de S3

Abrir todo

Amazon S3 es un servicio de almacenamiento de objetos creado para almacenar y recuperar cualquier volumen de datos desde cualquier ubicación. S3 es un servicio de almacenamiento sencillo que ofrece excelente durabilidad, disponibilidad, rendimiento, seguridad y escalabilidad prácticamente ilimitada a costos muy reducidos.

Amazon S3 proporciona una sencilla interfaz de servicio web que puede utilizar para almacenar y recuperar el volumen de datos que desee, cuando lo necesite y desde cualquier ubicación. Mediante este servicio, puede crear de forma sencilla aplicaciones que utilicen almacenamiento nativo en la nube. Como Amazon S3 es un servicio con un alto nivel de escalabilidad y usted paga por lo que usa, podrá comenzar de a poco y ampliar su aplicación como desee, sin poner en riesgo ni el desempeño ni la fiabilidad. Amazon S3 también se ha diseñado para ser muy flexible. Almacene el tipo y la cantidad de datos que desee; lea el mismo fragmento de datos un millón de veces o solo en caso de recuperación de desastres de emergencia; cree una aplicación FTP sencilla o una aplicación web sofisticada como el sitio web de venta al por menor Amazon.com. Amazon S3 le permite enfocarse en innovar, en lugar de invertir tiempo en averiguar cómo almacenar sus datos.

Para registrarse en Amazon S3, visite la consola de S3. Para obtener acceso a este servicio, debe disponer de una cuenta de Amazon Web Services. Si aún no tiene una cuenta, se le pedirá que cree una cuando comience el proceso de registro de Amazon S3. Tras registrarse, consulte la documentación de Amazon S3, consulte los materiales de introducción a S3 y consulte los recursos adicionales en el centro de recursos para empezar a utilizar Amazon S3.

Amazon S3 le permite aprovechar los beneficios propios de Amazon de escala masiva sin una inversión inicial y sin poner en riesgo el rendimiento. Mediante el uso de Amazon S3, es sencillo y asequible garantizar que se puede acceder rápidamente a los datos y que siempre están disponibles y protegidos.

Podrá almacenar prácticamente todo tipo de datos en cualquier formato. Consulte el Acuerdo de licencia de Amazon Web Services para obtener más información.

El volumen total de datos y el número de objetos que puede almacenar en Amazon S3 son ilimitados. El tamaño de los objetos individuales de Amazon S3 puede variar entre un mínimo de 0 bytes y un máximo de 5 TB. El objeto más grande que se puede cargar en un solo PUT es de 5 GB. Para objetos con un tamaño superior a 100 MB, los clientes deben pensar en utilizar la capacidad de carga multiparte.

Un bucket de uso general es un contenedor de objetos almacenados en Amazon S3 y puede almacenar cualquier cantidad de objetos en un bucket. Los buckets de uso general son el tipo de bucket de S3 original, y un único bucket de uso general puede contener objetos almacenados en todas las clases de almacenamiento, excepto en S3 Express One Zone. Se recomiendan para la mayoría de los casos de uso y patrones de acceso.

Un bucket de directorio es un contenedor de objetos almacenados en Amazon S3 y puede almacenar cualquier cantidad de objetos en un bucket. Los bucket de directorio de S3 solo permiten almacenar objetos en la clase de almacenamiento S3 Express One Zone, lo que proporciona un procesamiento de datos más rápido dentro de una única zona de disponibilidad. Se recomiendan para casos de uso de baja latencia. Cada bucket de directorio de S3 puede admitir hasta 2 millones de transacciones por segundo (TPS), independientemente de la cantidad de directorios del bucket.

Un bucket de tablas está diseñado específicamente para almacenar tablas con el formato Apache Iceberg. Utilice Tablas de Amazon S3 para crear grupos de tablas y configurar permisos a nivel de tabla en tan solo unos pasos. Los buckets de tablas S3 están optimizados específicamente para las cargas de trabajo de análisis y machine learning. Gracias a la compatibilidad integrada con Apache Iceberg, puede consultar datos tabulares en S3 con motores de consulta populares, como Amazon Athena, Amazon Redshift y Apache Spark. Utilice los buckets de tablas de S3 para almacenar datos tabulares, como las transacciones de compra diarias, los datos de los sensores de secuencias o las impresiones de anuncios, como una tabla Iceberg en Amazon S3 y, a continuación, interactúe con esos datos mediante funciones de análisis.

Un depósito vectorial está diseñado específicamente para almacenar y consultar vectores. Dentro de un bucket vectorial, no se utilizan las API de objetos de S3, sino las API vectoriales dedicadas para escribir datos vectoriales y consultarlos en función del significado semántico y la similitud. Puede controlar el acceso a sus datos vectoriales con los mecanismos de control de acceso existentes en Amazon S3, incluidas las políticas de bucket e IAM. Todas las escrituras en un bucket vectorial son muy consistentes, lo que significa que puede acceder inmediatamente a los vectores agregados más recientemente. A medida que escribe, actualiza y elimina vectores a lo largo del tiempo, los depósitos vectoriales de S3 optimizan automáticamente los datos vectoriales almacenados en ellos para lograr una relación precio-rendimiento óptima, incluso a medida que los conjuntos de datos escalan y evolucionan.

Un bucket es un contenedor de objetos y tablas almacenados en Amazon S3 y puede almacenar cualquier cantidad de objetos en un bucket. Los buckets de uso general son el tipo de bucket de S3 original, y un único bucket de uso general puede contener objetos almacenados en todas las clases de almacenamiento, excepto en S3 Express One Zone. Se recomiendan para la mayoría de los casos de uso y patrones de acceso. Los bucket de directorio de S3 solo permiten almacenar objetos en la clase de almacenamiento S3 Express One Zone, lo que proporciona un procesamiento de datos más rápido dentro de una única zona de disponibilidad. Se recomiendan para casos de uso de baja latencia. Cada bucket de directorio de S3 puede admitir hasta 2 millones de transacciones por segundo (TPS), independientemente de la cantidad de directorios del bucket. Los buckets de tablas de S3 están diseñados específicamente para almacenar datos tabulares en S3, como las transacciones de compra diarias, los datos de sensores de secuencias o las impresiones de anuncios. Al usar un bucket de tablas, sus datos se almacenan como una tabla Iceberg en S3 y, a continuación, puede interactuar con esos datos mediante funciones de análisis, como transacciones a nivel de fila, instantáneas de tablas consultables y más, todas administradas por S3. Además, los buckets de tablas realizan un mantenimiento continuo de las tablas para optimizar automáticamente la eficiencia de las consultas a lo largo del tiempo, incluso a medida que el lago de datos escala y evoluciona. Los cubos vectoriales S3 están diseñados específicamente para almacenar y consultar vectores. Dentro de un depósito vectorial, se utilizan API vectoriales dedicadas para escribir datos vectoriales y consultarlos en función del significado semántico y la similitud. Puede controlar el acceso a sus datos vectoriales mediante los mecanismos de control de acceso existentes en Amazon S3, incluidas las políticas de bucket e IAM. A medida que escribe, actualiza y elimina vectores a lo largo del tiempo, los depósitos vectoriales de S3 optimizan automáticamente los datos vectoriales almacenados en ellos para lograr una relación precio-rendimiento óptima, incluso a medida que los conjuntos de datos escalan y evolucionan.

Amazon almacena sus datos y realiza un seguimiento del uso asociado para calcular su factura. Amazon no obtendrá acceso a sus datos con ningún fin que no sea la oferta de Amazon S3, a excepción de cuando la ley así lo exija. Consulte el Acuerdo de licencia de Amazon Web Services para obtener más información.

Sí. Las organizaciones de Amazon utilizan Amazon S3 para diversos proyectos. Muchos de estos proyectos utilizan Amazon S3 como almacén de datos autorizado y confían en este servicio para operaciones de vital importancia para su negocio.

Amazon S3 es un sencillo almacenamiento de objetos basado en claves. Cuando almacena datos, asigna una clave de objeto única que puede utilizarse posteriormente para recuperar los datos. Las claves pueden ser cualquier cadena y pueden crearse de forma que imiten atributos jerárquicos. Opcionalmente, puede usar el etiquetado de objetos de S3 para organizar los datos en todos los prefijos o buckets de S3.

Amazon S3 ofrece una sencilla interfaz de servicios web REST basada en estándares que está diseñada para funcionar con cualquier conjunto de herramientas de desarrollo basado en Internet. Las operaciones se simplificaron de forma intencionada para facilitar la tarea de incorporar nuevos protocolos de distribución y capas funcionales.

Amazon S3 le concede acceso a la misma infraestructura de almacenamiento de datos económica, rápida y con alto nivel de escalabilidad y disponibilidad que utiliza Amazon para ejecutar su propia red global de sitios web. La clase de almacenamiento S3 Standard está diseñada para una disponibilidad del 99,99 %; las clases de almacenamiento S3 Standard-IA, S3 Intelligent-Tiering y S3 Glacier Instant Retrieval para una disponibilidad del 99,9 %; la clase de almacenamiento S3 One Zone-IA para una disponibilidad del 99,5 % y las clases S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive para una disponibilidad del 99,99 % y un acuerdo de nivel de servicio del 99,9 %. Todas estas clases de almacenamiento están respaldadas por el acuerdo de nivel de servicio de Amazon S3.

Amazon S3 se ha diseñado desde un primer momento para administrar tráfico de cualquier aplicación de Internet. El sistema de precio de pago por uso y la capacidad ilimitada garantizan que los costos progresivos no cambiarán y que el servicio no se verá interrumpido. Las enormes posibilidades de escalabilidad de Amazon S3 le permiten dividir la carga de forma equitativa para que ninguna aplicación se vea afectada por los picos de tráfico.

Sí. El SLA de Amazon S3 prevé un crédito de servicio si el porcentaje de tiempo de actividad mensual de un cliente es inferior a nuestro compromiso de servicio en cualquier ciclo de facturación.

Amazon S3 brinda automáticamente, al mismo costo, una sólida consistencia de lectura tras escritura, sin modificar el rendimiento o la disponibilidad y sin sacrificar el aislamiento regional de las aplicaciones. Después de escribir correctamente en un objeto nuevo o sobrescribir en uno existente, cualquier solicitud de lectura posterior recibe inmediatamente la versión más reciente del objeto. S3 también ofrece una coherencia sólida para operaciones de listado de modo que, después de la escritura, puede realizar de inmediato una enumeración de los objetos de un bucket y todos los cambios se verán reflejados.

Una sólida coherencia de lectura tras escritura es útil cuando necesita leer un objeto inmediatamente después de una escritura. Por ejemplo, si suele leer y enumerar objetos justo después de escribirlos. Las cargas de trabajo de computación de alto rendimiento también se benefician, ya que, cuando un objeto se sobrescribe y luego se lee muchas veces de forma simultánea, una sólida coherencia de lectura tras escritura garantiza que la última escritura pueda leerse en todas las lecturas. Estas aplicaciones se benefician de manera automática e inmediata de una sólida consistencia de lectura tras escritura. La sólida consistencia de S3 también reduce los costos, ya que elimina la necesidad de infraestructura adicional para brindar una consistencia sólida.

Regiones de AWS

Abrir todo

Cuando crea un bucket de uso general de Amazon S3, especifica una región de AWS. Para las clases de almacenamiento S3 Standard, S3 Standard-IA, S3 Intelligent-Tiering, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive, los objetos se almacenan automáticamente en varios dispositivos distribuidos en un mínimo de tres zonas de disponibilidad (AZ). Las AZ están físicamente separadas entre sí por una distancia significativa de muchos kilómetros, aunque todas están dentro de un rango de 100 km (60 millas) de separación. Los objetos almacenados en la clase de almacenamiento S3 One Zone-IA se almacenan de manera redundante en una única zona de disponibilidad en la región de AWS que usted seleccione. Al crear el bucket de directorio, debe especificar una única zona de disponibilidad o una zona local dedicada de AWS. Los objetos de los buckets de directorio se almacenan de forma redundante en una única zona de disponibilidad o zona local. Al usar las clases de almacenamiento de S3 para zonas locales dedicadas, sus objetos permanecen en la zona local dedicada a menos que los transfiera a una región de AWS. Para S3 en Outposts, sus datos se almacenan en su entorno de Outposts en las instalaciones, a menos que elija manualmente transferirlo a una región de AWS. Consulte la lista de servicios por región de AWS para obtener información sobre la disponibilidad del servicio de Amazon S3 por región de AWS.

Debe usar las clases de almacenamiento de S3 para las zonas locales dedicadas de AWS si tiene datos y aplicaciones confidenciales que deben ejecutarse en una infraestructura físicamente separada que esté dedicada a su uso exclusivo y ubicada dentro de una jurisdicción reguladora específica para cumplir con los requisitos de seguridad y cumplimiento. Por ejemplo, algunas normativas exigen que los datos se almacenen en un país o estado en particular, por motivos normativos, contractuales o de seguridad de la información comunes en el sector público, la atención médica, el petróleo y el gas y otras industrias altamente reguladas. AWS trabaja con usted para configurar sus propias zonas privadas con las capacidades mejoradas de seguridad y gobernanza necesarias para ayudarle a cumplir sus requisitos normativos.

Una región de AWS es una ubicación física en todo el mundo donde se encuentran los centros de datos de clústeres de AWS. Cada grupo de centros de datos lógicos de una región se denomina zona de disponibilidad (AZ). Cada región de AWS consta de un mínimo de tres zonas de disponibilidad aisladas y físicamente separadas dentro de un área geográfica. A diferencia de otros proveedores de nube, que a menudo definen una región como un solo centro de datos, el diseño de varias zonas de disponibilidad de cada región de AWS ofrece ventajas para los clientes. Cada zona de disponibilidad tiene alimentación, refrigeración y seguridad física independientes y está conectada a través de redes redundantes de latencia ultrabaja.

Una zona de disponibilidad (AZ) es uno o más centros de datos discretos con alimentación, redes y conectividad redundantes en una región de AWS. Las zonas de disponibilidad permiten que los clientes operen bases de datos y aplicaciones de producción con un nivel de disponibilidad, tolerancia a errores y escalabilidad mayor que el que ofrecería un centro de datos único. Todas las zonas de disponibilidad de una región de AWS están interconectadas con redes de alto ancho de banda y baja latencia, a través de una fibra metropolitana exclusiva totalmente redundante que proporciona una red de alto rendimiento y baja latencia entre las zonas de disponibilidad. Las clases de almacenamiento Amazon S3 Standard, S3 Standard-Infrequent Access,S3 Intelligent-Tiering, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive replican datos en un mínimo de tres zonas de disponibilidad para brindar protección contra la pérdida de una zona entera. Esto se aplica igualmente en regiones en las que se encuentran disponibles públicamente menos de tres zonas de disponibilidad. Es posible acceder a los objetos que se almacenan en estos tipos de almacenamiento desde todas las zonas de disponibilidad de una región de AWS.
La clase de almacenamiento Amazon S3 One Zone-IA replica los datos dentro de una única zona de disponibilidad. Los datos almacenados en S3 One Zone-IA no son resistentes a la pérdida física de una zona de disponibilidad como consecuencia de catástrofes, como terremotos, incendios e inundaciones.

Debe tener en cuenta diversos factores en función de la aplicación. Por ejemplo, puede ser conveniente almacenar sus datos en una región que esté cerca de sus clientes, sus centros de datos o sus otros recursos de AWS para reducir las latencias de acceso a los datos. También puede ser conveniente almacenar sus datos en una región que sea más remota con respecto a otras operaciones para conseguir redundancia geográfica y capacidad de recuperación de desastres. También debe tener en cuenta regiones que le permitan afrontar requisitos legales y de normativa específicos, y reducir los costos de almacenamiento. Puede elegir una región de menor precio para reducir los costos. Para obtener información sobre los precios de S3, visite la página de precios de Amazon S3 .

Amazon S3 se encuentra disponible en todas las regiones de AWS en el mundo y puede usarlo independientemente de cuál sea su ubicación. Simplemente tiene que decidir en qué región (o regiones) de AWS desea almacenar los datos de Amazon S3. Consulte la lista de servicios regionales de AWS para obtener una lista de las regiones de AWS en las que S3 está disponible en la actualidad.

Facturación

Abrir todo

Con Amazon S3 paga únicamente por lo que usa. No existe un cargo mínimo. Puede realizar una estimación de su factura mensual con la Calculadora de precios de AWS. AWS cobra menos cuando nuestros costos son menores. Algunos precios varían en función de la región de Amazon S3. Los precios de facturación se basan en la ubicación de su bucket de S3. No existe ningún cargo por la transferencia de datos que se encuentran en una región de Amazon S3 a través de una solicitud COPY. Los datos transferidos mediante una solicitud COPY entre regiones de AWS se cobran según las tarifas especificadas en la página de precios de Amazon S3. No se aplica ningún cargo por transferencia de datos entre Amazon EC2 (o cualquier servicio de AWS) y Amazon S3 en la misma región. Por ejemplo, datos transferidos en la región Este de EE. UU. (Norte de Virginia). Sin embargo, los datos transferidos entre Amazon EC2 (o cualquier servicio de AWS) y Amazon S3 en todas las demás regiones se cobran según las tarifas especificadas en la página de precios de Amazon S3, por ejemplo, los datos transferidos entre Amazon EC2 EE. UU. Este (Norte de Virginia) y Amazon S3 EE. UU. Oeste (Norte de California). Los costos de transferencia de datos se facturan al propietario del bucket de origen. Para ver los precios de S3 on Outposts, visita la página de precios de Outposts.

No se requieren cargos de configuración ni compromisos para comenzar a utilizar Amazon S3. A final de mes, se cobrará automáticamente el uso de ese mes. Puede ver los cargos del periodo de facturación actual en cualquier momento iniciando sesión en su cuenta de Amazon Web Services y seleccionando el panel de facturación asociado a su perfil de consola. Con la capa de uso gratuito de AWS*, puede empezar a utilizar Amazon S3 de forma gratuita en todas las regiones, excepto en las regiones de AWS GovCloud. Cuando se registran, los clientes nuevos de AWS reciben 5 GB de almacenamiento de Amazon S3 Standard, 20 000 solicitudes GET, 2000 solicitudes PUT y 100 GB de transferencia de datos saliente (hacia Internet, otras regiones de AWS o Amazon CloudFront) al mes durante un año. El uso mensual no utilizado no se acumula para el siguiente mes. Amazon S3 le cobra por los siguientes tipos de uso. Tenga en cuenta que los siguientes cálculos presuponen que no se está utilizando la capa gratuita de AWS.

AWS cobra menos cuando nuestros costos son menores. Por ejemplo, nuestros costos son más bajos en la región Este de EE. UU. (Norte de Virginia) que en la región Oeste de EE. UU. (Norte de California).

A toda versión de un objeto almacenado o solicitado de Amazon S3 se le aplican las tarifas normales. Por ejemplo, veamos el siguiente escenario para ilustrar los costos de almacenamiento cuando se utiliza el control de versiones (supongamos que el mes actual dura 31 días): 1) Día 1 del mes: se realiza un PUT de 4 GB (4.294.967.296 bytes) en el bucket.
2) Día 16 del mes: realiza una operación PUT de 5 GB (5 368 709 120 bytes) en el mismo bucket de datos utilizando la misma clave que la operación PUT original del día 1.

Al analizar los costos de almacenamiento de las operaciones anteriores, debe tener en cuenta que el objeto de 4 GB del día 1 no se elimina del bucket cuando se escribe el objeto de 5 GB el día 15. En su lugar, el objeto de 4 GB se conserva como una versión más antigua, y el objeto de 5 GB pasa a ser la versión más recientemente escrita dentro del objeto que se encuentra en su bucket. Al final del mes: uso total de bytes/hora
[4 294 967 296 bytes x 31 días x (24 horas/día)] + [5 368 709 120 bytes x 16 días x (24 horas/día)] = 5 257 039 970 304 byte-horas. Conversión a GB/mes totales
5.257.039.970.304 bytes-hora x (1 GB/ 1.073.741.824 bytes) x (1 mes/ 744 horas) = 6,581 GB-mes El coste se calcula en función de las tarifas actuales de su región en la página de precios de Amazon S3.

Al obtener acceso al servicio a través de la Consola de administración de AWS se aplica la estructura de precios normal de Amazon S3. Para proporcionar una experiencia optimizada, la Consola de administración de AWS puede ejecutar las solicitudes de forma proactiva. Además, algunas operaciones interactivas derivan en más de una solicitud al servicio.

Se aplica el precio normal de Amazon S3 cuando se accede a su almacenamiento de información desde otra cuenta de AWS. Opcionalmente, puede optar por configurar su bucket como pago por solicitante, en cuyo caso el solicitante pagará el costo de las solicitudes y descargas de sus datos de Amazon S3. Puede encontrar más información sobre las opciones de configuración del bucket de pago por solicitante en la documentación de Amazon S3.

Si no se especifica lo contrario, nuestros precios no incluyen los impuestos ni gravámenes correspondientes, como el IVA y cualquier otro impuesto sobre las ventas. En el caso de los clientes con una dirección de facturación de Japón, el uso de los servicios de AWS está sujeto al impuesto de consumo nipón. Más información sobre impuestos en los servicios de AWS »

AWS permite que los clientes que cumplan los requisitos transfieran sus datos a Internet de forma gratuita cuando retiren todos sus datos de AWS, de acuerdo con el proceso que se indica a continuación.

Complete los siguientes pasos: 1) Si tiene un equipo de cuentas de AWS dedicado, póngase en contacto con él primero e infórmele de sus planes. En algunos casos, si ha negociado un compromiso con AWS, tendrá que analizar las opciones disponibles con su equipo de cuentas de AWS. 2) Revise los requisitos y el proceso descritos en esta página. 3) Póngase en contacto con el servicio de atención al cliente de AWS e indique que su solicitud es de «transferencia de datos gratuita para dejar AWS». El Servicio de atención al cliente de AWS le pedirá que proporcione información para poder revisar sus planes de transferencia, evaluar si reúne los requisitos para transferir datos de forma gratuita y calcular el importe de crédito adecuado. 4) Si el servicio de atención al cliente de AWS aprueba la transferencia, recibirá un crédito temporal correspondiente al costo de la transferencia de datos en función del volumen de todos los datos que haya almacenado en los servicios de AWS en el momento del cálculo de AWS. El servicio de atención al cliente de AWS le notificará si recibe la aprobación y, a continuación, tendrá 60 días para retirar sus datos de AWS. El crédito solo se puede usar para transferir datos y no se aplicará al uso de otros servicios. Tras retirar los datos de los servicios de AWS, tendrá un plazo de 60 días para eliminar todos los datos y cargas de trabajo restantes de su cuenta de AWS. Otra opción es cerrar su cuenta de AWS. Las transferencias de datos gratuitas para los proveedores de TI que se mudan también están sujetas a los siguientes criterios: a) Solo los clientes con una cuenta de AWS activa y en regla pueden optar a la transferencia de datos gratuita. b) Si tiene menos de 100 GB de datos almacenados en su cuenta de AWS, puede mover estos datos fuera de AWS de forma gratuita bajo la capa gratuita mensual de 100 GB de transferencia de datos existente de AWS. Los clientes con menos de 100 GB de datos almacenados en su cuenta de AWS no pueden recibir créditos adicionales. c) AWS le proporcionará una transferencia de datos gratuita a Internet cuando traslade todos sus datos fuera de AWS. Si solo desea cambiar el uso total de un único servicio, pero no de todo, póngase en contacto con el servicio de atención al cliente de AWS. d) Si sus planes cambian o no puede completar su traslado de AWS en un plazo de 60 días, debe comunicárselo al servicio de atención al cliente de AWS. e) Los cargos por servicios estándar por el uso de los servicios de AWS no están incluidos. Solo los cargos por transferencia de datos para respaldar su salida de AWS son aptos para la obtención de un crédito. Sin embargo, no se incluye la transferencia de datos desde servicios de transferencia de datos especializados, como Amazon CloudFront, AWS Direct Connect, AWS Snowball y AWS Global Accelerator. f) AWS puede revisar el uso del servicio para verificar el cumplimiento de estos requisitos. Si determinamos que utilizó la transferencia de datos con un fin distinto al de dejar AWS, es posible que le cobremos por la transferencia de datos acreditada. g) AWS puede realizar cambios con respecto a las transferencias de datos gratuitas a Internet en cualquier momento.

Los clientes de AWS realizan cientos de millones de transferencias de datos cada día y, por lo general, no sabemos el motivo de ninguna transferencia de datos determinada. Por ejemplo, los clientes pueden transferir datos a un usuario final de su aplicación, a un visitante de su sitio web o a otro entorno en las instalaciones o en la nube para hacer copias de seguridad. Por lo tanto, la única forma que tenemos de saber si transfiere los datos para retirarlos de AWS es que nos informe previamente.

S3 Vectors

Abrir todo

Puede empezar a utilizar S3 Vectors en cuatro sencillos pasos, sin tener que configurar ninguna infraestructura fuera de Amazon S3. En primer lugar, cree un bucket vectorial en una región de AWS específica mediante la API CreateVectorBucket o en la consola S3. En segundo lugar, para organizar los datos vectoriales en un depósito vectorial, debe crear un índice vectorial con la API CreateIndex o en la consola de S3. Al crear un índice vectorial, se especifica la métrica de distancia (coseno o euclidiano) y el número de dimensiones que debe tener un vector (hasta 4092). Para obtener resultados más precisos, seleccione la métrica de distancia recomendada por su modelo de incrustación. En tercer lugar, añada datos vectoriales a un índice vectorial con la API PutVectors. Si lo desea, puede adjuntar metadatos como pares de valores clave a cada vector para filtrar las consultas. En cuarto lugar, realiza una consulta de similitud con la API QueryVectors, especificando el vector que se va a buscar y el número de resultados más similares que se van a devolver.

Puede crear un índice vectorial mediante la consola S3 o la API CreateIndex. Durante la creación del índice, debe especificar el bucket vectorial, el índice, la métrica de distancia, las dimensiones y, opcionalmente, una lista de campos de metadatos que desea excluir del filtrado durante las consultas de similitud. Por ejemplo, si desea almacenar datos asociados a vectores únicamente como referencia, puede especificarlos como campos de metadatos no filtrables. Tras la creación, a cada índice se le asigna un nombre de recurso de Amazon (ARN) único. Posteriormente, cuando realizas una solicitud de escritura o consulta, la diriges a un índice vectorial dentro de un bucket vectorial.

Puede agregar vectores a un índice vectorial mediante la API PutVectors. Cada vector consta de una clave que identifica de forma única cada vector en un índice vectorial (por ejemplo, puede generar un UUID mediante programación). Para maximizar el rendimiento de escritura, se recomienda insertar vectores en lotes grandes, hasta alcanzar el tamaño máximo de la solicitud. Además, puede adjuntar metadatos (por ejemplo, año, autor, género y ubicación) como pares de valores clave a cada vector. Al incluir metadatos, de forma predeterminada, todos los campos se pueden usar como filtros en una consulta de similitud, a menos que se especifiquen como metadatos no filtrables en el momento de la creación del índice vectorial. Para generar nuevas incrustaciones vectoriales de sus datos no estructurados, puede utilizar la API InvokeModel de Amazon Bedrock y especificar el ID del modelo de incrustación que desea utilizar.

Puedes usar la API GetVectors para buscar y devolver vectores y metadatos asociados mediante la clave vectorial.

Puede ejecutar una consulta de similitud con la API QueryVectors, especificando el vector de consulta, el número de resultados relevantes que se devolverán (los k vecinos más cercanos) y el ARN del índice. Al generar el vector de consulta, debe usar el mismo modelo de incrustación que se usó para generar los vectores iniciales almacenados en el índice vectorial. Por ejemplo, si utiliza Amazon Titan Text Embeddings v2 en Amazon Bedrock para generar incrustaciones de sus documentos, se recomienda utilizar el mismo modelo para convertir una pregunta en un vector. Además, puede usar filtros de metadatos en una consulta para buscar vectores que coincidan con el filtro. Al ejecutar la consulta de similitud, se devuelven las claves vectoriales de forma predeterminada. Si lo desea, puede incluir la distancia y los metadatos en la respuesta.

S3 Vectors ofrece un almacenamiento vectorial muy duradero y disponible. Los datos escritos en S3 Vectors se almacenan en S3, que está diseñado para ofrecer una durabilidad de datos de 11 a 9 segundos. S3 Vectors está diseñado para ofrecer una disponibilidad del 99,99% con un SLA de disponibilidad del 99,9%.

S3 Vectors ofrece tiempos de latencia de consulta inferiores a un segundo. Utiliza el rendimiento elástico de Amazon S3 para gestionar las búsquedas en millones de vectores y es ideal para cargas de trabajo de consultas poco frecuentes.

Para realizar consultas de similitud para sus incrustaciones vectoriales, varios factores pueden afectar a la recuperación promedio, como el modelo de incrustación, el tamaño del conjunto de datos vectoriales (número de vectores y dimensiones) y la distribución de las consultas. S3 Vectors ofrece una recuperación promedio de más del 90% para la mayoría de los conjuntos de datos. La recuperación promedio mide la calidad de los resultados de la consulta: el 90% significa que la respuesta contiene el 90% de la verdad básica de los vectores más cercanos, que están almacenados en el índice, al vector de la consulta. Sin embargo, dado que el rendimiento real puede variar según su caso de uso específico, le recomendamos que realice sus propias pruebas con datos y consultas representativos para validar que los índices vectoriales de S3 cumplen con sus requisitos de recuperación.

Puedes ver una lista de vectores en un índice vectorial con la API ListVectors, que devuelve hasta 1000 vectores a la vez con un indicador si la respuesta está truncada. La respuesta incluye la fecha de la última modificación, la clave vectorial, los datos vectoriales y los metadatos. También puede usar la API ListVectors para exportar fácilmente datos vectoriales de un índice vectorial específico. La operación ListVectors es muy coherente. Por lo tanto, después de escribir, puede enumerar inmediatamente los vectores con cualquier cambio reflejado.

Con S3 Vectors, paga por el almacenamiento y cualquier solicitud de escritura y lectura aplicable (por ejemplo, insertar vectores y realizar operaciones de consulta en los vectores de un índice vectorial). Para ver los detalles de precios, consulta la página de precios de S3.

Sí. Al crear una base de conocimientos de Bedrock a través de la consola o API de Bedrock, puede configurar un índice vectorial S3 existente como su almacén de vectores para ahorrar en costos de almacenamiento vectorial para los casos de uso de RAG. Si prefiere dejar que Bedrock cree y gestione el índice vectorial por usted, utilice el flujo de trabajo de creación rápida en la consola de Bedrock. Además, puede configurar un nuevo índice vectorial de S3 como almacén de vectores para los flujos de trabajo de RAG en Amazon SageMaker Unified Studio.

Sí. Hay dos maneras de utilizar S3 Vectors con Amazon OpenSearch Service. En primer lugar, los clientes de S3 pueden exportar todos los vectores de un índice vectorial de S3 a OpenSearch Serverless como una nueva colección sin servidor mediante la consola S3 o OpenSearch. Si crea de forma nativa en S3 Vectors, se beneficiará de poder usar OpenSearch Serverless de forma selectiva para cargas de trabajo con necesidades de consultas en tiempo real. En segundo lugar, si es un cliente gestionado de OpenSearch, ahora puede elegir S3 Vectors como su motor de datos vectoriales que se pueden consultar con una latencia inferior a un segundo. A continuación, OpenSearch utilizará automáticamente S3 Vectors como motor subyacente para los vectores y usted podrá actualizar y buscar sus datos vectoriales mediante las API de OpenSearch. Obtendrá los beneficios económicos de S3 Vectors, sin cambios en sus aplicaciones.

Amazon S3 e IPv6

Abrir todo

Cada servidor y dispositivo conectado a Internet debe tener una dirección única. El protocolo de Internet versión 4 (IPv4) era el esquema de direccionamiento de 32 bits original. Sin embargo, el constante crecimiento de Internet significa que con el tiempo se utilizarán todas las direcciones IPv4. El protocolo de Internet versión 6 (IPv6) es un mecanismo de direccionamiento diseñado para superar las limitaciones de direcciones globales de IPv4.

Gracias a la compatibilidad de Amazon S3 con IPv6, las aplicaciones pueden conectarse a Amazon S3 sin necesidad de ningún software o sistema de traducción de IPv6 a IPv4. Puede satisfacer los requisitos de conformidad, integrarse con aplicaciones locales existentes basadas en IPv6 de forma más sencilla y eliminar la necesidad de costoso equipo de red que se ocupe de la traducción de direcciones. Ahora también puede utilizar las características de filtrado de dirección de origen existentes de las políticas de IAM y políticas de bucket con direcciones IPv6, lo que le proporciona más opciones a la hora de proteger las aplicaciones que interactúan con Amazon S3.

Puede comenzar apuntando su aplicación a un punto de conexión de “doble pila” de Amazon S3 compatible con IPv4 e IPv6. En la mayoría de los casos, no será necesario hacer ninguna configuración adicional para el acceso a través de IPv6, ya que la mayoría de los clientes de red prefieren las direcciones IPv6 por defecto. Las aplicaciones afectadas por el uso de IPv6 pueden pasarse de nuevo a puntos de conexión estándar de solo IPv4 en cualquier momento. IPv6 con Amazon S3 es compatible en todas las regiones comerciales de AWS, incluidas las regiones AWS GovCloud (EE. UU.), la región de Amazon Web Services China (Pekín), operada por Sinnet, y la región de Amazon Web Services China (Ningxia), operada por NWCD.

No, el rendimiento que observe será el mismo tanto si utiliza IPv4 como IPv6 con Amazon S3.

Notificaciones de eventos de S3

Abrir todo

Puede usar la característica de notificaciones de eventos de Amazon S3 para recibir notificaciones cuando sucedan determinados eventos en su bucket de S3, como eventos de PUT, POST, COPY y DELETE. Puede publicar notificaciones en Amazon EventBridge, Amazon SNS, Amazon SQS o directamente en AWS Lambda.

Las notificaciones de eventos de Amazon S3 le permiten ejecutar flujos de trabajo, enviar alertas o realizar otras acciones en respuesta a los cambios que se produzcan en los objetos almacenados en S3. Puede utilizar las notificaciones de eventos de S3 para configurar desencadenadores que realicen acciones, como la transcodificación de archivos multimedia cuando se carguen, el procesamiento de archivos de datos cuando estén disponibles y la sincronización de objetos de S3 con otros almacenes de datos. También puede configurar notificaciones de eventos a partir de prefijos y sufijos del nombre del objeto. Por ejemplo, puede elegir recibir notificaciones de nombres de objetos que empiecen por “images/”.

Para obtener una descripción detallada de la información que se incluye en los mensajes de notificación de eventos de Amazon S3, consulte la documentación sobre la configuración de notificaciones de eventos de Amazon S3.

Para obtener una descripción detallada sobre cómo configurar las notificaciones de eventos, consulte la documentación sobre la configuración de notificaciones de eventos de Amazon S3. Puede obtener más información sobre los servicios de mensajería de AWS en la documentación de Amazon SNS y en la documentación de Amazon SQS.

No se aplica ningún cargo adicional por utilizar las notificaciones de eventos de Amazon S3. Solo tiene que pagar por utilizar Amazon SNS o Amazon SQS para la entrega de las notificaciones de eventos o por el costo que supone la ejecución de la función de AWS Lambda. Visite las páginas de precios de Amazon SNS , Amazon SQS o AWS Lambda para ver los detalles de precios de estos servicios.

Amazon S3 Transfer Acceleration

Abrir todo

Amazon S3 Transfer Acceleration crea transferencias rápidas, fáciles y seguras de archivos a largas distancias entre su cliente y su bucket de Amazon S3. S3 Transfer Acceleration aprovecha las ubicaciones de AWS Edge distribuidas a nivel mundial de Amazon CloudFront. A medida que los datos llegan a una ubicación periférica de AWS, se redirigen al bucket de Amazon S3 a través de una ruta de red optimizada.

Para empezar a usar la Aceleración de transferencias de S3, active la Aceleración de transferencias de S3 en un bucket de S3 con la consola de Amazon S3, la API de Amazon S3 o AWS CLI. Una vez activada la Aceleración de transferencias de S3, puede dirigir las solicitudes PUT y GET de Amazon S3 al nombre de dominio del punto de conexión s3-accelerate. La aplicación de transferencia de datos debe usar uno de los siguientes dos tipos de extremos para acceder al bucket y transferir los datos con mayor rapidez: .s3-accelerate.amazonaws.com r .s3-accelerate.dualstack.amazonaws.com para el punto de enlace “dual-stack”. Si desea utilizar la transferencia de datos estándar, puede continuar utilizando los puntos de enlace habituales. Existen determinadas restricciones en relación con los buckets que admitirán la Aceleración de transferencias de S3. Para obtener más información, consulte la documentación de Amazon S3.

S3 Transfer Acceleration lo ayuda a utilizar la totalidad de su ancho de banda, lo que reduce los efectos de la distancia en el rendimiento, y está diseñado para garantizar una transferencia de datos rápida y uniforme a Amazon S3 independientemente de dónde se encuentre su cliente. El grado de aceleración depende principalmente del ancho de banda del que disponga, de la distancia entre el origen y el destino, y de las tasas de pérdida de paquetes en la ruta de red. Por lo general, observará mayor aceleración cuando el origen se encuentre a mayor distancia del destino, cuando se disponga de más ancho de banda o cuando el tamaño del objeto sea mayor. Un cliente midió una reducción del 50 % en el tiempo medio que tardaba en capturar archivos de 300 MB de una base de usuarios global repartidos por Estados Unidos, Europa y partes de Asia a un bucket en la región Asia-Pacífico (Sídney). Otro cliente observó casos en los que el rendimiento se incrementó más del 500 % cuando usuarios del Sureste de Asia y de Australia cargaban archivos de 250 MB (en partes de 50 MB) en un bucket de S3 en la región Este de EE. UU. (Norte de Virginia). Acceda a la herramienta de comparación de velocidad de la Aceleración de transferencias de S3 para obtener una vista previa de la mejora en el rendimiento que podría obtener desde su ubicación.

S3 Transfer Acceleration está diseñado para optimizar las velocidades de transferencia desde cualquier parte del mundo a buckets de S3. Si desea cargar datos a un bucket centralizado desde ubicaciones dispersas geográficamente o si transfiere GB o TB de datos con frecuencia entre continentes, podrá reducir los tiempos de transferencias en horas o incluso días con la Aceleración de transferencias de S3.

La Aceleración de transferencias de S3 proporciona el mismo nivel de seguridad que las transferencias convencionales a Amazon S3. Además, admite todas las características de seguridad de Amazon S3, como la restricción del acceso a partir de la dirección IP de un cliente. La Aceleración de transferencias de S3 se comunica con los clientes a través de un TCP estándar y no es necesario realizar cambios en el firewall. Nunca se guarda ningún dato en las ubicaciones de AWS Edge.

Cada vez que utiliza S3 Transfer Acceleration para cargar un objeto, comprobaremos si es probable que sea más rápido que una transferencia convencional de Amazon S3. Si determinamos que no es probable que S3 Transfer Acceleration sea más rápido que una transferencia convencional de Amazon S3 para el mismo objeto y la misma región de AWS de destino, no le cobraremos el uso de S3 Transfer Acceleration para esa transferencia y podremos omitir el sistema S3 Transfer Acceleration para dicha carga.

Sí, S3 Transfer Acceleration admite todas las características a nivel de bucket, incluidas las cargas multiparte.

S3 Transfer Acceleration optimiza el protocolo TCP y agrega inteligencia adicional entre el cliente y el bucket de S3, por lo que resulta una mejor opción si se desea un nivel de procesamiento más elevado. Si tiene objetos de tamaño inferior a 1 GB o si el conjunto de datos tiene un tamaño inferior a 1 GB, debería considerar el uso de los comandos PUT o POST de Amazon CloudFront para lograr un rendimiento óptimo.

AWS Direct Connect es una buena opción para los clientes que necesitan una red privada o que tienen acceso a los intercambios de AWS Direct Connect. La Aceleración de transferencias de S3 es más adecuada para enviar datos de ubicaciones de clientes distribuidas a través del Internet público, o en el caso de que las variaciones en el estado de la red resulten en un rendimiento insuficiente. Algunos clientes de AWS Direct Connect utilizan la Aceleración de transferencias de S3 para ayudar con las transferencias de oficinas remotas si estas disponen de conexiones a Internet de rendimiento insuficiente.

Si configura el destino del bucket en su puerta de enlace de terceros para que use un dominio del punto de conexión de la Aceleración de transferencias de S3, podrá obtener beneficios.
Visite esta sección de archivos de las preguntas frecuentes sobre Storage Gateway para obtener más información sobre la implementación de AWS.

Sí. Los paquetes de software que se conectan directamente con Amazon S3 pueden aprovechar S3 Transfer Acceleration cuando envían tareas a Amazon S3. Obtenga más información sobre soluciones de socios de almacenamiento »

Sí, AWS ha ampliado su programa de cumplimiento de la HIPAA para incluir S3 Transfer Acceleration como un servicio que cumple los requisitos de la HIPAA. Si tiene un Contrato de asociación empresarial (BAA) con AWS, puede utilizar la Aceleración de transferencias de S3 para realizar transferencias de archivos seguras, rápidas y simples, entre ellas, de información de salud protegida (PHI) entre distancias importantes entre su cliente y su bucket de Amazon S3.

Seguridad

Abrir todo

Amazon S3 es seguro de forma predeterminada. Al momento de su creación, solo el usuario tiene acceso a los buckets de Amazon S3 que crea y tiene control total sobre quién puede acceder a los datos. Amazon S3 admite la autenticación de usuario para controlar el acceso a los datos. Puede usar mecanismos de control de acceso, como las políticas de bucket, para conceder permisos de manera selectiva a los usuarios y grupos de usuarios. La consola de Amazon S3 destaca sus buckets con acceso público, indica el origen de accesibilidad pública y también le advierte si los cambios en sus políticas de bucket o ACL de bucket harían que su bucket sea accesible públicamente. Debe habilitar Amazon S3 Block Public Access para todas las cuentas y buckets a los que no desee que tengan acceso público. Todos los buckets nuevos tienen activado el Bloqueo de acceso público de forma predeterminada. Puede cargar y descargar de forma segura los datos en Amazon S3 a partir de puntos de conexión SSL con el protocolo HTTPS. Amazon S3 cifra automáticamente todas las cargas de objetos a su bucket (a partir del 5 de enero de 2023). Como alternativa, puede usar sus propias bibliotecas de cifrado para cifrar datos antes de almacenarlos en Amazon S3.
Para obtener más información sobre la seguridad en AWS, consulte la página de seguridad de AWS y, para obtener información sobre seguridad de S3, visite la página de seguridad de S3 y la guía de prácticas recomendadas de seguridad de S3.

Los clientes pueden utilizar varios mecanismos para controlar el acceso a los recursos de Amazon S3, entre los que se incluyen las políticas de AWS Identity and Access Management (IAM), las políticas de bucket, las políticas de puntos de acceso, las listas de control de acceso (ACL), la autenticación con cadena de consulta, las políticas de punto de conexión de Amazon Virtual Private Cloud (Amazon VPC), las políticas de control de servicios (SCP) en AWS Organizations y Amazon S3 Block Public Access.

Sí, los clientes pueden configurar de manera opcional un bucket de Amazon S3 para crear registros de acceso para todas las solicitudes creadas y destinadas a este. Opcionalmente, los clientes que necesiten obtener información sobre identidades de usuarios/IAM en sus registros pueden configurar AWS CloudTrail Data Events. Estos registros de acceso pueden utilizarse con fines de auditoría y contienen detalles sobre la solicitud, como el tipo de solicitud, los recursos especificados en esta y la hora y fecha en que se procesó.

Amazon S3 cifra todas las cargas de datos nuevas a cualquier bucket. Amazon S3 aplica el cifrado del lado del servidor administrado por S3 (SSE-S3) como nivel básico de cifrado para todas las cargas de objetos (a partir del 5 de enero de 2023). SSE-S3 ofrece una solución totalmente administrada en la que Amazon se encarga de la gestión y la protección de las claves mediante varias capas de seguridad. Si prefiere que Amazon administre sus claves, debería seguir utilizando SSE-S3. Además, puede optar por cifrar los datos mediante SSE-C, SSE-KMS, DSSE-KMS o una biblioteca del cliente como el Cliente de cifrado de Amazon S3. Cada opción le permite almacenar datos confidenciales cifrados en reposo en Amazon S3. SSE-C permite a Amazon S3 realizar el cifrado y descifrado de objetos, mientras que usted retiene el control de las claves de cifrado. Con SSE-C, no necesita implementar ni utilizar una biblioteca del lado del cliente para realizar el cifrado y el descifrado de los objetos que almacene en Amazon S3, pero sí tiene que administrar las claves que envíe a Amazon S3 para cifrar y descifrar los objetos. Utilice SSE-C si desea conservar sus propias claves de cifrado y no desea implementar ni aprovechar una biblioteca de cifrado del lado del cliente. SSE-KMS permite a AWS Key Management Service (AWS KMS) administrar sus claves de cifrado. El uso de AWS KMS para administrar sus claves proporciona varios beneficios adicionales. Con AWS KMS, existen permisos independientes para el uso de la clave KMS, lo que proporciona una capa adicional de control y protección contra el acceso no autorizado a sus objetos almacenados en Amazon S3. AWS KMS proporciona un registro de auditoría para que pueda ver quién utilizó su clave para acceder a qué objeto y cuándo, así como ver los intentos fallidos de acceso a los datos de los usuarios sin permiso para descifrar los datos. Además, AWS KMS proporciona controles de seguridad adicionales para respaldar los esfuerzos de los clientes por cumplir con los requisitos industriales de PCI-DSS, HIPAA/HITECH y FedRAMP. DSSE-KMS simplifica el proceso de aplicar dos capas de cifrado a los datos, sin tener que invertir en la infraestructura necesaria para el cifrado del cliente. Cada capa de cifrado utiliza una implementación diferente del algoritmo estándar de cifrado avanzado de 256 bits con modo contador de Galois (AES-GCM) y se examina y acepta su uso en cargas de trabajo secretas. DSSE-KMS usa AWS KMS para generar claves de datos y permite que AWS KMS administre sus claves de cifrado. Con AWS KMS, existen permisos independientes para el uso de la clave KMS, lo que proporciona una capa adicional de control y protección contra el acceso no autorizado a sus objetos almacenados en Amazon S3. AWS KMS proporciona un registro de auditoría para que pueda ver quién utilizó su clave para acceder a qué objeto y cuándo, así como ver los intentos fallidos de acceso a los datos de los usuarios sin permiso para descifrar los datos. Además, AWS KMS proporciona controles de seguridad adicionales para respaldar los esfuerzos de los clientes por cumplir con los requisitos industriales de PCI-DSS, HIPAA/HITECH y FedRAMP. Al utilizar una biblioteca de cliente de cifrado, usted retiene el control de las claves y completa el cifrado y descifrado de los objetos del lado del cliente por medio de una biblioteca de cifrado de su elección. Algunos clientes prefieren un control total de extremo a extremo del cifrado y el descifrado de los objetos; de ese modo, solo los objetos cifrados se transmiten por Internet a Amazon S3. Utilice una biblioteca del lado del cliente si quiere mantener el control de las claves de cifrado, si puede implementar o utilizar una biblioteca de cifrado del cliente y si necesita cifrar los objetos antes de enviarlos a Amazon S3 para su almacenamiento. Para obtener más información sobre cómo usar SSE-KMS, SSE-C o SSE-S3 de Amazon S3, consulte la documentación sobre cómo proteger los datos con el cifrado.

Los clientes pueden elegir almacenar todos los datos en Europa utilizando la región Europa (Fráncfort), Europa (Irlanda), Europa (París), Europa (Estocolmo), Europa (Milán), Europa (España), Europa (Londres) o Europa (Zúrich). También puede usar Amazon S3 on Outposts para mantener todos sus datos in situ en AWS Outpost, y puede optar por transferir datos entre AWS Outposts o a una región de AWS. Es responsabilidad suya asegurarse de que cumple con las leyes de privacidad europeas. Consulte el Centro del Reglamento General de Protección de Datos (GDPR) de AWS y el Centro de privacidad de datos de AWS para obtener más información. Si tiene requisitos de ubicación más específicos u otras normativas de privacidad de datos que le exigen conservar sus datos en un lugar donde no haya región de AWS, puede usar clases de almacenamiento de S3 para zonas locales dedicadas de AWS o S3 en Outposts.

De forma predeterminada, los datos y metadatos del objeto permanecen dentro de la única zona local dedicada en la que se coloca el objeto. Los datos de telemetría y administración de buckets, incluidos los nombres de buckets, las métricas de capacidad, los registros de CloudTrail, las métricas de CloudWatch, las claves administradas por los clientes de AWS Key Management Service (KMS) y las políticas de Identity and Access Management (IAM), se almacenan en la región principal de AWS. De manera opcional, otras características de administración de buckets, como Operaciones por lotes de S3, almacenan los metadatos de administración con el nombre del bucket y el nombre del objeto en la región principal de AWS.

Un punto de enlace de Amazon VPC para Amazon S3 es una entidad lógica dentro de una VPC que permite la conectividad con S3 a través de la red global de AWS. Existen dos tipos de puntos de conexión de VPC para S3: de puerta de enlace y de interfaz. Los puntos de conexión de puerta de enlace son una puerta de enlace que se especifica en la tabla de enrutamiento para acceder a S3 desde su VPC a través de la red de AWS. Los puntos de conexión de interfaz extienden la funcionalidad de los puntos de conexión de puertas de enlace a través de IP privadas para redirigir solicitudes a S3 desde su VPC, el sistema en las instalaciones o una región de AWS diferente. Para obtener más información, visite la documentación de AWS PrivateLink para Amazon S3.

Puede limitar el acceso a su bucket desde un punto de enlace de la VPC de Amazon específico o un conjunto de puntos de enlace mediante las políticas de buckets de Amazon S3. Las políticas de buckets de S3 ahora admiten una condición, aws:sourceVpce, que puede usar para restringir el acceso. Para obtener más detalles y políticas de ejemplo, lea la documentación sobre los puntos de conexión de puertas de enlace para S3.

AWS PrivateLink para S3 brinda conectividad privada entre Amazon S3 y el sistema en las instalaciones. Puede aprovisionar su VPC con puntos de conexión de VPC de interfaz para S3 para conectar sus aplicaciones en las instalaciones directamente a S3 a través de AWS Direct Connect o AWS VPN. Ya no necesita usar IP públicas, cambiar las reglas de firewall ni configurar una puerta de enlace de Internet para acceder a S3 desde el sistema en las instalaciones. Para obtener más información, consulte la documentación de AWS PrivateLink para S3.

Puede crear un punto de conexión de VPC de interfaz a través de la consola de administración de la VPC de AWS, la interfaz de la línea de comandos de AWS (AWS CLI), el AWS SDK o la API. Para obtener más información, consulte la documentación.

AWS recomienda el uso de puntos de conexión de VPC de interfaz para acceder a S3 desde el sistema en las instalaciones o desde una VPC en otra región de AWS. Para recursos que acceden a S3 desde una VPC en la misma región de AWS que S3, se recomienda usar puntos de conexión de VPC de puerta de enlace, ya que estos no se facturan. Para obtener más información, consulte la documentación.

Sí. Si ya tiene un punto de conexión de VPC de puerta de enlace existente, cree un punto de conexión de VPC de interfaz en su VPC y actualice las aplicaciones de cliente con los nombres específicos de los puntos de conexión de VPC. Por ejemplo, si el ID de punto de conexión de VPC para el punto de conexión de interfaz es vpce-0fe5b17a0707d6abc-29p5708s en la región us-east-1, el nombre de DNS específico del punto de conexión será vpce-0fe5b17a0707d6abc-29p5708s.s3.us-east-1.vpce.amazonaws.com. En este caso, solo las solicitudes para los nombres específicos de los puntos de conexión de VPC se redirigirán a través de los puntos de conexión de VPC de interfaz a S3, mientras que todas las demás solicitudes continuarían redirigiéndose a través del punto de conexión de VPC de puerta de enlace. Para obtener más información, consulte la documentación.

Amazon Macie es un servicio de seguridad basado en inteligencia artificial que lo ayuda a evitar la pérdida de datos al descubrir, clasificar y proteger automáticamente los datos confidenciales almacenados en Amazon S3. Amazon Macie utiliza machine learning para reconocer datos confidenciales, como información de identificación personal (PII) o propiedad intelectual, asigna un valor empresarial y proporciona visibilidad de la ubicación donde se almacenan los datos y cómo se utilizan en su empresa. Amazon Macie monitorea la actividad de acceso a los datos constantemente en busca de anomalías y envía alertas cuando detecta un riesgo de acceso no autorizado o filtraciones de datos involuntarias. Puede utilizar Amazon Macie para protegerse ante amenazas de seguridad gracias al monitoreo constante de los datos y las credenciales de cuenta. Amazon Macie ofrece una manera sencilla y automatizada de detectar y clasificar sus datos empresariales. Aporta controles mediante funciones de Lambda con plantillas para retirar el acceso o activar políticas de cambio de contraseña al descubrir comportamientos sospechosos o el acceso no autorizado a datos de entidades o aplicaciones de terceros. Cuando se generan alertas, puede utilizar Amazon Macie para responder a incidentes y utilizar Eventos de Amazon CloudWatch para tomar medidas de manera rápida y proteger sus datos. Para obtener más información, visite la documentación de Amazon Macie.

El Analizador de acceso para S3 es una característica que lo ayuda a simplificar la administración de permisos mientras establece, verifica y ajusta las políticas para sus puntos de acceso y buckets de S3. El Analizador de acceso para S3 supervisa sus políticas de acceso existentes para verificar que proporcionen solo el acceso necesario a sus recursos de S3. El Analizador de acceso para S3 evalúa las políticas de acceso del bucket y le permite detectar y modificar rápidamente los buckets que no requieren acceso. El Analizador de acceso para S3 le avisa cuando tiene un bucket que está configurado para permitirle el acceso a cualquier persona en Internet o que se comparte con otras cuentas de AWS. Recibe conclusiones sobre la fuente y el nivel de acceso compartido o público. Por ejemplo, el analizador de acceso para S3 informará de manera proactiva si se brindó acceso no solicitado de lectura o escritura a través de una lista de control de acceso (ACL) o política de bucket. Con estas conclusiones, puede configurar o restaurar de manera inmediata la política de acceso deseado. Cuando revisa los resultados que muestran el acceso potencialmente compartido a un bucket, puede bloquear el acceso público a un bucket con un solo clic en la consola de S3. También puede examinar a fondo las configuraciones de permisos de nivel de bucket para configurar niveles pormenorizados de acceso. Para fines de auditoría, puede descargar los hallazgos del analizador de acceso para S3 como un informe CSV. Además, la consola de S3 brinda advertencias de seguridad, informa errores y ofrece sugerencias del analizador de acceso de IAM a medida que se crean las políticas de S3. La consola ejecuta automáticamente más de 100 verificaciones de políticas para validar sus políticas. Estas verificaciones permiten ahorrar tiempo, funcionan como guía para resolver errores y ayudan a aplicar las prácticas recomendadas de seguridad.
Para obtener más información, consulte la documentación sobre el Analizador de acceso de IAM.

Concesiones de acceso de S3

Abrir todo

Las concesiones de acceso de Amazon S3 asignan identidades en directorios, como las entidades principales de Active Directory o AWS Identity and Access Management (IAM), a conjuntos de datos de S3. Esto lo ayuda a administrar los permisos de datos a escala al conceder automáticamente el acceso a S3 a los usuarios finales en función de su identidad corporativa. Además, las concesiones de acceso de S3 registran la identidad del usuario final y la aplicación utilizada para acceder a los datos de S3 en AWS CloudTrail. Esto ayuda a proporcionar un historial de auditoría detallado hasta la identidad del usuario final para todos los accesos a los datos de sus buckets de S3.

Debe utilizar las concesiones de acceso de S3 si muchos usuarios y aplicaciones comparten y acceden a sus datos de S3, donde algunas de sus identidades se encuentran en su directorio corporativo como Okta o Entra ID, y necesita una forma escalable, simple y auditable de conceder acceso a estos conjuntos de datos de S3 a escala.

Puede comenzar a utilizar las concesiones de acceso de S3 en cuatro pasos. En primer lugar, configure una instancia de concesiones de acceso de S3. En este paso, si quiere usar las concesiones de acceso de S3 con usuarios y grupos de su directorio corporativo, habilite AWS Identity Center y conecte las concesiones de acceso de S3 a su instancia de Identity Center. En segundo lugar, registre una ubicación con las concesiones de acceso de S3. Durante este proceso, se otorga a las concesiones de acceso de S3 un rol de IAM que permite crear credenciales de S3 temporales que los usuarios y las aplicaciones pueden utilizar para acceder a S3. En tercer lugar, defina las concesiones de permisos que especifican quién puede acceder a qué. Por último, en el momento del acceso, haga que la aplicación solicite una credencial temporal a las concesiones de acceso de S3 y utilice las credenciales proporcionadas por las concesiones de acceso para acceder a S3.

Las concesiones de acceso de S3 admiten dos tipos de identidades: las identidades de usuario empresarial o de grupo de AWS Identity Center y las entidades principales de AWS IAM, incluidos los usuarios y roles de IAM. Cuando utiliza las concesiones de acceso de S3 con AWS Identity Center, puede definir los permisos de datos en función de la pertenencia a grupos de directorios. AWS Identity Center es un servicio de AWS que se conecta a los proveedores de identidad más utilizados, incluidos Entra ID, Okta y Ping, entre otros. Además de admitir identidades de directorio a través de AWS Identity Center, las concesiones de acceso de S3 también admiten reglas de permisos para entidades principales de AWS IAM, incluidos los usuarios y roles de IAM. Esto es para casos de uso en los que se administra una federación de identidades personalizada no a través de AWS Identity Center, sino mediante una aserción de IAM y SAML (implementación de ejemplo), o se administran las identidades de las aplicaciones en función de las entidades principales de IAM y, aún así, desea usar las concesiones de acceso de S3 por su escalabilidad y auditabilidad.

Las concesiones de acceso de S3 ofrecen tres niveles de acceso: LECTURA, ESCRITURA y LECTOESCRITURA. LECTURA le permite ver y recuperar objetos de S3. ESCRITURA le permite escribir y borrar desde S3. LECTOESCRITURA le permite usar LECTURA y ESCRITURA.

No. Solo puede usar los tres niveles de acceso predefinidos (LECTURA/ESCRITURA/LECTOESCRITURA) que ofrecen las concesiones de acceso de S3.

Sí. Puede crear hasta 100 000 concesiones por instancia de concesiones de acceso de S3 y hasta 1000 ubicaciones por instancia de concesiones de acceso de S3.

No. La latencia para obtener credenciales temporales de las concesiones de acceso de S3 es similar a la de obtener credenciales temporales de AWS STS en la actualidad. Una vez que haya obtenido las credenciales de las concesiones de acceso de S3, puede reutilizar las credenciales que no hayan vencido para solicitudes posteriores. Para estas solicitudes posteriores, no hay latencia adicional para las solicitudes autenticadas mediante las credenciales de las concesiones de acceso de S3 en comparación con otros métodos.

Si tiene previsto utilizar las concesiones de acceso de S3 para las identidades de directorio, primero tendrá que configurar AWS IAM Identity Center. AWS IAM Identity Center permite crear o conectar las identidades de los miembros del personal, independientemente de que las identidades se creen y almacenen en Identity Center o en un proveedor de identidades externo. Consulte la documentación de Identity Center para conocer el proceso de configuración. Una vez configurada la instancia de Identity Center, puede conectarla a las concesiones de acceso de S3. Posteriormente, las instancias de acceso de S3 dependen de Identity Center para recuperar los atributos de los usuarios, como la pertenencia a grupos, para evaluar las solicitudes y tomar decisiones de autorización.

Sí. Si bien actualmente inicializa su cliente de S3 con credenciales de IAM asociadas a su aplicación (por ejemplo, credenciales de rol de IAM para EC2 o las funciones de IAM en cualquier lugar, o mediante credenciales de usuario de IAM a largo plazo), la aplicación necesitará obtener primero las credenciales de las concesiones de acceso de S3 antes de inicializar el cliente de S3. Estas credenciales de las concesiones de acceso de S3 serán específicas para el usuario autenticado de la aplicación. Una vez que el cliente de S3 se inicialice con estas credenciales de las concesiones de acceso de S3, podrá realizar solicitudes de datos de S3 con normalidad con las credenciales.

Actualmente, las concesiones de acceso de S3 ya se integran con EMR y Spark de código abierto a través del conector S3A. Además, las concesiones de acceso de S3 se integran con software de terceros, como Immuta e Informatica para que pueda centralizar la administración de permisos. Por último, las concesiones de acceso de S3 son compatibles con Terraform y CloudFormation para que pueda aprovisionarlas de forma programática.

No. Las concesiones de acceso de S3 no sustituyen a IAM y, de hecho, funcionan bien con sus estrategias actuales de protección de datos basadas en IAM (reglas de cifrado, red y perímetro de datos). Las concesiones de acceso de S3 se basan en primitivas de IAM y le permiten expresar permisos de S3 más detallados a escala.

Sí. Para utilizar las concesiones de acceso de S3 para objetos cifrados con KMS, los propietarios de buckets incluyen los permisos de KMS necesarios en el rol de IAM que conceden a las concesiones de acceso de S3 como parte del registro de ubicación. Posteriormente, las concesiones de acceso de S3 pueden utilizar ese rol de IAM para acceder a los objetos cifrados con KMS en los buckets.

Puede utilizar la experiencia de la consola de concesiones de acceso de S3 en la consola de administración de AWS, o en las API del SDK y la CLI para ver y administrar sus permisos de concesiones de acceso de S3.

No, no se puede conceder acceso público a los datos con las concesiones de acceso de S3.

La solicitud de la aplicación para iniciar una sesión de acceso a datos con las concesiones de acceso de S3 se registrará en CloudTrail. CloudTrail distinguirá la identidad del usuario que realiza la solicitud y la identidad de la aplicación que accede a los datos en nombre del usuario. Esto lo ayuda a auditar la identidad del usuario final para saber quién accedió a qué datos y en qué momento.

Las concesiones de acceso de S3 se cobran en función del número de solicitudes que se realicen. Para obtener más información, consulte la página de precios.

AWS Lake Formation es para casos de uso en los que se necesita administrar el acceso a datos tabulares (por ejemplo, tablas de Glue), en los que es posible que desee aplicar el acceso a nivel de fila y columna. Las concesiones de acceso de S3 sirven para administrar el acceso a los permisos de S3 directos, como datos no estructurados, incluidos vídeos, imágenes, registros, etc.

No. Las concesiones de acceso de S3 no están integradas con el Analizador de acceso de IAM en este momento. Todavía no se puede usar el Analizador de acceso de IAM para analizar las concesiones de permisos de las concesiones de acceso de S3. Los clientes pueden auditar las concesiones de acceso de S3 directamente accediendo a la página de concesiones de acceso de S3 en la consola de S3, o mediante programación utilizando la API ListAccessGrants.

Puntos de acceso de S3

Abrir todo

Los puntos de acceso de Amazon S3 son puntos de enlace que simplifican la administración del acceso a los datos para cualquier aplicación o servicio de AWS que funcione con S3. Los puntos de acceso S3 funcionan con los buckets S3 y Amazon FSx para los sistemas de archivos OpenZFS. Puede controlar y simplificar la forma en que las diferentes aplicaciones o usuarios pueden acceder a los datos mediante la creación de puntos de acceso con nombres y permisos adaptados a cada aplicación o usuario.

Al usar los puntos de acceso de S3 con depósitos de S3, ya no tendrá que administrar una política de depósitos única y compleja con cientos de reglas de permisos diferentes que deben escribirse, leerse, rastrearse y auditarse. En su lugar, puede crear cientos de puntos de acceso por depósito, cada uno de los cuales proporcione una ruta personalizada a un depósito, con un nombre de host y una política de acceso únicos que imponga los permisos y controles de red específicos para cualquier solicitud realizada a través del punto de acceso.

Al usar los puntos de acceso S3 con FSx para OpenZFS, puede acceder a sus datos de FSx mediante la API de S3 como si los datos estuvieran en S3. Con esta capacidad, los datos de sus archivos en FSx para OpenZFS son accesibles para su uso con la amplia gama de servicios y aplicaciones de inteligencia artificial, aprendizaje automático y análisis que funcionan con S3 mientras los datos de sus archivos siguen residiendo en el sistema de archivos FSx para OpenZFS.

Los puntos de acceso de S3 simplifican la forma de administrar el acceso a los conjuntos de datos compartidos en S3. Ya no es necesario que administre una política única y compleja de buckets con cientos de reglas de permisos distintas que deben escribirse, leerse, controlarse y auditarse. Con los puntos de acceso de S3, puede crear puntos de acceso o delegar permisos a cuentas de confianza para crear puntos de acceso entre cuentas en su bucket. Esto le permite acceder a conjuntos de datos compartidos con políticas adaptadas a la aplicación específica. Mediante el uso de puntos de acceso, puede descomponer una política de bucket extensa en políticas de puntos de acceso separadas y discretas para cada aplicación que necesite acceder a los conjuntos de datos compartidos. Esto facilita que pueda centrarse en crear la política de acceso adecuada para una aplicación, sin que deba preocuparse por interrumpir la actividad de otras aplicaciones dentro del conjunto de datos compartidos. También puede crear una política de control de servicios (SCP) y requerir que todos los puntos de acceso estén restringidos a una Virtual Private Cloud (VPC), lo que protege sus datos con un firewall dentro de sus redes virtuales.

Con los puntos de acceso S3, puede acceder a los datos de los archivos en Amazon FSx para OpenZFS mediante las API de S3 y sin mover los datos a S3. Los puntos de acceso S3 conectados a FSx para sistemas de archivos OpenZFS funcionan de manera similar a como funcionan los puntos de acceso S3 conectados a depósitos S3, ya que proporcionan acceso a los datos a través de S3 con acceso controlado por políticas de acceso, mientras que los datos se siguen almacenando en depósitos S3 o FSx para sistemas de archivos OpenZFS. Por ejemplo, una vez que un punto de acceso S3 se conecta a un sistema de archivos FSx para OpenZFS, los clientes pueden usar el punto de acceso con aplicaciones y servicios de inteligencia artificial generativa, aprendizaje automático y análisis que funcionan con S3 para acceder a sus datos de FSx for OpenZFS.

Cada punto de acceso de S3 está configurado con una política de acceso específica para un caso de uso o una aplicación y un bucket puede tener miles de puntos de acceso. Por ejemplo, puede crear un punto de acceso para el bucket de S3 que otorgue acceso a grupos de usuarios o aplicaciones para su lago de datos. Un punto de acceso puede admitir un solo usuario o aplicación, o bien grupos de usuarios o aplicaciones dentro de las cuentas o entre ellas. Asimismo, permite administrar cada punto de acceso por separado. Además, puede delegar permisos a cuentas de confianza para crear puntos de acceso entre cuentas en su bucket. Los puntos de acceso entre cuentas no le permiten el acceso a los datos hasta que el propietario del bucket le haya otorgado el permiso. El propietario del bucket siempre conserva el control final sobre los datos y debe actualizar la política del bucket para autorizar solicitudes de punto de acceso entre cuentas. Consulte la guía del usuario para ver un ejemplo de política de bucket. Cada punto de acceso está asociado con un bucket único y contiene un control de origen de red y un control de bloqueo del acceso público. Puede crear un punto de acceso con un control de origen de red que solo permita acceso de almacenamiento desde su nube virtual privada, una sección aislada lógicamente de la nube de AWS. También puede crear un punto de acceso con la política de punto de acceso configurada para permitir solo el acceso a objetos con prefijos definidos o a objetos con etiquetas específicas. Puede acceder a los datos de los buckets compartidos a través de un punto de acceso de dos maneras. Para las operaciones con objetos de S3, puede utilizar el ARN del punto de acceso en lugar de un nombre de bucket. En el caso de las solicitudes que requieran un nombre de bucket con el formato estándar de nombre de bucket de S3, se puede utilizar un alias de punto de acceso en su lugar. Los alias de puntos de acceso de S3 se generan de manera automática y son intercambiables con nombres de buckets de S3 en cualquier lugar en el que se utilice un nombre de bucket para acceder a datos. Cada vez que cree un punto de acceso para un bucket, S3 genera automáticamente un nuevo alias de punto de acceso. Para obtener el conjunto completo de operaciones y servicios de AWS compatibles, consulte la documentación de S3.

De manera predeterminada, puede crear 10 000 puntos de acceso de S3 por región por cuenta en los buckets de su cuenta y entre cuentas. No hay un límite estricto en el número de puntos de acceso de S3 por cuenta de AWS. Visite Service Quotas para solicitar un aumento de esta cuota.

Los puntos de acceso S3 tienen su propia política de punto de acceso IAM. Usted escribe las políticas de punto de acceso que tal como lo haría con la política de bucket, utilizando el ARN del punto de acceso como recurso. Las políticas de punto de acceso pueden otorgar o restringir el acceso a los datos de S3 solicitados a través del punto de acceso. Amazon S3 evalúa todas las políticas de pertinentes, incluidas las políticas de control de servicios, de usuario, bucket, punto de acceso y punto de enlace de la VPC, así como las listas de control de acceso, a fin de decidir si se debe autorizar a solicitud.

Puede escribir una política de punto de acceso del mismo modo que una política de bucket mediante reglas de IAM para controlar los permisos y el ARN de punto de acceso en el documento de la política.

Puede seguir utilizando las políticas de bucket para limitar el acceso de los buckets a VPC específicos. Los puntos de acceso proporciona un modo de auditoría más fácil para bloquear todos los datos o un subconjunto de ellos en un conjunto de datos compartidos para el tráfico único de VPC para todas las aplicaciones de su organización que utiliza controles de la API. Usted puede usar una política de control de servicios (SCP) de AWS Organizations para ordenar que ningún punto de acceso creado en su organización establezca el valor del parámetro API “control de origen de red” en “vpc”. Entonces, cualquier punto de acceso nuevo creado automáticamente restringe el acceso a los datos al tráfico único de VPC. No se requiere ninguna política de acceso adicional para asegurarse de que se procesaron solicitudes de datos únicamente de VPC especificadas.

Sí. Para aplicar una política de “Sin acceso a datos de Internet” en los puntos de acceso de su organización, deberá asegurarse de que todos los puntos de acceso hagan cumplir el acceso único de VPC. Para ello, deberá escribir un SCP de AWS que solo admita el valor “vpc” para el parámetro “control de origen de red” en la API create_access_point(). En caso de tener puntos de acceso orientados a Internet que haya creado antes, pueden eliminarse. También necesitará modificar la política de bucket en cada uno de los buckets para restringir aún más el acceso a Internet directamente en su bucket a través del nombre de host del bucket. Dado que otros servicios de AWS pueden estar accediendo a su bucket de forma directa, asegúrese de configurar el acceso de manera que permita los servicios de AWS que usted desea mediante la modificación de la política para permitir estos servicios de AWS. Consulte la documentación de S3 para conocer ejemplos de cómo hacerlo.

No actualmente, pero puede vincular la política de un bucket que rechace las solicitudes que no fueron creadas utilizando un punto de acceso. Consulte la documentación de S3 para obtener más información.

Sí. Cuando elimina un punto de acceso, no se interrumpirá el acceso al bucket asociado a través de otros puntos de acceso, y a través del nombre de host del bucket.

No hay cargo adicional para los puntos de acceso o para los buckets que usan puntos de acceso. Se aplican las tarifas de solicitud habituales de Amazon S3.

Puede empezar creando puntos de acceso de S3 en buckets nuevos, así como en buckets existentes, mediante la consola de administración de AWS, la interfaz de línea de comandos (CLI) de AWS, la interfaz de programación de aplicaciones (API) y el cliente del kit de desarrollo de software (SDK) de AWS. Para obtener más información sobre los puntos de acceso de S3, consulte la guía del usuario.

Durabilidad y protección de datos

Abrir todo

Amazon S3 proporciona el almacenamiento más duradero de la nube. Gracias a su arquitectura única, S3 está diseñado para proveer el 99,999999999 % (11 nueves) de durabilidad de los datos. Además, S3 almacena los datos de forma redundante en un mínimo de tres zonas de disponibilidad (AZ) de forma predeterminada, lo que proporciona resiliencia integrada ante desastres generalizados. Los clientes pueden almacenar los datos en una única zona de disponibilidad para minimizar los costos de almacenamiento o la latencia, en varias zonas de disponibilidad para evitar la pérdida permanente de todo un centro de datos o en varias regiones de AWS para cumplir con los requisitos de resiliencia geográfica.

El diseño de Amazon S3 para la durabilidad depende de las tasas de errores de los dispositivos de almacenamiento y de la velocidad a la que S3 puede detectar los errores y, a continuación, volver a replicar los datos en esos dispositivos. S3 realiza una comprobación de integridad de extremo a extremo en cada carga de objetos y verifica que todos los datos se almacenen de forma correcta y redundante en varios dispositivos de almacenamiento antes de considerar que la carga se ha realizado de forma correcta. Una vez que los datos se almacenan en S3, S3 supervisa de forma continua la durabilidad de los datos a lo largo del tiempo con comprobaciones periódicas de integridad de todos los datos en reposo. S3 también supervisa de forma activa la redundancia de los datos para ayudar a verificar que los objetos puedan tolerar los fallos simultáneos de varios dispositivos de almacenamiento.

En el improbable caso de pérdida o daño de la totalidad o parte de una zona de disponibilidad de AWS, es posible que se pierdan los datos de una clase de almacenamiento de una zona. Por ejemplo, eventos como incendios o daños causados por el agua podrían provocar la pérdida de los datos. Además de este tipo de eventos, las clases de almacenamiento de una zona utilizan diseños de ingeniería similares a los de las clases de almacenamiento regionales para proteger los objetos de errores independientes a nivel de disco, host y bastidor, y cada una está diseñada para ofrecer una durabilidad de datos del 99,999999999 %.

Amazon S3 tiene una sólida cultura de durabilidad, y nuestros sistemas y software incorporan las prácticas recomendadas de durabilidad desde cero. AWS tiene más experiencia en la administración de almacenamiento de alta durabilidad que cualquier otro proveedor de la nube, y utilizamos esta experiencia para mitigar el riesgo de durabilidad e incorporar medidas de protección de la durabilidad en todo lo que hacemos.

Sí. El sistema de durabilidad de Amazon S3 no protege contra eliminaciones accidentales o maliciosas. S3 confía en que los clientes decidan qué datos quieren conservar, de qué datos quieren deshacerse y qué controles opcionales necesitan para protegerse de las eliminaciones incorrectas, ya sean accidentales o maliciosas. Cuando le indica a Amazon S3 que elimine datos, esos datos se eliminan de inmediato y AWS no puede recuperarlos. Cumplir con una solicitud de eliminación de esta manera es una característica importante del servicio.

El control de versiones de objetos de S3, la replicación de S3 y el bloqueo de objetos de S3 son características opcionales que puede utilizar para agregar protección de datos adicional, más allá de la durabilidad que S3 proporciona de forma automática. Además, puede usar una aplicación de respaldo para hacer copias de seguridad de todos o parte de los datos de sus buckets de S3.

Amazon S3 utiliza una combinación de sumas de comprobación MD5 de contenido, algoritmos de hash seguros (SHA) y verificaciones de redundancia cíclica (CRC) para comprobar la integridad de los datos. Amazon S3 realiza estas sumas de comprobación en los datos en reposo y repara cualquier disparidad utilizando datos redundantes. Además, los SDK de AWS más recientes calculan automáticamente sumas de comprobación eficaces basadas en CRC para todas las cargas. S3 verifica de forma independiente esa suma de comprobación y solo acepta objetos después de confirmar que la integridad de los datos se mantuvo en tránsito a través de la Internet pública. Si se utiliza una versión del SDK que no proporciona sumas de comprobación calculadas previamente para cargar un objeto, S3 calcula una suma de comprobación basada en CRC de todo el objeto, incluso para las cargas multiparte. Las sumas de comprobación se almacenan en los metadatos de los objetos y, por lo tanto, están disponibles para verificar la integridad de los datos en todo momento. Puede elegir entre cinco algoritmos de suma de comprobación compatibles para comprobar la integridad de los datos de las solicitudes de carga y descarga. Puede elegir un algoritmo de suma de comprobación SHA-1, SHA-256, CRC32, CRC32C o CRC64NVME en función de las necesidades de su aplicación. Puede calcular automáticamente y verificar sumas de comprobación a medida que almacena o recupera datos de S3. También puede acceder a la información de la suma de comprobación en cualquier momento usando las API HeadObject S3, GetObjectAttributes S3 o el informe de inventario de S3. Calcular una suma de comprobación mientras transmite datos a S3 supone un ahorro de tiempo, ya que puede verificar y transmitir sus datos en un único paso en lugar de tener que hacer dos operaciones secuenciales. El uso de sumas de comprobación para la validación de datos es una práctica recomendada para la durabilidad de los datos. Estas capacidades aumentan el rendimiento y reducen el coste de hacerlo.

El control de versiones le permite conservar, recuperar y restaurar todas las versiones de todos los objetos almacenados en un bucket de Amazon S3. Cuando habilite el control de versiones para un bucket, Amazon S3 conservará los objetos existentes cada vez que realice una operación PUT, POST, COPY o DELETE sobre ellos. De forma predeterminada, las solicitudes GET recuperarán la versión escrita más recientemente. Las versiones más antiguas de un objeto sobrescrito o eliminado podrán recuperarse si se especifica una versión en la solicitud.

Amazon S3 ofrece a los clientes una infraestructura de almacenamiento que presenta elevados niveles de durabilidad. El control de versiones ofrece un nivel de protección adicional, proporcionando un medio de recuperación cuando los clientes sobrescriben o eliminan de forma accidental objetos. Esto le permite recuperarse fácilmente ante acciones no deseadas del usuario y errores de la aplicación. También puede utilizar el control de versiones para retener y archivar datos.

Puede comenzar a utilizar el control de versiones si habilita el ajuste correspondiente del bucket de Amazon S3. Para obtener más información sobre cómo puede habilitar el control de versiones, consulte la documentación de Amazon S3.

Cuando un usuario realiza una operación DELETE sobre un objeto, las posteriores solicitudes sencillas (sin versión) no recuperarán el objeto. Sin embargo, todas las versiones de dicho objeto seguirán conservándose en el bucket Amazon S3 y podrán recuperarse o restablecerse. El único usuario que puede eliminar una versión de forma permanente de un bucket de Amazon S3 es el propietario. Puede definir reglas de ciclo de vida a fin de administrar el ciclo de vida y el costo del almacenamiento de varias versiones de los objetos.

Puede usar las reglas de ciclo de vida de Amazon S3 junto con el control de versiones de S3 a fin de implementar un periodo de reversión para los objetos de S3. Por ejemplo, en un bucket con el control de versiones habilitado, puede configurar una regla que archive todas las versiones anteriores en la clase de almacenamiento de S3 Glacier Flexible Retrieval de menor costo y las elimine transcurridos 100 días, de manera que dispondrá de un periodo de 100 días para revertir cualquier cambio implementado en los datos al mismo tiempo que podrá reducir los costos de almacenamiento. Además, puede ahorrar costos si elimina las versiones antiguas (no actuales) de un objeto después de cinco días y cuando haya al menos dos versiones más recientes del objeto. Puede cambiar el número de días o de versiones más recientes según sus necesidades de optimización de costos. Esto permite retener versiones adicionales de los objetos cuando sea necesario, a la vez que supone un ahorro de costos mediante su transición o eliminación tras un periodo.

La capacidad de eliminación de autenticación multifactor (MFA) del control de versiones se puede utilizar para proporcionar una capa adicional de seguridad. De forma predeterminada, todas las solicitudes realizadas a su bucket de Amazon S3 exigen las credenciales de su cuenta de AWS. Si habilita el control de versiones con la eliminación de MFA en su bucket de Amazon S3, se exigirán dos vías de autenticación para que pueda eliminarse de forma permanente una versión de un objeto: las credenciales de su cuenta de AWS y un código de seis dígitos válido y un número de serie de un dispositivo de autenticación físico que se encontrará en sus manos. Para obtener más información sobre la activación del control de versiones con eliminación de MFA, incluido cómo adquirir y activar un dispositivo de autenticación, consulte la documentación de Amazon S3.

A toda versión de un objeto almacenado o solicitado de Amazon S3 se le aplican las tarifas normales. Por ejemplo, veamos el siguiente escenario para ilustrar los costos de almacenamiento cuando se utiliza el control de versiones (supongamos que el mes actual dura 31 días): 1) Día 1 del mes: se realiza un PUT de 4 GB (4.294.967.296 bytes) en el bucket.
2) Día 16 del mes: realiza una operación PUT de 5 GB (5 368 709 120 bytes) en el mismo bucket de datos utilizando la misma clave que la operación PUT original del día 1.

Al analizar los costos de almacenamiento de las operaciones anteriores, debe tener en cuenta que el objeto de 4 GB del día 1 no se elimina del bucket cuando se escribe el objeto de 5 GB el día 15. En su lugar, el objeto de 4 GB se conserva como una versión más antigua, y el objeto de 5 GB pasa a ser la versión más recientemente escrita dentro del objeto que se encuentra en su bucket. Al final del mes: uso total de bytes/hora
[4 294 967 296 bytes x 31 días x (24 horas/día)] + [5 368 709 120 bytes x 16 días x (24 horas/día)] = 5 257 039 970 304 byte-horas. Conversión a GB/mes totales
5.257.039.970.304 bytes-hora x (1 GB/ 1.073.741.824 bytes) x (1 mes/ 744 horas) = 6,581 GB-mes El coste se calcula en función de las tarifas actuales de su región en la página de precios de Amazon S3.

El bloqueo de objetos de Amazon S3 es una característica de Amazon S3 que impide que una versión de objeto se elimine o sobrescriba durante un tiempo fijo o indefinido. La característica permite aplicar políticas de retención como un nivel adicional de protección de datos o con fines de cumplimiento normativo. Puede migrar las cargas de trabajo desde sistemas del tipo de escritura única, lectura múltiple (WORM) hacia Amazon S3 y configurar el bloqueo de objetos de S3 en el nivel de objeto y de bucket para evitar la eliminación de una versión del objeto con anterioridad a la fecha que figura en Retener hasta o indefinidamente en Retención legal. La protección del bloqueo de objetos de S3 se mantiene independientemente del tipo de almacenamiento en el que resida la versión del objeto y durante las transiciones de ciclo de vida de S3 entre tipos de almacenamiento. Debería usar el bloqueo de objetos de S3 si tiene requisitos normativos que especifiquen que los datos deben estar protegidos por WORM, o si desea agregar una capa adicional de protección a los datos en Amazon S3. El bloqueo de objetos de S3 puede ayudarle a cumplir con los requisitos normativos que especifican que los datos deben almacenarse en formato inmutable. Además, puede brindar protección contra la eliminación accidental o intencional de los datos en Amazon S3.
Para obtener más información, visite la página de la guía de usuario de bloqueo de objetos de S3.

El bloqueo de objetos de Amazon S3 impide que se elimine una versión de un objeto durante un periodo de retención especificado o indefinidamente hasta que se elimine una retención legal. Con el bloqueo de objetos de S3, puede asegurarse de que una versión de un objeto permanezca inmutable mientras se aplique la protección WORM. Puede implementar la protección de WORM mediante la asignación de una fecha en Retener hasta o en Retención legal a una versión de objeto con el SDK de AWS, la CLI, la API de REST o la consola de administración de S3. Puede implementar la configuración de retención dentro de una solicitud PUT o implementarla en un objeto existente después de su creación. La fecha que figura en Retener hasta define la duración por la que la versión de objeto permanecerá inmutable. Una vez asignada la fecha en Retener hasta a un objeto, esa versión del objeto no podrá modificarse o eliminarse hasta que haya transcurrido esta fecha. Si un usuario intenta eliminar un objeto antes de la fecha en Retener hasta, la operación se rechazará. A modo de alternativa, puede hacer que un objeto sea inmutable mediante la aplicación de una retención legal. Una retención legal impide que una versión de un objeto se modifique o se borre indefinidamente hasta que se elimine explícitamente. Para poder colocar y eliminar retenciones legales, su cuenta de AWS debe tener permiso de escritura para la acción PutObjectLegalHold. Se puede implementar una retención legal en un bucket compatible con el bloqueo de objetos de S3, independientemente de si este objeto cuenta o no con protección de WORM durante un periodo de retención.
El bloqueo de objetos de S3 puede configurarse en uno de dos modos. Cuando se implementa en modo Gobernanza, las cuentas de AWS con permisos de IAM específicos pueden eliminar la protección de WORM de una versión de objetos. Si se requiere mayor inmutabilidad para cumplir las normativas, puede utilizar el modo de conformidad. En el modo de conformidad, ningún usuario puede eliminar la protección de WORM, ni siquiera la cuenta raíz.

No, no puede deshabilitar el bloqueo de objetos de S3 ni el control de versiones de S3 para los buckets una vez que esté habilitado el bloqueo de objetos de S3.

Para empezar a replicar objetos con Replicación de S3 desde buckets con el bloqueo de objetos de S3 activado, puede agregar una configuración de replicación en su bucket de origen especificando un bucket de destino en la misma región de AWS o en una diferente y en la misma cuenta de AWS o en una diferente. Puede elegir replicar todos los objetos en el nivel del bucket de S3 o filtrar los objetos en un nivel de prefijo compartido o en un nivel de objeto mediante etiquetas de objetos de S3. También tendrá que especificar un rol de AWS Identity and Access Management (IAM) con los permisos necesarios para realizar la operación de replicación. Puede usar la consola S3, la API de AWS, la CLI de AWS, los SDK de AWS o AWS CloudFormation para habilitar la replicación, y debe tener habilitado el control de versiones de S3 para los buckets de origen y destino. Además, para replicar objetos desde buckets habilitados para el bloqueo de objetos de S3, su bucket de destino también debe tener habilitado el bloqueo de objetos de S3. Para obtener más información, consulte la documentación sobre la configuración de Replicación de S3 y el uso de bloqueo de objetos de S3 con Replicación de S3.

Sí, para replicar objetos de los buckets habilitados para bloqueo de objetos de S3, debe conceder dos permisos nuevos, s3:GetObjectRetention y s3:GetObjectLegalHold, en el bucket de origen del rol de IAM que usa para configurar la replicación. Como alternativa, si el rol de IAM tiene un permiso s3:Get*, cumple el requisito. Para obtener más información, consulte la documentación sobre el uso de bloqueo de objetos de S3 con Replicación de S3.

No, todas las características de Replicacion de S3, como la replicación en la misma región de S3 (S3 SRR), la replicación entre regiones de S3 (S3 CRR), las métricas de replicación de S3 para realizar un seguimiento del progreso, el control del tiempo de replicación de S3 (S3 RTC) y la replicación por lotes de S3, son compatibles al replicar desde buckets de bloqueo de objetos de S3.

Puede utilizar la replicación por lotes de S3 para replicar objetos existentes desde buckets habilitados para bloqueo de objetos de S3. Para obtener más información sobre la replicación de objetos existentes, consulte la documentación sobre la replicación por lotes de S3.

Clases de almacenamiento

Abrir todo

Amazon S3 ofrece una variedad de clases de almacenamiento entre las cuales puede elegir en función de los requisitos de acceso a los datos, resiliencia y costos de sus cargas de trabajo. Las clases de almacenamiento de S3 se crearon específicamente para brindar el menor costo posible de almacenamiento para los diferentes patrones de acceso. Las clases de almacenamiento de S3 son ideales prácticamente para cualquier caso de uso, incluidos los que cuentan con necesidades de rendimiento demandantes, requisitos de residencia de datos, patrones de acceso desconocidos o cambiantes o almacenamiento de archivos. Cada clase de almacenamiento de S3 cobra una tarifa para almacenar datos y otras tarifas para acceder a los datos. Al momento de decidir qué clase de almacenamiento de S3 es la más adecuada para su carga de trabajo, tenga en cuenta los patrones de acceso y el tiempo de retención de los datos para optimizar el costo total más bajo durante la vida útil de sus datos.

Al momento de decidir qué clase de almacenamiento de S3 es la más adecuada para su carga de trabajo, tenga en cuenta los patrones de acceso y el tiempo de retención de los datos para optimizar el costo total más bajo durante la vida útil de sus datos. Muchas cargas de trabajo tienen patrones de acceso cambiantes (contenido generado por el usuario), impredecibles (análisis, lagos de datos) o desconocidos (aplicaciones nuevas), y es por eso que S3 Intelligent-Tiering debe ser la clase de almacenamiento predeterminada para ahorrar automáticamente en costos de almacenamiento. Si conoce los patrones de acceso de los datos, puede seguir esta guía. La clase de almacenamiento S3 Standard es ideal para los datos a los que se accede con frecuencia. Es la mejor opción si accede a sus datos más de una vez al mes. S3 Standard-Infrequent Access es ideal para los datos retenidos al menos durante un mes y a los que se accede cada uno o dos meses. Las clases de almacenamiento de Amazon S3 Glacier se crearon específicamente para el archivado de datos y le ofrecen el mayor rendimiento, la mayor flexibilidad de recuperación y el menor costo de almacenamiento de archivos en la nube. Ahora puede elegir entre tres clases de almacenamiento de archivos optimizadas para diferentes patrones de acceso y duración del almacenamiento. Para los datos de archivado que necesitan un acceso inmediato, como las imágenes médicas, los activos de los medios de comunicación o los datos genómicos, elija la clase de almacenamiento S3 Glacier Instant Retrieval, una clase de almacenamiento de archivos que ofrece el almacenamiento de menor costo con una recuperación de tan solo milisegundos. Para los datos de archivado que no requieren acceso inmediato, pero necesitan la flexibilidad de recuperar grandes conjuntos de datos sin costo alguno, como los casos de uso de copias de seguridad o recuperación de desastres, elija S3 Glacier Flexible Retrieval, con recuperación en minutos o recuperaciones masivas gratuitas de 5 a 12 horas. Para ahorrar aún más en el almacenamiento de archivos de larga duración, como los archivos de conformidad y la preservación de contenido multimedia digital, elija S3 Glacier Deep Archive, el almacenamiento de menor costo en la nube con una recuperación de datos de 12 horas. Todas estas clases de almacenamiento proporcionan resiliencia en múltiples zonas de disponibilidad mediante el almacenamiento de los datos de manera redundante en varios dispositivos y en zonas de disponibilidad de AWS separadas físicamente en una región de AWS.

Para los datos con un requisito de resiliencia menor, puede reducir costos al seleccionar una clase de almacenamiento con una sola zona de disponibilidad, como S3 One Zone-Infrequent Access. Si tiene requisitos de aislamiento o residencia de los datos que una región de AWS existente no puede cumplir, puede usar las clases de almacenamiento de S3 para las zonas locales dedicadas de AWS o los racks S3 en Outposts para almacenar los datos en un perímetro de datos específico.

S3 Intelligent-Tiering

Abrir todo

S3 Intelligent-Tiering es el primer almacenamiento en la nube que reduce automáticamente los costos de almacenamiento a nivel pormenorizado de objeto al mover automáticamente los datos al nivel de acceso más rentable según la frecuencia de acceso, sin impacto en el rendimiento, tarifas de recuperación ni gastos operativos. S3 Intelligent-Tiering ofrece una latencia en milisegundos y un alto rendimiento para los datos a los que se accede de manera frecuente, poco frecuente y de forma inusual en los nuevos niveles de acceso instantáneo, frecuente y poco frecuente a archivos. Por un pequeño cargo mensual de monitoreo y automatización de objetos, S3 Intelligent-Tiering monitorea los patrones de acceso y traslada automáticamente los objetos de una capa a otra. No se cobran cargos de recuperación en S3 Intelligent-Tiering, de forma que no verá aumentos inesperados en las facturas de almacenamiento cuando cambien los patrones de acceso. Puede utilizar S3 Intelligent-Tiering como la clase de almacenamiento predeterminada para prácticamente cualquier carga de trabajo, en especial lagos de datos, análisis de datos, machine learning, nuevas aplicaciones y contenido generado por el usuario.

La clase de almacenamiento Amazon S3 Intelligent-Tiering se ha diseñado para optimizar los costos mediante la migración automática de los datos al nivel de acceso más rentable cuando cambian los patrones de acceso. Por un pequeño cargo mensual de monitoreo y automatización de objetos, S3 Intelligent-Tiering monitorea los patrones de acceso y mueve automáticamente los objetos a los que no se accedió durante 30 días consecutivos a la capa de acceso poco frecuente,para ahorrar hasta un 40 % en costos de almacenamiento. Si no se accede después de 90 días consecutivos, los objetos son movidos al nivel de acceso instantáneo para ahorrar hasta un 68 % en costos de almacenamiento. No hay un impacto en el rendimiento ni cargos de recuperación en S3 Intelligent-Tiering. Si se accede más adelante a un objeto del nivel de acceso poco frecuente o de acceso instantáneo, automáticamente regresa al nivel de acceso frecuente. Para un menor costo de almacenamiento de datos a los que se puede acceder de manera asíncrona, puede activar las capacidades de archivado automáticas. Una vez que haya activado uno o ambos niveles asíncronos de acceso a archivos, S3 Intelligent-Tiering migrará los objetos a los que no se haya accedido durante un periodo mínimo de 90 días al nivel de acceso al archivo, para ahorrar hasta un 71 %, y después de 180 días sin acceso, al nivel de acceso profundo, para ahorrar hasta un 95 % en el caso de archivos a los que se accede raramente. Si se restaura más adelante un objeto en los niveles opcionales de archivo o de acceso profundo, regresa al nivel de acceso frecuente, y antes de recuperar el objeto, debe restaurarlo primero con RestoreObject. Para más información acerca de la restauración de objetos archivados, consulte Restauración de objetos archivados. No hay cargos de recuperación en S3 Intelligent-Tiering. No se aplican cargos adicionales a las capas o al ciclo de vida cuando los objetos se desplazan entre las capas de acceso dentro del tipo de almacenamiento S3 Intelligent-Tiering.

S3 Intelligent-Tiering no tiene un tamaño de objeto mínimo, pero los objetos inferiores a 128 KB no son elegibles para la designación automática de capas. Estos objetos de tamaño inferior se pueden almacenar en S3 Intelligent-Tiering, pero siempre se cobran de acuerdo con las tarifas de nivel de acceso frecuente, sin cargos de monitoreo o automatización. Si desea estandarizar S3 Intelligent-Tiering como clase de almacenamiento predeterminada para los datos recién creados, puede modificar sus aplicaciones al introducir INTELLIGENT-TIERING en el encabezado de solicitud PUT de la API de S3. S3 Intelligent-Tiering está diseñado para una disponibilidad del 99,9 % y una durabilidad del 99,999999999 %, y ofrece automáticamente la misma baja latencia y alto rendimiento que S3 Standard. Puede utilizar AWS Cost Explorer para calcular el ahorro adicional del nivel de acceso instantáneo a los archivos.

Puede utilizar S3 Intelligent-Tiering como la clase de almacenamiento predeterminada para prácticamente cualquier carga de trabajo, en especial lagos de datos, análisis de datos, machine learning, nuevas aplicaciones y contenido generado por el usuario. S3 Intelligent-Tiering es el primer almacenamiento en la nube que reduce automáticamente los costos de almacenamiento a nivel pormenorizado de objeto al mover automáticamente los datos al nivel de acceso más rentable según la frecuencia de acceso, sin impacto en el rendimiento, tarifas de recuperación ni gastos operativos. Si tiene datos con patrones de acceso desconocidos o que cambian constantemente, incluyendo lagos de datos, análisis de datos y nuevas aplicaciones, recomendamos el uso de S3 Intelligent-Tiering. Si tiene datos que no requieren recuperación inmediata, recomendamos activar el nivel de acceso profundo, en el que paga apenas 1 USD por TB por mes para datos a los que se accede raramente durante largos periodos de tiempo. S3 Intelligent-Tiering es para datos con patrones de acceso desconocidos o cambiantes. No existen cargos de recuperación al usar la clase de almacenamiento S3 Intelligent-Tiering.

S3 Intelligent-Tiering optimiza de manera automática los costos de almacenamiento sin impacto en el rendimiento. Los niveles de acceso frecuente, poco frecuente e instantáneo de S3 Intelligent-Tiering ofrecen una latencia en milisegundos y alto rendimiento.

Para los datos a los que se puede acceder de forma asincrónica, el nivel opcional Archive Access tiene el mismo rendimiento que S3 Glacier Flexible Retrieval, y el nivel Deep Archive Access tiene el mismo rendimiento que la clase de almacenamiento S3 Glacier Deep Archive. Solo debe activar las capacidades de archivo asíncronas si la aplicación puede esperar minutos u horas. Si el objeto que está recuperando está almacenado en las capas de acceso al archivo o archivo profundo, antes de poder recuperar el objeto debe restaurar primero un objeto mediante RestoreObject. Para más información acerca de la restauración de objetos archivados, consulte Restauración de objetos archivados. Los objetos en el nivel de acceso a archivos se trasladan al nivel de acceso frecuente en un plazo de 3 a 5 horas y los que están en el nivel de acceso a archivos profundo, en un plazo de 12 horas. Si necesita acceder más rápidamente a un objeto en el nivel de acceso a archivos, puede pagar por una recuperación más rápida mediante la consola, donde podrá seleccionar la opción de velocidad de recuperación acelerada.

S3 Intelligent-Tiering está diseñado para lograr la misma durabilidad del 99,999999999 % que la clase de almacenamiento S3 Estándar. S3 Intelligent-Tiering está diseñado para ofrecer una disponibilidad del 99,9% e incluye un acuerdo de nivel de servicio que proporciona créditos de servicio si la disponibilidad es inferior a nuestro compromiso de servicio en cualquier ciclo de facturación.

Existen dos maneras para transferir los datos a S3 Intelligent-Tiering. Puede colocar PUT directamente en S3 Intelligent-Tiering con la especificación INTELLIGENT_TIERING en el encabezado x-amz-storage-class o establecer políticas de ciclo de vida para transferir objetos de S3 Estándar o S3 Estándar - Acceso poco frecuente a S3 INTELLIGENT_TIERING.

S3 Intelligent-Tiering cobra por el almacenamiento, las solicitudes y la transferencia de datos mensuales y cobra un pequeño cargo mensual por el monitoreo y la automatización por objeto. La clase de almacenamiento S3 Intelligent-Tiering almacena de manera automática objetos en tres niveles de acceso: el nivel de acceso frecuente, con tarifas de almacenamiento de S3 Standard; el nivel de acceso poco frecuente, con tarifas de S3 Standard-Infrequent Access Storage; y el nivel de acceso instantáneo, con tarifas de almacenamiento de S3 Glacier Instant Retrieval. S3 Intelligent-Tiering también tiene dos niveles de archivo opcionales, diseñados para acceso asíncrono: un nivel de acceso a archivo al precio de las tarifas de almacenamiento de S3 Glacier Flexible Retrieval y un nivel de acceso profundo al precio de las tarifas de almacenamiento de S3 Glacier Deep Archive.

Por un pequeño costo de monitoreo y automatización, S3 Intelligent-Tiering monitorea los patrones de acceso y mueve de manera automática los objetos en los niveles de acceso de baja latencia y alto rendimiento, al igual que en dos niveles de acceso a archivos asíncronos opcionales, en donde los clientes obtienen los costos de almacenamiento más bajos en la nube para datos a los que se puede acceder de manera asíncrona.

S3 Intelligent-Tiering no tiene un tamaño de objeto mínimo facturable, pero los objetos inferiores a 128 KB no son elegibles para la designación automática de niveles. Estos objetos pequeños nunca se monitorean y siempre se cobran de acuerdo con las tarifas de capa de acceso frecuente, sin cargos de monitoreo o automatización. Para cada objeto archivado en el nivel de acceso a archivos o en el nivel de acceso a archivo profundo en S3 Intelligent-Tiering, Amazon S3 utiliza 8 KB de almacenamiento para el nombre del objeto y otros metadatos (facturados a las tarifas del almacenamiento S3 Standard) y 32 KB de almacenamiento para el índice y los metadatos relacionados (facturados a las tarifas de almacenamiento de S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive).

No. S3 Intelligent-Tiering no tiene cargos de recuperación. S3 Intelligent-Tiering monitorea los patrones de acceso de los datos, y si accede a un objeto en los niveles de archivo asincrónico, de acceso poco frecuente o instantáneo, S3 Intelligent-Tiering mueve ese objeto de manera automática al nivel de acceso frecuente.

Para acceder a un objeto en las capas de acceso a archivos o de acceso a archivo profundo, envíe una solicitud de restauración y el objeto comenzará a trasladarse a la capa de acceso frecuente, todo dentro de la clase de almacenamiento S3 Intelligent-Tiering. Los objetos en la capa de acceso a archivos se trasladan a la capa de acceso frecuente en 3 a 5 horas y los objetos en la capa de acceso a archivo profundo, en 12 horas. Una vez que el objeto está en la capa de acceso frecuente, puede enviar una solicitud GET para recuperarlo.

Puede usar el inventario de Amazon S3 para informar la capa de acceso de los objetos almacenados en la clase de almacenamiento S3 Intelligent-Tiering. El inventario de Amazon S3 proporciona archivos CSV, ORC o Parquet de salida que muestran los objetos y sus metadatos correspondientes una vez al día o a la semana para un bucket de S3 o un prefijo compartido. También puede enviar una solicitud HEAD de sus objetos para informar las capas de acceso a archivos de S3 Intelligent-Tiering.

Sí. Puede transferir objetos del ciclo de vida desde los niveles de acceso instantáneo, frecuente y poco frecuente de S3 Intelligent-Tiering a S3 One Zone-Infrequent Access, S3 Glacier Flexible-Retrieval y S3 Glacier Deep Archive. Además, puede transferir objetos del ciclo de vida desde los niveles de acceso a archivos opcionales de S3 Intelligent-Tiering a S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive,y desde el nivel de acceso profundo de S3 Intelligent-Tiering a S3 Glacier Deep Archive.

No. La clase de almacenamiento S3 Intelligent-Tiering no tiene una duración mínima del almacenamiento.

No. La clase de almacenamiento S3 Intelligent-Tiering no tiene un tamaño de objeto mínimo facturable, pero los objetos inferiores a 128 KB no son elegibles para la designación automática de capas. Estos objetos más pequeños siempre se cobrarán de acuerdo con las tarifas de capa de acceso frecuente, sin cargos de monitoreo o automatización. Para cada objeto archivado en el nivel de acceso a archivos o en el nivel de acceso a archivo profundo en S3 Intelligent-Tiering, Amazon S3 utiliza 8 KB de almacenamiento para el nombre del objeto y otros metadatos (facturados a las tarifas del almacenamiento S3 Standard) y 32 KB de almacenamiento para el índice y los metadatos relacionados (facturados a las tarifas de almacenamiento de S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive). Para obtener más información, visite la página de precios de Amazon S3.

S3 Standard

Abrir todo

Amazon S3 Standard ofrece almacenamiento duradero con latencia de acceso en milisegundos y alto rendimiento para datos a los que se accede de manera frecuente, típicamente más de una vez al mes. S3 Standard está diseñado para casos de uso centrados en el rendimiento, como lagos de datos, aplicaciones nativas en la nube, sitios web dinámicos, distribución de contenido, aplicaciones móviles y de juegos, análisis y modelos de machine learning. S3 Standard está diseñado para ofrecer un nivel de disponibilidad de datos del 99,99 % y una durabilidad del 99,999999999 % de los objetos en varias zonas de disponibilidad durante un año determinado. Puede transferir las políticas de ciclo de vida de S3 para controlar exactamente cuándo los datos se transfieren entre S3 Standard y las clases de almacenamiento de menor costo sin cambios de aplicación.

S3 Standard es ideal para datos a los que se accede o modifica con mayor frecuencia que requieren acceso en milisegundos y alto rendimiento. S3 Standard es ideal para datos que se leen o escriben muy frecuentemente, ya que no hay cargos de recuperación. Esto hace que S3 Standard esté optimizado para una amplia variedad de casos de uso, como lagos de datos, aplicaciones nativas en la nube, sitios web dinámicos, distribución de contenido, aplicaciones para dispositivos móviles y videojuegos, y análisis.

S3 Express One Zone

Abrir todo

Amazon S3 Express One Zone es una clase de almacenamiento de Amazon S3 de alto rendimiento y una única zona de disponibilidad creada específicamente para ofrecer acceso a datos constante en milisegundos de un solo dígito para las aplicaciones más sensibles a la latencia de los clientes. Amazon S3 Express One Zone es la clase de almacenamiento de objetos en la nube con la latencia más baja disponible en la actualidad, con una velocidad de acceso a los datos hasta 10 veces más rápida y costos de solicitud hasta un 80 % más bajos que los de Amazon S3 Standard. Con S3 Express One Zone, es posible seleccionar una zona de disponibilidad de AWS específica dentro de una región de AWS para almacenar los datos. Puede optar por ubicar sus recursos de almacenamiento y computación en la misma zona de disponibilidad para optimizar aún más el rendimiento.

S3 Express One Zone es la clase de almacenamiento ideal para aplicaciones que necesitan la velocidad de acceso a datos más rápida y el máximo rendimiento para aplicaciones sensibles a la latencia. S3 Express One Zone es la mejor clase de almacenamiento para operaciones con un uso intensivo de solicitudes, como el entrenamiento y la inferencia de machine learning (ML), los análisis interactivos y la creación de contenido multimedia.

Para empezar, puede crear un bucket de directorio de S3 en la zona de disponibilidad (AZ) de AWS que elija. Puede optar por ubicar su almacenamiento y recursos informáticos en la misma zona de disponibilidad para optimizar aún más el rendimiento. Los buckets de directorio tienen activado el bloqueo de acceso público a S3 de forma predeterminada. Tras crear el bucket de directorio, puede cargar objetos directamente en la clase de almacenamiento S3 Express One Zone o copiar objetos de las clases de almacenamiento S3 existentes en S3 Express One Zone. También puede importar datos con un solo clic en la consola de administración de AWS a S3 Express One Zone o utilizar las Operaciones por lotes de S3 para copiar un bucket, un prefijo o subconjuntos de datos completos de una clase de almacenamiento de S3 existente en S3 Express One Zone.

Puede importar datos de la misma región de AWS a la clase de almacenamiento S3 Express One Zone a través de la consola S3 mediante la opción Importar después de crear un bucket de directorio. La importación simplifica la copia de datos en los buckets del directorio de S3 al permitirle elegir un prefijo o un bucket desde el cual importar los datos sin tener que especificar todos los objetos que se van a copiar de forma individual. Las operaciones por lotes de S3 copian los objetos del prefijo o el bucket de uso general seleccionado y usted puede supervisar el progreso del trabajo de importación y copia a través de la página de detalles del trabajo de operaciones por lotes de S3.

Los objetos de S3 Express One Zone se almacenan en una única zona de disponibilidad (AZ) de AWS de su elección. El almacenamiento de objetos en una zona le permite almacenar los datos de forma local en sus recursos informáticos para minimizar la latencia. Puede acceder a los datos de todas las zonas de disponibilidad, aunque la latencia aumentará.

S3 Express One Zone ofrece una elasticidad de rendimiento similar a la de otras clases de almacenamiento de S3, pero con latencias de solicitud de lectura y escritura de primer byte consistentes de un solo dígito en milisegundos, hasta 10 veces más rápidas que las clases de almacenamiento de S3 existentes. Con S3 Express One Zone, los clientes no necesitan planificar ni aprovisionar capacidad o requisitos de rendimiento por adelantado, y se benefician inmediatamente de que las solicitudes se completen hasta un orden de magnitud más rápido. S3 Express One Zone es ideal para trabajos de análisis en los que la latencia del almacenamiento acelera los tiempos de finalización de los trabajos y reduce el costo total de propiedad (TCO) general. También es ideal para cargas de trabajo interactivas, como la edición de video, en las que los profesionales creativos necesitan un acceso lo más rápido posible a sus datos de S3.

S3 Express One Zone utiliza una arquitectura única para optimizar el rendimiento y ofrecer una latencia de solicitudes baja y constante. S3 Express One Zone almacena los datos en el equipó de alto rendimiento y su protocolo de objetos se ha mejorado para simplificar la autenticación y los gastos generales de metadatos. Además, para aumentar aún más la velocidad de acceso y admitir hasta 2 millones de solicitudes por segundo, los datos se almacenan en un nuevo tipo de bucket: un bucket de directorio de Amazon S3. Con S3 Express One Zone, es posible seleccionar una zona de disponibilidad de AWS específica dentro de una región de AWS para almacenar los datos. Puede optar por ubicar sus recursos de almacenamiento y computación en la misma zona de disponibilidad para optimizar aún más el rendimiento.

Cada bucket de directorio de S3 puede admitir hasta 2 millones de lecturas y hasta 200 000 escrituras por segundo por bucket de directorio de S3, independientemente del número de directorios del bucket. De forma predeterminada, cada bucket de directorio de S3 admite hasta 200 000 lecturas y 100 000 escrituras por segundo. Si su carga de trabajo requiere límites superiores a los predeterminados de TPS, puede solicitar un aumento a través de AWS Support.

Los buckets de directorio S3 que no tengan actividad de solicitudes durante un periodo de al menos 3 meses pasarán a un estado inactivo. Mientras se encuentra en estado inactivo, un bucket de directorio es temporalmente inaccesible para lecturas y escrituras. Los buckets inactivos retienen todo el almacenamiento, los metadatos del objeto y los metadatos del bucket. Las tarifas de almacenamiento existentes se aplicarán a los buckets inactivos. Cuando se solicita acceso a un bucket inactivo, éste pasa a un estado activo, normalmente en unos minutos. Durante este período de transición, las lecturas y escrituras devolverán un código de error 503 SlowDown.

S3 Express One Zone ofrece un rendimiento alto y elástico similar al de otras clases de almacenamiento de Amazon S3. S3 Express One Zone está diseñado desde cero para permitir a los clientes individuales aumentar su rendimiento a niveles agregados muy altos. Por ejemplo, las aplicaciones de entrenamiento de modelos de machine learning pueden entrenarse con millones de objetos y petabytes de datos. Puede lograr el máximo rendimiento distribuyendo estas solicitudes en conexiones independientes para maximizar el ancho de banda accesible.

Con S3 Express One Zone, usted autentica y autoriza las solicitudes mediante un nuevo mecanismo basado en sesiones, S3 CreateSession, que está optimizado para ofrecer la latencia más baja. Puede usar CreateSession para solicitar credenciales temporales que proporcionen acceso de baja latencia a su bucket. Estas credenciales temporales se asignan a un bucket de directorio de S3 específico. Para obtener más información sobre este modelo basado en sesiones, consulte la sección crear una sesión en S3 en la guía para desarrolladores.

S3 Express One Zone está diseñado para ofrecer una disponibilidad del 99,95 % en una única zona de disponibilidad, con un SLA de disponibilidad del 99,9 %.

Con S3 Express One Zone, los datos se almacenan de forma redundante en varios dispositivos dentro de una única zona de disponibilidad. S3 Express One Zone está diseñado para resistir a errores simultáneos de dispositivos detectando y reparando con rapidez la pérdida de redundancia. Esto significa que S3 Express One Zone cambia de forma automática las solicitudes a los nuevos dispositivos dentro de una zona de disponibilidad si el dispositivo existente detecta un error. Esta redundancia le proporciona acceso ininterrumpido a los datos dentro de una zona de disponibilidad.

No se requieren cargos de configuración ni compromisos para comenzar a utilizar S3 Express One Zone. En S3 Express One Zone se cobra por el almacenamiento y las solicitudes. El volumen de almacenamiento facturado en un mes se acumula en función del almacenamiento total utilizado por hora, medido en gigabytes al mes (GB al mes). También se cobra una tarifa por solicitud de acceso en función del tipo de solicitud, como las PUT y las GET. Pagará una tarifa adicional por GB para cargar y recuperar datos. Ejemplo 1:
Supongamos que almacena 10 GB de datos en S3 Express One Zone durante 30 días, lo que supone un total de 1 000 000 de escrituras y 9 000 000 de lecturas, y accede con Athena con un tamaño de solicitud de 10 KB. A continuación, elimina 1 000 000 archivos al cabo de 30 días. Suponiendo que tu depósito se encuentra en la región Este de EE. UU. (Norte de Virginia), los cargos por almacenamiento y solicitud se calculan a continuación: Cargos por almacenamiento
Uso total de bytes por hora = 10 GB por mes
Coste total de almacenamiento = 10 GB al mes x 0,11 USD = 1,10 USD de gastos de solicitud
1 000 000 solicitudes PUT: 1 000 000 solicitudes x 0,00113 USD/1000 = 1,13 USD
9 000 000 solicitudes GET: 9 000 000 solicitudes x 0,00003 USD/1000 = 0,27 USD
1 000 000 solicitudes de eliminación = 1 000 000 solicitudes x 0,00$ (sin cargo) = 0$ Cargo por carga de datos: 10 KB/1 048 576 x 1 000 000$ x 0,0032$ = 0,03$
Cargo por recuperación de datos: 10 KB/1 048 576 x 9 000 000 x 0,0006 USD = 0,05 USD
Cargos totales = 1,10$ + 1,13$ 0,27 + 0,03$ + 0,05$ = 2,58$ Ejemplo 2:
Supongamos que almacena 10 TB de datos para el entrenamiento de machine learning para una carga de trabajo de 8 horas todos los días y, a continuación, los elimina. Durante la carga de trabajo de 8 horas, realiza 5 242 880 escrituras y 10 485 760 lecturas para un tamaño de solicitud de 2 MB. Supongamos que lo hace durante 30 días (un mes). Cargos por almacenamiento
Uso total de bytes por hora = [10 995 116 277 760 bytes x 30 días x (8 horas por día)] = 2 638 827 906 662 400 bytes por hora = 3303,77 GB por mes
Coste total de almacenamiento = 3303,77 GB x 0,11 USD = 363,41 USD Cargos por solicitud
5 242 880 solicitudes PUT por día: 5 242 880 solicitudes x 30 x 0,00113 USD/1000 = 177,73 USD
10 485 760 solicitudes GET por día: 10 485 760 solicitudes x 30 x 0,00003 USD/1000 = 9,44 USD
5.242.880 solicitudes de eliminación por día: 5.242.880 solicitudes x 0,00$ (sin cargo) = 0$ Cargo por carga de datos: 2 MB/1024 x 5.242.880 x 30 x 0,0032$ = 983,04$
Cargo por recuperación de datos: 2 MB/1024 x 10 485 760 x 30 x 0,0006 USD = 368,64 USD
Cargos totales = 363,41 USD + 177,73 USD + 9,44 USD + 983,04 USD + 368,64 USD = 1902,26 USD

Los cargos de solicitud para acceder a los datos en S3 Express One Zone incluyen los costos de transferencia de datos dentro de la red de AWS en una región, y no hay ningún cargo adicional por transferencia de datos por los datos transferidos entre Amazon EC2 (o cualquier servicio de AWS) y S3 Express One Zone dentro de la misma región, por ejemplo, los datos transferidos dentro de la región Este de EE. UU. (Norte de Virginia).

Los cargos de solicitud para acceder a los datos en S3 Express One Zone incluyen los costos de uso de los puntos de conexión de VPC de la puerta de enlace y no hay ningún cargo adicional por usar los puntos de conexión de la puerta de enlace con S3 Express One Zone.

S3 Standard – Acceso poco frecuente (S3 Standard-IA)

Abrir todo

Amazon S3 Estándar – Acceso poco frecuente es un tipo de almacenamiento de Amazon S3 para datos a los que se obtiene acceso con poca frecuencia, pero que requieren un acceso rápido cuando es necesario. Este tipo ofrece el alto nivel de durabilidad y procesamiento, y la baja latencia del tipo de almacenamiento Amazon S3 Estándar, con una tarifa de recuperación y un cargo de almacenamiento por GB bajos. La combinación de alto rendimiento y bajos costos convierten a S3 Estándar - Acceso poco frecuente en la opción ideal para el almacenamiento a largo plazo, las copias de seguridad y como almacén de datos para la recuperación ante desastres. El tipo Estándar – Acceso poco frecuente de S3 está definido a nivel de objeto y puede existir en el mismo bucket que los tipos de almacenamiento S3 Estándar y Única zona – Acceso poco frecuente de S3, lo que le permite usar políticas de ciclo de vida de S3 para trasladar automáticamente objetos entre tipos de almacenamiento sin introducir cambios en las aplicaciones.

El tipo S3 Estándar – Acceso poco frecuente es ideal para datos a los que se obtiene acceso con menos frecuencia, pero que requieren un acceso rápido cuando es necesario. S3 Estándar - Acceso poco frecuente es ideal para el almacenamiento de archivos a largo plazo, el almacenamiento de recursos compartidos, la sincronización de carpetas y otros datos caducos.

S3 Standard-IA proporciona el mismo nivel de latencia en milisegundos y alto rendimiento que la clase de almacenamiento S3 Standard.

Existen dos maneras para transferir los datos a S3 Estándar – Acceso poco frecuente. Puede utilizar directamente una solicitud PUT en S3 Estándar – Acceso poco frecuente mediante la especificación de STANDARD_IA en el encabezado x-amz-storage-class. También puede definir políticas de ciclo de vida para trasladar objetos desde S3 Standard al tipo de almacenamiento S3 Standard-IA.

Incurrirá en cargos por una solicitud COPY de S3 Standard (tipo de almacenamiento de destino) y una recuperación de datos de S3 Standard-IA (tipo de almacenamiento de origen). Para obtener más información, visite la página de precios de Amazon S3.

S3 Standard-IA está diseñado para datos de larga duración que se almacenan durante meses o años y a los que se obtiene acceso con poca frecuencia. En el caso de que se eliminen datos de S3 Standard-IA dentro de un plazo de 30 días, se facturarán los 30 días completos. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de S3 Standard-IA.

S3 Estándar – Acceso poco frecuente está diseñado para objetos de mayor tamaño y tiene un cargo mínimo de almacenamiento de objetos de 128 KB. Los objetos de tamaño inferior a 128 KB incurrirán en cargos de almacenamiento equivalentes a 128 KB. Por ejemplo, un objeto de 6 KB en S3 Standard-IA incurrirá en los cargos de almacenamiento de S3 Standard-IA para 6 KB, así como un cargo mínimo adicional de tamaño de objeto equivalente a 122 KB de acuerdo con el precio de almacenamiento de S3 Standard-IA. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de S3 Standard-IA.

Sí. Además de usar políticas de ciclo de vida para migrar objetos desde S3 Standard a S3 Standard-IA, también puede configurar políticas de ciclo de vida para transferir objetos desde S3 Standard-IA a las clases de almacenamiento S3 One Zone-IA, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive.

S3 One Zone-Infrequent Access (S3 One Zone-IA)

Abrir todo

S3 Única zona – Acceso poco frecuente es un tipo de almacenamiento de Amazon S3 que los clientes pueden elegir para almacenar objetos en una única zona de disponibilidad. El almacenamiento S3 Única zona – Acceso poco frecuente almacena datos de manera redundante dentro de una única zona de disponibilidad para poder ofrecer un almacenamiento con un costo 20% inferior al almacenamiento S3 Estándar – Acceso poco frecuente con redundancia geográfica, que almacena los datos de manera redundante en varias zonas de disponibilidad que se encuentran geográficamente distanciadas. S3 Única zona - Acceso poco frecuente ofrece un SLA para una disponibilidad de 99 % y también está diseñado para suministrar una durabilidad con once 9 dentro de la zona de disponibilidad. Sin embargo, los datos de la clase de almacenamiento S3 Única zona - Acceso poco frecuente no son resistentes a la pérdida física de toda una zona de disponibilidad. El almacenamiento S3 Única zona - Acceso poco frecuente ofrece las mismas características de Amazon S3 que S3 Estándar y S3 Estándar - Acceso poco frecuente, y se puede usar mediante la API, la CLI o la consola de Amazon S3. El tipo de almacenamiento S3 Única zona – Acceso poco frecuente está definido a nivel del objeto y puede existir en el mismo bucket que los tipos S3 Estándar y S3 Estándar – Acceso poco frecuente. Puede usar las políticas de ciclo de vida de S3 para trasladar automáticamente objetos entre tipos de almacenamiento sin realizar cambios en las aplicaciones.

Los clientes pueden usar Única zona - Acceso poco frecuente de S3 para almacenamiento con acceso poco frecuente, como copias de seguridad, copias de recuperación de desastres y otros datos de recreación sencilla.

El tipo de almacenamiento S3 Única zona - Acceso poco frecuente ofrece el mismo rendimiento de latencia y procesamiento que los tipos de almacenamiento S3 Estándar y S3 Estándar - Almacenamiento de acceso poco frecuente.

La clase de almacenamiento S3 One Zone-IA está diseñada para un nivel de durabilidad de 99,999999999 % dentro de una zona de disponibilidad. Sin embargo, los datos de la clase de almacenamiento S3 One Zone-IA no son resistentes a la pérdida de disponibilidad o pérdida física de una zona de disponibilidad. Por el contrario, las clases de almacenamiento S3 Standard, S3 Intelligent-Tiering, S3 Standard-Infrequent Access y S3 Glacier están diseñadas para resistir la pérdida de disponibilidad o la destrucción de una zona de disponibilidad. S3 One Zone-IA puede ofrecer una durabilidad y disponibilidad equivalente o superior a la mayoría de los centros de datos físicos más modernos, al mismo tiempo que suministra el beneficio adicional de la elasticidad de almacenamiento y el conjunto de características de Amazon S3.

Sí. Cada región de AWS es un área geográfica independiente. Cada región tiene varias ubicaciones aisladas conocidas como zonas de disponibilidad. La clase de almacenamiento Amazon S3 One Zone-IA utiliza una zona de disponibilidad de AWS específica dentro de la región.

Cada zona de disponibilidad usa redes y capacidad redundantes. Dentro de una región de AWS, las zonas de disponibilidad se encuentran en diferentes terrenos inundables, zonas de fallas sísmicas y separadas geográficamente a los fines de brindar protección contra incendios. El tipo de almacenamiento S3 Estándar y S3 Estándar - Acceso poco frecuente ofrecen protección contra estos tipos de desastres mediante el almacenamiento de sus datos de manera redundante en varias zonas de disponibilidad. S3 Única zona - Acceso poco frecuente ofrece protección contra los fallos de los equipos dentro de una zona de disponibilidad, pero los datos no son resistentes a la pérdida física de la zona de disponibilidad debido a desastres, como terremotos e inundaciones. Mediante el uso de las opciones S3 One Zone-IA, S3 Standard y S3 Standard-IA, puede elegir el tipo de almacenamiento que mejor se adapte a las necesidades de durabilidad y disponibilidad de su almacenamiento.

Clase de almacenamiento Amazon S3 Glacier Instant Retrieval

Abrir todo

La clase de almacenamiento S3 Glacier Instant Retrieval ofrece el almacenamiento de menor costo para los datos de larga duración a los que rara vez se accede y que requieren una recuperación en milisegundos. S3 Glacier Instant Retrieval ofrece el acceso más rápido al almacenamiento de archivos, con el mismo rendimiento y acceso en milisegundos que las clases de almacenamiento S3 Standard y S3 Standard-IA. S3 Glacier Instant Retrieval está diseñado para brindar una durabilidad de los datos del 99,999999999 % (11 nueves) y una disponibilidad del 99,9 % mediante el almacenamiento redundante de los datos en un mínimo de tres zonas de disponibilidad de AWS separadas físicamente.

S3 Glacier Instant Retrieval es ideal para datos a los que se accede de manera poco frecuente (una vez cada tres meses) y requieren tiempos de recuperación de milisegundos. Es la clase de almacenamiento ideal si desea la misma latencia baja y alto rendimiento que S3 Standard-IA, pero desea almacenar datos a los que se accede de manera menos frecuente que S3 Standard-IA, con un precio de almacenamiento más bajo y costos de acceso a datos ligeramente más altos.

S3 Glacier Instant Retrieval está diseñado para tener una durabilidad del 99,999999999 % (11 nueves) y disponibilidad del 99,9 %, lo mismo que S3 Standard-IA, y posee un acuerdo de nivel de servicios que provee créditos de servicio si la disponibilidad es menor al 99 % en cualquier ciclo de facturación.

S3 Glacier Instant Retrieval proporciona la misma latencia en milisegundos y alto rendimiento que las clases de almacenamiento S3 Standard y S3 Standard-IA. A diferencia de las clases de almacenamiento S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive, las cuales están diseñadas para acceso asíncrono, no es necesario emitir una solicitud de restauración antes de acceder a un objeto almacenado en S3 Glacier Instant Retrieval.

Existen dos formas de transferir datos a S3 Glacier Instant Retrieval. Puede colocar PUT directamente en S3 Glacier Instant Retrieval con la especificación GLACIER_IR en el encabezado x-amz-storage-class o establecer políticas de ciclo de vida de S3 para transferir objetos de S3 Standard o S3 Standard-IA a S3 Glacier Instant Retrieval.

S3 Glacier Instant Retrieval está diseñado para datos de larga duración que se almacenan durante meses o años, pero a los que se rara vez se accede. Los objetos que se archivan en S3 Glacier Instant Retrieval tienen un mínimo de 90 días de almacenamiento y, para los objetos que se eliminen, sobrescriban o transfieran antes de 90 días, se aplicará un cargo prorrateado equivalente al cargo de almacenamiento por los días restantes. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de Amazon S3 Glacier Instant Retrieval.

S3 Glacier Instant Retrieval está diseñado para objetos de mayor tamaño y tiene un cargo mínimo de almacenamiento de objetos de 128 KB. Los objetos de tamaño inferior a 128 KB incurrirán en cargos de almacenamiento equivalentes a 128 KB. Por ejemplo, un objeto de 6 KB en S3 Glacier Instant Retrieval incurrirá en los cargos de almacenamiento de S3 Glacier Instant Retrieval para 6 KB, así como un cargo mínimo adicional de tamaño de objeto equivalente a 122 KB de acuerdo con el precio de almacenamiento de S3 Glacier Instant Retrieval. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de Amazon S3 Glacier Instant Retrieval.

S3 Glacier Instant Retrieval cobra por almacenamiento mensual, solicitudes basadas en el tipo de solicitud y recuperación de datos. El volumen de almacenamiento facturado en un mes corresponde a la media del almacenamiento utilizado durante todo el mes, medido en gigabyte/mes (GB/mes). Se le cobrarán las solicitudes según el tipo de solicitud, como PUT, COPY y GET. También pagará un cargo por GB por cada gigabyte de datos devueltos.

Clase de almacenamiento Amazon S3 Glacier Flexible Retrieval

Abrir todo

La clase de almacenamiento S3 Glacier Flexible Retrieval ofrece almacenamiento a bajo costo, hasta un 10 % menor (que S3 Glacier Instant Retrieval), para los datos de archivo a los que se accede 1 o 2 veces al año y se recuperan de manera asíncrona, con recuperaciones masivas gratuitas. Para los datos de archivo que no requieren acceso inmediato pero necesitan la flexibilidad de recuperar grandes conjuntos de datos sin costo alguno, como los casos de uso de copias de seguridad o recuperación de desastres, S3 Glacier Flexible Retrieval es la clase de almacenamiento ideal. S3 Glacier Flexible Retrieval ofrece las opciones de recuperación más flexibles que equilibran el costo con tiempos de acceso que varían de minutos a horas y con recuperaciones masivas gratuitas. Esta es una solución ideal para las necesidades de copia de seguridad, recuperación de desastres, almacenamiento de datos fuera del sitio y para cuando algunos datos deben recuperarse ocasionalmente en minutos y no desea preocuparse por los costos. S3 Glacier Flexible Retrieval está diseñado para brindar una durabilidad de los datos del 99,999999999 % (11 nueves) y una disponibilidad del 99,99 % mediante el almacenamiento redundante de los datos en varias zonas de disponibilidad de AWS separadas físicamente en un año determinado.

Para los datos de archivo que no requieren acceso inmediato pero necesitan la flexibilidad de recuperar grandes conjuntos de datos sin costo alguno, como los casos de uso de copias de seguridad o recuperación de desastres, S3 Glacier Flexible Retrieval es la clase de almacenamiento ideal. S3 Glacier Flexible Retrieval ofrece las opciones de recuperación más flexibles que equilibran el costo con tiempos de acceso que varían de minutos a horas y con recuperaciones masivas gratuitas. Esta es una solución ideal para las necesidades de copia de seguridad, recuperación de desastres, almacenamiento de datos fuera del sitio y para cuando algunos datos deben recuperarse ocasionalmente en minutos y no desea preocuparse por los costos que implica recuperar datos.

Existen dos formas de ingresar datos a S3 Glacier Flexible Retrieval. Puede utilizar directamente una solicitud PUT en S3 Glacier Flexible Retrieval al especificar GLACIER en el encabezado x-amz-storage-class. Puede utilizar las reglas del ciclo de vida de S3 para hacer la transición de objetos desde cualquiera de las clases de almacenamiento de S3 para los datos activos (S3 Standard, S3 Intelligent-Tiering, S3 Standard-IA, S3 One Zone-IA y S3 Glacier Instant Retrieval) a Amazon S3 Glacier Flexible Retrieval en función de la antigüedad del objeto. Utilice Amazon S3 Management Console, los SDK de AWS o las API de Amazon S3 para utilizar directamente una solicitud PUT en Amazon S3 Glacier o definir reglas para el archivado.

Nota: S3 Glacier Flexible Retrieval también está disponible a través de las API originales directas de Glacier y a través de la consola de administración de Amazon S3 Glacier. Para una experiencia mejorada con acceso a todo el conjunto de características de S3, que incluye la administración del ciclo de vida, la replicación de S3, S3 Storage Lens y más, recomendamos utilizar las API de S3 y S3 Management Console para utilizar las características de S3 Glacier.

Se puede acceder a los objetos archivados en S3 Glacier Flexible Retrieval de manera asíncrona. Para recuperar datos almacenados en S3 Glacier Flexible Retrieval, inicie una solicitud de recuperación mediante las API de Simple Storage Service (Amazon S3) o la consola de Amazon S3. La solicitud de recuperación crea una copia temporal de sus datos en la clase de almacenamiento de S3 Standard al mismo tiempo que deja los datos archivados intactos en S3 Glacier Flexible Retrieval. Puede especificar la cantidad de tiempo en días durante la cual se almacenará la copia temporal en Simple Storage Service (Amazon S3). A continuación, puede obtener acceso a su copia temporal desde S3 a través de una solicitud GET de Amazon S3 en el objeto archivado. En las regiones de AWS en las que el almacenamiento de redundancia reducida tiene un precio más bajo que S3 Standard, los datos disponibles temporalmente se facturan como almacenamiento de redundancia reducida. Sin embargo, la clase de almacenamiento de facturación de almacenamiento de redundancia reducida no refleja cómo se almacenan los datos. Con las notificaciones de recuperación, ahora se le notificará con una notificación de evento de S3 cuando un objeto se haya recuperado exitosamente de S3 Glacier Flexible Retrieval y la copia temporal esté disponible. El propietario del bucket (u otras personas, según lo permita una política de IAM) puede organizar la emisión de notificaciones a Amazon Simple Queue Service (SQS) o Amazon Simple Notification Service (SNS). Las notificaciones también se pueden enviar a AWS Lambda para que las procese una función de Lambda.

Al procesar un trabajo de recuperación, Amazon S3 recupera primero los datos solicitados desde S3 Glacier Flexible Retrieval y a continuación crea una copia temporal de los datos solicitados en Amazon S3. Esto suele tardar unos minutos. El tiempo de acceso de la solicitud depende de la opción de recuperación que elija: recuperaciones aceleradas, estándar o en masa. A excepción de los archivos de mayor tamaño (más de 250 MB), los datos accedidos mediante las recuperaciones Expedited suelen estar disponibles entre 1 a 5 minutos. Los objetos recuperados a través de la opción de recuperaciones estándar suelen estar disponibles entre 3 a 5 horas. Las recuperaciones estándar suelen comenzar en cuestión de minutos cuando se inician con las operaciones por lotes de S3. Las recuperaciones masivas suelen completarse dentro de un periodo de entre 5 a 12 horas y son gratuitas. Para obtener más información sobre las opciones de recuperación de S3 Glacier Flexible Retrieval, consulte la sección restauración de un objeto archivado en la guía del usuario de S3.
Con las unidades de capacidad aprovisionada de S3 Glacier, puede pagar una cuota inicial fija durante un mes determinado para garantizar la disponibilidad de la capacidad de recuperación de las recuperaciones aceleradas de S3 Glacier Flexible Retrieval. Puede adquirir dos unidades de capacidad aprovisionada al mes para aumentar la cantidad de datos que puede recuperar. Cada unidad de capacidad garantiza que se puedan realizar al menos tres recuperaciones aceleradas cada cinco minutos y proporciona un nivel de rendimiento de recuperación de hasta 150 MB/s. Si la carga de trabajo requiere un acceso altamente confiable y predecible a un subconjunto de sus datos en cuestión de minutos, debería adquirir capacidad de recuperación aprovisionada. Si no se dispone de capacidad aprovisionada, es posible que no se acepten las recuperaciones aceleradas durante periodos de alta demanda. Si necesita acceder a recuperaciones aceleradas en cualquier circunstancia, le recomendamos que adquiera capacidad de recuperación aprovisionada.
Puede adquirir capacidad aprovisionada mediante la consola de Amazon S3, la API REST de compra de capacidad aprovisionada, los SDK de AWS o AWS CLI. Una unidad de capacidad aprovisionada tiene duración de un mes a partir de la fecha y hora de compra, que es la fecha de inicio. La unidad vence en la fecha de vencimiento, que es exactamente un mes después de la fecha de inicio, al segundo más cercano. Para obtener más información sobre los precios de la capacidad aprovisionada, consulte los precios de Amazon S3.

El volumen de almacenamiento facturado en un mes corresponde a la media del almacenamiento utilizado durante todo el mes, medido en gigabyte/mes (GB/mes). Amazon S3 calcula el tamaño del objeto al sumar el volumen de datos almacenados, más 32 KB adicionales de datos de S3 Glacier, más 8 KB adicionales de datos de la clase de almacenamiento Amazon S3 Standard. S3 Glacier Flexible Retrieval requiere 32 KB adicionales de datos por objeto para el índice y los metadatos de S3 Glacier, con el fin de que pueda identificar y recuperar sus datos. Amazon S3 requiere 8 KB para almacenar y mantener el nombre definido por el usuario y los metadatos de los objetos archivados en S3 Glacier Flexible Retrieval. Esto le permite obtener una lista en tiempo real de todos sus objetos de Amazon S3, incluidos los almacenados mediante S3 Glacier Flexible Retrieval, con la API LIST de Amazon S3 o el informe de inventario de S3. Por ejemplo, si ha archivado 100 000 objetos de 1 GB cada uno, su almacenamiento facturable será de:
1,000032 gigabytes para cada objeto x 100 000 objetos = 100 003,2 gigabytes de almacenamiento de S3 Glacier.
0,000008 gigabytes para cada objeto x 100 000 objetos = 0,8 gigabytes de almacenamiento de S3 Standard.
La tarifa se calcula en función de las tarifas actuales de su región de AWS que figuran en la página de precios de Amazon S3. Para ver más ejemplos de precios de Amazon S3, consulte las preguntas frecuentes sobre facturación de S3 o utilice la calculadora de precios de AWS.

Los objetos archivados en S3 Glacier Flexible Retrieval tienen un mínimo de 90 días de almacenamiento. Si un objeto se elimina, sobrescribe o transfiere antes de los 90 días, se cobrará una tarifa prorrateada igual a la tarifa de almacenamiento de los días restantes.

S3 Glacier Flexible Retrieval también requiere 40 KB de metadatos adicionales para cada objeto archivado. Esto incluye 32 KB de metadatos cargados a la tarifa de S3 Glacier Flexible Retrieval, necesarios para identificar y recuperar sus datos. Y 8 KB de datos adicionales cargados a la tarifa S3 Standard, necesarios para mantener el nombre definido por el usuario y los metadatos de los objetos archivados en S3 Glacier Flexible Retrieval. Esto permite que obtenga una lista en tiempo real de todos los objetos de S3 que utilizan la API LIST de S3 o el informe de S3 Inventory. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de Amazon S3 Glacier Flexible Retrieval.

Hay tres maneras de recuperar datos de S3 Glacier Flexible Retrieval: recuperaciones aceleradas, estándar y masivas. Las recuperaciones aceleradas y estándar tienen una tarifa de recuperación por GB y por solicitud (es decir, paga por solicitudes hechas en relación con sus objetos de Amazon S3). Las recuperaciones masivas de S3 Glacier Flexible Retrieval son gratuitas. Para obtener información detallada sobre los precios de S3 Glacier por región de AWS, visite la página de precios de Amazon S3.

Las clases de almacenamiento de Amazon S3 Glacier se crearon específicamente para el archivo de datos y le ofrecen el mayor rendimiento, la mayor flexibilidad de recuperación y el menor costo de almacenamiento de archivos en la nube. Ahora puede elegir entre tres clases de almacenamiento de archivos optimizadas para diferentes patrones de acceso y duración del almacenamiento. Para los datos de archivado que necesitan un acceso inmediato, como las imágenes médicas, los activos de los medios de comunicación o los datos genómicos, elija la clase de almacenamiento S3 Glacier Instant Retrieval, una clase de almacenamiento de archivos que ofrece el almacenamiento de menor costo con una recuperación de tan solo milisegundos. Para los datos de archivado que no requieren acceso inmediato, pero necesitan la flexibilidad de recuperar grandes conjuntos de datos sin costo alguno, como los casos de uso de copias de seguridad o recuperación de desastres, elija S3 Glacier Flexible Retrieval, con recuperación en minutos o recuperaciones masivas gratuitas de 5 a 12 horas. Para ahorrar aún más en el almacenamiento de archivos de larga duración, como los archivos de conformidad y la preservación de contenido multimedia digital, elija S3 Glacier Deep Archive, el almacenamiento de menor costo en la nube con una recuperación de datos de 12 horas.

Preferimos enfocarnos en los resultados que los clientes obtienen en rendimiento, durabilidad, disponibilidad y seguridad. Sin embargo, nuestros clientes nos hacen esta pregunta con frecuencia. Utilizamos una serie de tecnologías diferentes que nos permiten ofrecer a nuestros clientes los precios que tenemos. Nuestros servicios se desarrollan utilizando tecnologías comunes de almacenamiento de datos específicamente ensambladas en sistemas con diseños específicos y con un costo optimizado utilizando software desarrollado por AWS. Las clases de almacenamiento S3 Glacier se benefician de nuestra capacidad para optimizar la secuencia de entradas y salidas con el fin de maximizar la eficiencia cuando se accede al almacenamiento subyacente.

Amazon S3 Glacier Deep Archive

Abrir todo

S3 Glacier Deep Archive es una clase de almacenamiento de Amazon S3 que proporciona un almacenamiento de objetos seguro y duradero para la retención a largo plazo de los datos a los que se accede una o dos veces al año. A partir de tan solo 0,00099 USD por GB al mes (menos de la décima parte de un centavo o aproximadamente 1 USD por TB al mes), S3 Glacier Deep Archive ofrece el almacenamiento en la nube de menor costo, a precios más bajos que el almacenamiento y el mantenimiento de datos en bibliotecas de cintas magnéticas locales o el archivo de datos fuera de las instalaciones.

S3 Glacier Deep Archive es un tipo de almacenamiento ideal para proporcionar protección sin conexión de los recursos de datos más importantes de su empresa o cuando se requiere retención de datos a largo plazo por requisitos contractuales, de la política de la empresa o de conformidad normativa. Los clientes descubren que S3 Glacier Deep Archive es una opción interesante para proteger la propiedad intelectual principal, los registros financieros y médicos, los resultados de las investigaciones, los documentos legales, los estudios de exploraciones sísmicas y las copias de seguridad a largo plazo, especialmente en industrias muy reguladas, por ejemplo, servicios financieros, atención sanitaria, petróleo y gas y sectores públicos. Además, hay organizaciones, como las empresas de medios y entretenimiento, que desean mantener una copia de seguridad de la propiedad intelectual principal. Con frecuencia, los clientes que usan S3 Glacier Deep Archive pueden reducir o discontinuar el uso de bibliotecas de cintas magnéticas locales y servicios de archivo de cintas fuera de las instalaciones.

S3 Glacier Deep Archive amplía nuestra oferta de archivado de datos, lo que le permite seleccionar un tipo de almacenamiento óptimo en función de los costos de almacenamiento y recuperación y de los tiempos de recuperación. Elija la clase de almacenamiento S3 Glacier Instant Retrieval cuando necesite acceso en milisegundos a datos de archivos de bajo costo. Para los datos de archivado que no requieren acceso inmediato, pero necesitan la flexibilidad de recuperar grandes conjuntos de datos sin costo alguno, como los casos de uso de copias de seguridad o recuperación de desastres, elija S3 Glacier Flexible Retrieval, con recuperación en minutos o recuperaciones masivas gratuitas de 5 a 12 horas. Por el contrario, S3 Glacier Deep Archive está diseñado para los datos más inactivos a los que se accede muy raramente pero que de todas maneras requieren almacenamiento duradero a largo plazo. S3 Glacier Deep Archive es hasta un 75 % más barato que S3 Glacier Flexible Retrieval y proporciona recuperación en 12 horas mediante el nivel de recuperación Standard. Las recuperaciones estándar suelen comenzar en un plazo de 9 horas cuando se inician con las operaciones por lotes de S3. También puede reducir los costos de recuperación si selecciona la recuperación masiva, capaz de devolver datos en un plazo de 48 horas.

La forma más fácil de almacenar datos en S3 Glacier Deep Archive consiste en usar la API de S3 para cargar los datos directamente. Simplemente especifique “S3 Glacier Deep Archive” como el tipo de almacenamiento. Puede hacer esto mediante el uso de la consola de administración de AWS, la API REST de S3, los SDK de AWS o la interfaz de línea de comandos de AWS. También puede comenzar a usar S3 Glacier Deep Archive mediante la creación de políticas para migrar datos a través de S3 Lifecycle, que brinda la capacidad de definir el ciclo de vida de su objeto y reducir el costo de almacenamiento. Estas políticas se pueden definir para migrar objetos a S3 Glacier Deep Archive en función de su antigüedad. Puede especificar la política para un bucket de S3 o para prefijos específicos. Las transiciones de ciclo de vida se facturan al precio de carga de S3 Glacier Deep Archive. Tape Gateway, una característica de AWS Storage Gateway para bibliotecas de cintas virtuales basadas en la nube, ahora se integra con S3 Glacier Deep Archive, lo que le permite almacenar sus archivos y copias de seguridad a largo plazo basadas en cintas virtuales en S3 Glacier Deep Archive, proporcionando el almacenamiento más económico para estos datos en la nube. Para comenzar, cree una nueva cinta virtual con la consola o la API de AWS Storage Gateway y configure el destino de almacenamiento de archivo en S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive. Cuando su aplicación de copia de seguridad expulse la cinta, esta se archivará en el destino de almacenamiento seleccionado.

Existen varias maneras de migrar datos desde archivos de cintas existentes a S3 Glacier Deep Archive. Puede usar AWS Tape Gateway para migrar datos con aplicaciones de copia de seguridad existentes a través de la interfaz de biblioteca de cintas virtuales (VTL). Esta interfaz presenta cintas virtuales en la aplicación de copia de seguridad. Estas se pueden utilizar inmediatamente para almacenar datos en Amazon S3, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval y S3 Glacier Deep Archive.
También puede utilizar AWS Snowball para migrar datos. Snowball acelera la transferencia de datos, desde terabytes a petabytes, hacia y desde AWS mediante dispositivos de almacenamiento físico que son seguros para el transporte. El uso de Snowball ayuda a eliminar los desafíos que pueden surgir con las transferencias de datos a gran escala, lo que incluye costos de red elevados, tiempos de transferencia prolongados y problemas de seguridad. Por último, puede utilizar AWS Direct Connect para establecer conexiones de red dedicadas desde las instalaciones de su empresa a AWS. En muchos casos, Direct Connect puede reducir los costos de red, mejorar el rendimiento del ancho de banda y proporcionar una experiencia de red más estable que las conexiones basadas en Internet.

Para recuperar los datos almacenados en S3 Glacier Deep Archive, inicie una solicitud “Restaurar” usando las API o la consola de administración de Amazon S3. La solicitud de restauración crea un texto temporal de los datos en el tipo de almacenamiento S3 Standard al mismo tiempo que deja los datos archivados intactos en S3 Glacier Deep Archive. Puede especificar durante cuánto tiempo (en días) se almacenará el texto temporal en S3. A continuación, puede obtener acceso a su copia temporal desde S3 a través de una solicitud GET de Amazon S3 en el objeto archivado. Al restaurar un objeto archivado, puede especificar una de las siguientes opciones en el elemento de nivel del cuerpo de la solicitud: Standard es el nivel predeterminado y le permite acceder a cualquiera de los objetos archivados en un plazo de 12 horas, y las recuperaciones suelen comenzar en un plazo de 9 horas cuando se inician mediante operaciones por lotes de S3. La recuperación masiva de datos permite recuperar grandes cantidades de datos, incluso petabytes de datos, de forma económica y, por lo general, se completa en 48 horas.

El precio del almacenamiento S3 Glacier Deep Archive está basado en la cantidad de datos que almacena en GB, la cantidad de solicitudes de transición de ciclo de vida/PUT, las recuperaciones en GB y la cantidad de solicitudes de restauración. El modelo de precios es similar a S3 Glacier Flexible Retrieval. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de S3 Glacier Deep Archive.

El uso y el costo de S3 Glacier Deep Archive aparecerá como un concepto de servicio independiente en su factura mensual de AWS, separado del uso y los costos de su Amazon S3. No obstante, si usa la herramienta Administración de costos de AWS, el uso y el costo de S3 Glacier Deep Archive estarán incluidos debajo del uso y el costo de Amazon S3 en sus informes detallados de gastos mensuales y no aparecerán detallados como un concepto de servicio independiente.

Los objetos que se archivan en S3 Glacier Deep Archive tienen un mínimo de 180 días de almacenamiento. Si un objeto se elimina, sobrescribe o transfiere antes de los 180 días, se cobrará una tarifa prorrateada igual a la tarifa de almacenamiento de los días restantes. S3 Glacier Deep Archive también requiere 40 KB de metadatos adicionales para cada objeto archivado. Esto incluye 32 KB de metadatos cargados a la tarifa de S3 Glacier Deep Archive, necesarios para identificar y recuperar sus datos. Y 8 KB de datos adicionales cargados a la tarifa S3 Standard, necesarios para mantener el nombre definido por el usuario y los metadatos de los objetos archivados en S3 Glacier Deep Archive. Esto le permite obtener una lista en tiempo real de todos sus objetos S3 que utilizan la API LIST de S3 o el informe de inventario de S3. Consulte la página de precios de Amazon S3 para obtener información sobre los precios de S3 Glacier Deep Archive.

S3 Glacier Deep Archive está integrado a las características de Amazon S3, entre ellas, el etiquetado de objetos de S3, las políticas de ciclo de vida de S3, el bloqueo de objetos de S3 y la replicación de S3. Con las características de administración de almacenamiento de S3, puede utilizar un solo bucket de Amazon S3 para almacenar una combinación de datos de S3 Glacier Deep Archive, S3 Standard, S3 Standard-IA, S3 One Zone-IA y S3 Glacier Flexible Retrieval. Esto permite que los administradores de almacenamiento tomen decisiones en función de la naturaleza de los datos y los patrones de acceso a datos. Los clientes pueden usar las políticas de ciclo de vida de Amazon S3, como la antigüedad de los datos, para migrar automáticamente los datos a tipos de almacenamiento más económicos o las políticas de replicación entre regiones o dentro de las mismas regiones de S3 para replicar datos en la misma región o en una diferente. El servicio AWS Storage Gateway ahora integra Tape Gateway con el tipo de almacenamiento S3 Glacier Deep Archive, lo que le permite almacenar cintas virtuales en el tipo de almacenamiento de Amazon S3 de menor costo, con lo que se reduce en un 75 % el costo mensual del almacenamiento de datos a largo plazo en la nube. Con esta característica, Tape Gateway admite el archivo de sus nuevas cintas virtuales directamente en S3 Glacier Flexible Retrieval y en S3 Glacier Deep Archive, lo que lo ayuda a cumplir con sus requisitos de copia de seguridad, archivo y recuperación. Tape Gateway lo ayuda a trasladar las copias de seguridad basadas en cintas a AWS sin realizar cambios en los flujos de trabajo de las copias de seguridad existentes. Tape Gateway admite la mayoría de las principales aplicaciones de copia de seguridad como Veritas, Veeam, Commvault, Dell EMC NetWorker, IBM Spectrum Protect (en el SO Windows) y Microsoft Data Protection Manager.

S3 en Outposts

Abrir todo

Amazon S3 en Outposts ofrece almacenamiento de objetos en su entorno en las instalaciones y utiliza las API y las capacidades de S3 que usted usa en AWS en la actualidad. AWS Outposts es un servicio completamente administrado que amplía la infraestructura de AWS, los servicios de AWS, las API y las herramientas a prácticamente cualquier centro de datos, espacio de coubicación o en las instalaciones. Con S3 en Outposts, puede procesar y almacenar de manera segura datos de clientes generados en las instalaciones antes de moverlos a una región de AWS, acceder a datos en forma local para aplicaciones que funcionan en las instalaciones o almacenar datos en su Outpost para empresas en ubicaciones con requisitos de residencia de datos o empresas en sectores regulados. Para obtener más información sobre S3 on Outposts, visita la página de información general.

Administración de almacenamiento

Abrir todo

Las etiquetas de objetos de S3 son pares de clave-valor aplicados a objetos de S3 que se pueden crear, actualizar o eliminar en cualquier momento durante el ciclo de vida de un objeto. Con ellas, puede crear políticas de AWS Identity and Access Management (IAM), configurar políticas de ciclo de vida de Amazon S3 y personalizar métricas de almacenamiento. Entonces, estas etiquetas de nivel de objeto pueden administrar transferencias entre clases de almacenamiento y hacer que objetos expiren en segundo plano. Puede agregar etiquetas a nuevos objetos cuando los cargue o añadirlas a objetos existentes. Pueden añadirse hasta diez etiquetas a cada objeto de S3, ya sea mediante la consola de administración de AWS, API de REST, CLI de AWS o SDK de AWS.
Para obtener más información, visite la página de la guía de usuario de etiquetas de objetos de S3.

Las etiquetas de objetos son una nueva herramienta que puede utilizar para habilitar la administración sencilla de su almacenamiento en S3. Con la habilidad de crear, actualizar y eliminar etiquetas en cualquier momento durante el ciclo de vida de su objeto, su almacenamiento puede adaptarse a las necesidades de su empresa. Estas etiquetas le permiten controlar el acceso a los objetos etiquetados con pares clave-valor específicos y, de esta manera, reforzar la protección de los datos confidenciales para un único grupo o usuario. Las etiquetas de objeto también se pueden utilizar para etiquetar objetos que pertenezcan a un proyecto o unidad de negocio específicos, que se podrían utilizar junto con las políticas de ciclo de vida de S3 para administrar los traslados a otras clases de almacenamiento (S3 Standard-IA, S3 One Zone-IA, Amazon S3 Glacier Instant Retrieval, Amazon S3 Glacier Flexible Retrieval y Amazon S3 Glacier Deep Archive) o con la replicación de S3 para replicar datos de forma selectiva entre regiones de AWS.

Puede cambiar las etiquetas de objetos en cualquier momento de la vigencia de un objeto de S3, ya sea mediante la consola de administración de AWS, API de REST, CLI de AWS o SDK de AWS. No todos los cambios a etiquetas fuera de la consola de administración de AWS se efectúan en todo el conjunto de etiquetas. Si tiene cinco etiquetas adjuntas a un objeto en particular y desea agregar una sexta, tiene que incluir las cinco etiquetas originales en la solicitud.

Los precios de las etiquetas de objetos varían en función de la cantidad de etiquetas y de un costo de solicitud para la incorporación de etiquetas. Las solicitudes asociadas con la incorporación y la actualización de etiquetas de objetos tienen el mismo precio que las solicitudes existentes. Consulte la página de precios de Amazon S3 para obtener más información.

Puede usar la consola de administración de AWS o la API de análisis de buckets PUT de S3 para configurar una política de análisis de tipo de almacenamiento a fin de identificar almacenamiento con acceso poco frecuente que se pueda transferir a los tipos de almacenamiento S3 Standard-IA o S3 One Zone-IA o archivarse en los tipos de almacenamiento S3 Glacier. Puede ir a la pestaña Administración de la consola de S3 para administrar el análisis de tipo de almacenamiento, S3 Inventory y las métricas de CloudWatch.

Debe usar los metadatos de Amazon S3 si quiere usar SQL para consultar la información sobre sus objetos de S3 a fin de identificar rápidamente conjuntos de datos específicos para su IA generativa, análisis y otros casos de uso. S3 Metadata mantiene los metadatos actualizados casi en tiempo real, por lo que puede usar cualquier cliente compatible con Iceberg para ejecutar consultas SQL y buscar objetos según los metadatos del objeto. Por ejemplo, puede usar una consulta SQL para devolver una lista de objetos que coincidan con ciertos filtros, como los objetos agregados en los últimos 30 días en cualquier bucket.

Los metadatos de S3 están diseñados para generar automáticamente metadatos que proporcionan información adicional sobre los objetos que se cargan en un bucket y para hacer que esos metadatos se puedan consultar en una tabla de solo lectura. Estas tablas de metadatos se almacenan en Amazon S3 Tables, que se basan en Apache Iceberg y proporcionan una forma gestionada de almacenar y consultar datos tabulares en S3. S3 Metadata crea y mantiene metadatos a nivel del sistema, como el tamaño del objeto, metadatos personalizados, como etiquetas y metadatos definidos por el usuario, durante la carga de objetos, y metadatos de eventos, como la dirección IP que envió la solicitud. A medida que cambian los datos de su bucket, los metadatos de S3 se actualizan casi en tiempo real para reflejar los cambios más recientes. A continuación, puede consultar las tablas de metadatos mediante varios servicios de análisis de AWS y herramientas de código abierto compatibles con Iceberg, como Amazon Athena, Amazon QuickSight y Apache Spark.

Puede empezar a usar los metadatos de S3 con solo unos clics en la consola de S3. Solo tiene que seleccionar el bucket de S3 de uso general en el que desea habilitar los metadatos de S3 y S3 analizará los datos de su bucket y creará una tabla de Apache Iceberg totalmente gestionada que contenga los metadatos de todos sus objetos. En cuestión de minutos, puede empezar a consultar sus metadatos con cualquier motor de consulta o herramienta compatible con Apache Iceberg.

Las tablas de metadatos de S3 se almacenan en un depósito de tablas administrado por AWS en su cuenta de AWS denominado aws-s3. Las tablas serán de solo lectura y solo S3 tendrá permiso para escribir, actualizar o eliminar metadatos.

S3 Metadata almacena los metadatos en dos tablas administradas de su cuenta: tablas de diario y tablas de inventario en vivo.

La tabla del diario de metadatos de S3 ofrece una vista de los cambios realizados en su bucket. A medida que los objetos se agregan, actualizan y eliminan de sus depósitos de S3 de uso general, los cambios correspondientes se reflejan en las tablas del diario prácticamente en tiempo real. Las tablas de diario son útiles para comprender el comportamiento de las aplicaciones y para identificar cualquier cambio realizado en los conjuntos de datos. Por ejemplo, puede escribir consultas SQL para tablas de diario para buscar objetos de S3 que coincidan con un filtro, como los objetos agregados en los últimos 30 días, los objetos que han agregado los solicitantes activos u objetos que han cambiado los metadatos durante la última semana.

La tabla de inventario en vivo de S3 Metadata contiene una lista completa de todos los objetos de tu bucket. Las tablas de inventario en vivo se actualizan cada hora y contienen toda la información que S3 conoce sobre sus objetos. Las tablas de inventario en vivo son útiles para descubrir o identificar conjuntos de datos en tu bucket, en función de las características generadas en los metadatos de los objetos. Por ejemplo, puede usar tablas de inventario en vivo para identificar conjuntos de datos de entrenamiento para el aprendizaje automático, para usarlos en ejercicios de optimización de costos de almacenamiento o para ayudar a aplicar los controles de gobierno.

Cuando añadas objetos nuevos a tu bucket, verás las entradas en la tabla del diario en cuestión de minutos y las verás en la tabla del inventario activo en la próxima actualización cada hora. Al habilitar los metadatos de S3 en un bucket existente, S3 iniciará automáticamente una operación de relleno para generar metadatos para todos los objetos existentes. Este relleno normalmente finaliza en minutos, pero puede tardar varias horas si los conjuntos de datos existentes contienen millones o miles de millones de objetos de S3.

Sí. Puede crear sus propias tablas Iceberg en buckets de tablas que contengan metadatos personalizados y, a continuación, unirlas con las tablas que generan los metadatos de S3 mediante consultas SQL sencillas.

S3 Inventory ofrece una alternativa programada para la API List sincronizada de Amazon S3. Puede configurar S3 Inventory para proporcionar una salida de archivo CSV, ORC o Parquet de sus objetos y sus metadatos correspondientes de forma diaria o semanal para un bucket o prefijo de S3. Puede simplificar y agilizar las tareas de big data y los flujos de trabajo empresariales con S3 Inventory. Puede usar S3 Inventory para controlar el estado de replicación y cifrado de sus objetos a fin de cumplir requisitos empresariales, de conformidad y normativos. Más información en la guía de usuario de Amazon S3 Inventory.

Puede usar la consola de administración de AWS o la API PUT Bucket Inventory Configuration para configurar un informe de inventario diario o semanal de todos los objetos de su bucket de S3 o un subconjunto de los objetos bajo un prefijo compartido. Como parte de la configuración, puede especificar un bucket de S3 de destino para su informe de S3 Inventory, el formato del archivo de salida (CSV, ORC o Parquet) y metadatos de objetos específicos necesarios para su aplicación empresarial, como: nombre de objeto, tamaño, última modificación, tipo de almacenamiento, ID de la versión, marcador de eliminación, alerta de versión no actual, alerta de carga multiparte, estado de replicación o estado de cifrado. Puede usar S3 Inventory como entrada directa en sus tareas de big data o flujos de trabajo de aplicaciones. También puede hacer consultas en S3 Inventory con lenguaje SQL estándar mediante Amazon Athena, Amazon Redshift Spectrum y otras herramientas como Presto, Hive y Spark. Más información en la guía de usuario de Amazon S3 Inventory.

Consulte la página de precios de Amazon S3 para ver los precios del inventario de S3. Una vez que configure el cifrado mediante SSE-KMS, incurrirá en cargos de KMS por el cifrado. Consulte la página de precios de KMS para obtener más información.

Amazon S3 Tables ofrece un almacenamiento de S3 optimizado específicamente para las cargas de trabajo de análisis, lo que mejora el rendimiento de las consultas y reduce los costos. Puede acceder a las capacidades de análisis de Iceberg avanzadas y consulte datos mediante servicios conocidos de AWS, como Amazon Athena, Redshift y EMR mediante la integración de las tablas de S3 con el Almacén de lago de Amazon SageMaker. Además, puede usar aplicaciones de terceros compatibles con Iceberg REST, como Apache Spark, Apache Flink, Trino, DuckDB y PyIceberg, para leer y escribir datos en S3 Tables. Puede usar buckets de tablas para almacenar datos tabulares, como las transacciones de compra diarias, los datos de los sensores de secuencias o las impresiones de anuncios, como una tabla Iceberg en Amazon S3 y, a continuación, interactuar con esos datos mediante funciones de análisis como transacciones a nivel de fila, instantáneas de tablas consultables y más, todo ello administrado por Amazon S3. Además, los buckets de tablas realizan un mantenimiento continuo de las tablas para optimizar automáticamente la eficiencia de las consultas a lo largo del tiempo, incluso a medida que el lago de datos escala y evoluciona.

Debe usar las tablas de S3 para almacenar datos tabulares en Amazon S3 de forma sencilla, eficaz y rentable. Las tablas de S3 le permiten organizar los datos estructurados en tablas y, a continuación, consultarlos mediante sentencias SQL estándar, prácticamente sin configuración. Además, las tablas de S3 ofrecen las mismas características de durabilidad, disponibilidad, escalabilidad y rendimiento que el propio S3, y optimizan automáticamente el almacenamiento para maximizar el rendimiento de las consultas y minimizar los costos.

Las tablas S3 proporcionan almacenamiento S3 diseñado específicamente para almacenar datos estructurados en los formatos Apache Parquet, Avro y ORC. Dentro de un bucket de tablas, puede crear tablas como recursos de primera clase directamente en S3. Estas tablas se pueden proteger con permisos a nivel de tabla definidos en políticas basadas en la identidad o en los recursos, y se puede acceder a ellas mediante aplicaciones o herramientas compatibles con el estándar de Apache Iceberg. Al crear una tabla en el cubo de tablas, los datos subyacentes en S3 se almacenan como archivos Parquet, Avro u ORC. Luego, S3 usa el estándar Apache Iceberg para almacenar los metadatos necesarios para que las aplicaciones puedan consultar esos datos. Las tablas de S3 incluyen una biblioteca de clientes que utilizan los motores de consulta para navegar y actualizar los metadatos de Iceberg de las tablas de su bucket de tablas. Esta biblioteca, junto con las API de S3 actualizadas para las operaciones de tablas, permite que varios clientes lean y escriban datos en sus tablas de forma segura. Con el tiempo, S3 optimiza automáticamente los datos subyacentes de Parquet, Avro u ORC reescribiendo o «compactando» los objetos. La compactación optimiza los datos en S3 para mejorar el rendimiento de las consultas.

Puede empezar a usar las tablas de S3 en solo tres pasos y sin tener que instalar ninguna infraestructura fuera de Amazon S3. En primer lugar, cree un bucket de tablas en la Consola de administración de S3 o mediante la API CreateTableBucket de S3. En segundo lugar, actualice su aplicación, como Apache Spark, para usar el catálogo de tablas de S3 para Apache Iceberg. En tercer lugar, configure la aplicación para que utilice el ARN de su bucket de tablas como ubicación de almacenamiento de tablas. A continuación, puede empezar a crear tablas en su bucket de tablas. También puede integrarse con los servicios de análisis de AWS mediante la Consola de administración de S3 para rellenar automáticamente todos los buckets de tablas y tablas de su cuenta y región a través del catálogo de datos de Glue. Esto se hace al crear el primer bucket de tablas o al hacer clic en “Integrar con los servicios de AWS Analytics” en la página de la lista de buckets de tablas.

Puede crear una tabla en su bucket de tablas con la API CreateTable de S3. Como alternativa, puede usar su motor de consultas para crear también una tabla. Puede eliminar una tabla del bucket de tablas con la API DeleteTable de S3. Como alternativa, puede usar su motor de consultas para eliminar una tabla. Al hacerlo, el motor de consultas ya no podrá acceder a la tabla.

Las tablas de S3 son compatibles con el estándar Apache Iceberg y los motores de consulta, como Amazon Athena, Amazon Redshift, y Apache Spark se pueden utilizar para consultar las tablas de Iceberg y se pueden utilizar para consultar las tablas de los buckets de tablas mediante SQL estándar.

Puede esperar un rendimiento de consultas hasta 3 veces más rápido y transacciones por segundo (TPS) hasta 10 veces más altas en comparación con el almacenamiento de tablas de Iceberg en buckets de uso general de Amazon S3. Esto se debe a que los cubos de tablas compactan automáticamente los datos subyacentes de Parquet, Avro u ORC para las tablas a fin de optimizar el rendimiento de las consultas, y el almacenamiento especialmente diseñado admite hasta 10 veces más que el TPS de forma predeterminada.

No. Para evitar comprometer accidentalmente la integridad de las tablas o estropear las aplicaciones posteriores, los buckets de tablas no permiten sobrescribir ni eliminar objetos manualmente. Los buckets de tablas solo admiten el subconjunto de API de S3 necesario para acceder y actualizar las tablas de Iceberg. En su lugar, puede configurar la eliminación de archivos sin referencia y la caducidad de las instantáneas en sus tablas para eliminar los datos.

Los buckets de tablas le permiten aplicar políticas de recursos a todo el bucket o a tablas individuales. Las políticas de buckets de tablas se pueden aplicar mediante las API PutTablePolicy y PutTableBucketPolicy. Las políticas a nivel de tabla le permiten administrar los permisos de las tablas de sus grupos de tablas en función de la tabla lógica a la que están asociadas, sin tener que entender la ubicación física de los archivos individuales de Parquet, Avro u ORC. Además, el bloqueo del acceso público de S3 siempre se aplica a los buckets de tablas.

Sí. Los buckets de tablas se basan en la funcionalidad de instantáneas de Iceberg para mantener la coherencia de las tablas cuando hay varios escritores simultáneos.

Los cubos de tabla admiten el formato de tabla Apache Iceberg con datos de Parquet, Avro u ORC.

Los buckets de tablas ofrecen tres operaciones de mantenimiento: compactación, administración de instantáneas y eliminación de archivos sin referencia. La compactación combina periódicamente objetos más pequeños en menos objetos más grandes para mejorar el rendimiento de las consultas. La administración de instantáneas caduca y elimina las instantáneas de la tabla de acuerdo con su configuración de retención de instantáneas. La eliminación de archivos sin referencia elimina los objetos a los que no hace referencia ninguna instantánea de la tabla de acuerdo con su política de eliminación de archivos sin referencia, lo que optimiza el costo de almacenamiento.

Sí, las tablas de S3 son compatibles con AWS CloudTrail. Puede configurar los datos y los eventos de administración de CloudTraill para los buckets de tablas, de forma similar a como lo haría con un bucket de uso general de S3. Los registros de CloudTrail de los buckets de tablas incluyen información sobre tablas y objetos de datos.

Sí, los datos de los buckets de tabla se cifran de forma predeterminada mediante el cifrado del lado del servidor, lo que garantiza una protección básica para los datos en reposo. Para mejorar la seguridad, tiene la opción de cifrar los datos en las tablas de S3 con sus propias claves de cifrado. Estas claves se crean y administran en su cuenta de AWS mediante AWS Key Management Service (AWS KMS). Con KMS, existen permisos independientes para el uso de la clave KMS, lo que agrega una capa adicional de control y protección contra el acceso no autorizado a sus tablas almacenados en los buckets de tabla. Además, KMS genera una pista de auditoría detallada, lo que le permite rastrear quién accedió a qué tabla y cuándo, con su clave. KMS también ofrece controles de seguridad adicionales para respaldar sus esfuerzos por cumplir con los requisitos del sector, como PCI-DSS, HIPAA/HITECH y FedRAMP. Este enfoque integral del cifrado y la administración de claves ofrece la seguridad y la flexibilidad necesarias para proteger sus datos confidenciales de manera eficaz.

Con S3 Tables, paga por el almacenamiento, las solicitudes y una tarifa de supervisión de objetos por objeto almacenado en buckets de tablas. También hay tarifas adicionales para el mantenimiento de las tablas. Para ver los detalles de precios, consulte la página de precios de S3.

La compactación combina objetos más pequeños en menos objetos más grandes para mejorar el rendimiento de las consultas de Iceberg. Amazon S3 compacta las tablas en función de un tamaño de archivo de destino óptimo para su patrón de acceso a los datos o de un valor que especifique. Los archivos compactados se escriben como la instantánea más reciente de la tabla. La compactación se admite de forma predeterminada en todas las tablas de S3, con un tamaño de archivo de destino predeterminado de 512 MB. Puede cambiar el tamaño del archivo de destino de 64 MB a 512 MB mediante la API PutTableMaintenanceConfiguration.

La administración de instantáneas caduca y elimina las instantáneas de la tabla según la configuración de retención de instantáneas. La administración de instantáneas determina la cantidad de instantáneas activas para las tablas en función de las instantáneas mínimas (1 de forma predeterminada) y las instantáneas máximas (120 horas de forma predeterminada). Cuando caduca una instantánea, Amazon S3 crea marcadores de eliminación para los archivos de datos y metadatos a los que hace referencia de forma exclusiva esa instantánea y marca estos archivos como no actuales. Estos archivos no actuales se eliminan después del número de días especificado por la propiedad NonCurrentDays en su política de eliminación de archivos sin referencia. Puede cambiar los valores predeterminados de la instantánea mediante la API PutTableMaintenanceConfiguration. La administración de instantáneas no admite los valores de retención que usted configura en el archivo Iceberg metadata.json, incluida la retención basada en ramas o etiquetas. La administración de instantáneas para las tablas de S3 se inhabilita al configurar una política de retención basada en etiquetas o sucursales, o al configurar una política de retención en el archivo metadata.json que sea más larga que los valores configurados mediante la API PutTableMaintenanceConfiguration.

La eliminación de archivos sin referencia identifica y elimina todos los objetos a los que no hace referencia ninguna instantánea de la tabla. Como parte de su política de eliminación de archivos sin referencia, puede configurar dos propiedades: ExpireDays (3 días de forma predeterminada) y NonCurrentDays (10 días de forma predeterminada). Para cualquier objeto al que no haga referencia la tabla y que sea anterior a la propiedad ExpireDays, S3 elimina permanentemente los objetos una vez transcurrido el número de días especificado en la propiedad NonCurrentDays. Puede configurar la eliminación de archivos sin referencia a nivel de bucket de tablas. Puede cambiar los valores predeterminados para la retención de instantáneas mediante la API PutTableBucketMaintenanceConfiguration.

Las operaciones por lote de S3 forman parte de una característica que puede utilizar para automatizar la ejecución de una única operación (como copiar un objeto o ejecutar una función de AWS Lambda) en distintos objetos. Con las operaciones por lote de S3, mediante algunos clics en la consola de S3 o una sola solicitud de API, puede implementar un cambio en miles de millones de objetos sin tener que escribir códigos de aplicación personalizados ni ejecutar clústeres de informática para aplicaciones de administración de almacenamiento. No solo las operaciones por lote de S3 administran sus operaciones de almacenamiento de muchos objetos, sino que además estas operaciones administran los reintentos, muestran el progreso, envían notificaciones, proporcionan un informe de finalización y envían eventos a AWS CloudTrail para todas las operaciones llevadas a cabo en sus objetos meta. Las operaciones por lote de S3 pueden usarse en la consola de S3 o a través de la CLI y el SDK de AWS. Para obtener más información, visite la página de operaciones por lotes de S3 o la guía del usuario.

Puede comenzar a usar las operaciones por lote de S3 en la consola de Amazon S3 o usando la CLI o el SDK de AWS para crear su primer trabajo de operaciones por lote de S3. Un trabajo de operaciones por lote de S3 consiste en una lista de objetos meta identificados y el tipo de operación que hay que llevar a cabo (consulte la lista completa de operaciones disponibles). Comience seleccionando un informe de S3 Inventory o suministrando su propia lista personalizada de objetos meta para operaciones por lote de S3 identificados. Un informe de S3 Inventory es un archivo que enumera los objetos almacenados en un bucket o prefijo S3. A continuación, elige entre un conjunto de operaciones admitidas en las operaciones por lote de S3, como reemplazar conjuntos de etiquetas, cambiar ACL, copiar almacenamiento de un bucket a otro o iniciar una restauración de S3 Glacier Flexible Retrieval al tipo de almacenamiento S3 Standard. Puede personalizar sus trabajos de operaciones por lote de S3 con parámetros específicos, por ejemplo, valores de etiquetas, beneficiarios de ACL y duración de la restauración. Para seguir personalizando sus acciones de almacenamiento, puede escribir su propia función de Lambda e invocar ese código mediante las operaciones por lote de S3. Una vez que cree su trabajo de operaciones por lote de S3, las operaciones por lote de S3 procesarán su lista de objetos y enviarán el trabajo al estado “esperando confirmación” en caso de ser necesario. Después de confirmar los detalles del trabajo, las operaciones por lote de S3 comenzarán a ejecutar la operación especificada. Puede ver el progreso de su trabajo mediante programación o a través de la consola de S3, recibir notificaciones de finalización y revisar un informe de finalización que detalla los cambios realizados en su almacenamiento.
Si está interesado en obtener más información sobre S3 Batch Operations, vea los vídeos tutoriales y visite la documentación.

Para los clientes de la industria de servicios financieros, el bloqueo de objetos de S3 ofrece soporte adicional para agentes de bolsa que deben conservar registros en un formato no borrable y no rescribible para cumplir con los requisitos normativos de la Regla SEC 17a-4(f), Regla 4511 de FINRA o Regulación CFTC 1.31. Puede designar fácilmente el plazo de retención de registros para conservar los archivos reguladores en la forma original durante la duración requerida y también colocar retenciones legales para conservar datos indefinidamente hasta que se elimine la retención.

Notifique al organismo regulador o a la «autoridad examinadora designada (DEA)» de su elección para utilizar Amazon S3 para el almacenamiento electrónico junto con una copia de la evaluación de Cohasset. En lo referente a estos requisitos, AWS no es un tercero designado (D3P). Asegúrese de seleccionar un D3P e incluir la información en su notificación a la DEA.

Puede utilizar la consola de administración de AWS para habilitar la generación de métricas de solicitudes de CloudWatch de un minuto para su bucket de S3 o configurar los filtros para las métricas con un prefijo o una etiqueta de objeto, o bien un punto de acceso. También, puede llamar a la API PUT Bucket Metrics de S3 para habilitar y configurar la publicación de métricas de almacenamiento de S3. Las métricas de solicitudes de CloudWatch estarán disponibles en CloudWatch a los 15 minutos de habilitarse. Las métricas de almacenamiento de CloudWatch están habilitadas de forma predeterminada para todos los buckets y se reportan una vez por día. Obtenga más información sobre las métricas de CloudWatch para Amazon S3.

Puede utilizar CloudWatch para definir límites en cualquiera de los recuentos, temporizadores o tasas de las métricas de almacenamiento y activar una acción cuando se supere el límite. Por ejemplo, puede configurar un límite en función del porcentaje de respuestas de error 4xx y que, cuando al menos tres puntos de datos superen el límite, se active una alarma de CloudWatch para alertar a un ingeniero de DevOps.

Las métricas de almacenamiento de CloudWatch son gratuitas. Los precios de las métricas de solicitudes de CloudWatch son los mismos que los de las métricas personalizadas de Amazon CloudWatch. Consulte la página de precios de Amazon CloudWatch para obtener información general sobre los precios de las métricas de S3 CloudWatch.

La administración del ciclo de vida de S3 proporciona la capacidad de definir el ciclo de vida de su objeto con una política predefinida y reducir su costo de almacenamiento. Puede definir una política de transición de ciclo de vida para migrar automáticamente objetos almacenados en el tipo de almacenamiento S3 Estándar a los tipos de almacenamiento S3 Estándar - Acceso poco frecuente, S3 Única zona - Acceso poco frecuente o S3 Glacier en función de la antigüedad de los datos. También puede definir políticas de vencimiento del ciclo de vida para eliminar objetos automáticamente en función de su antigüedad. Puede definir una política para el vencimiento de carga multiparte, que asigna un vencimiento a la carga multiparte incompleta en función de su antigüedad. Para obtener más información, visite la página de la guía de usuario de ciclo de vida de S3.

Puede configurar y administrar políticas del ciclo de vida en la consola de administración de AWS, la API REST de S3, los SDK de AWS o la interfaz de línea de comandos (CLI) de AWS. Puede especificar la política en el prefijo o en el nivel de bucket.

Con las políticas de ciclo de vida de Amazon S3, puede configurar sus objetos para que se migren desde la clase de almacenamiento S3 Standard a S3 Standard-IA o S3 One Zone-IA, o se archiven en los tipos de almacenamiento S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval o S3 Glacier Deep Archive.

También puede especificar una política de ciclo de vida de S3 para eliminar objetos una vez transcurrido un periodo determinado. Puede utilizar esta automatización basada en políticas para reducir de forma rápida y sencilla los costos de almacenamiento, además de ahorrar tiempo. En cada regla puede especificar un prefijo, un periodo de tiempo, una transición a S3 Standard-IA, S3 One Zone-IA, S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval, S3 Glacier Deep Archive o un vencimiento. Por ejemplo, podría crear una regla que archivara en S3 Glacier Flexible Retrieval todos los objetos con el prefijo común “logs/” 30 días después de su creación, y que les aplicara un vencimiento de 365 días después de su creación.

También puede crear una regla independiente que solo aplique un vencimiento a todos los objetos con el prefijo “backups/” 90 días después de su creación. Las políticas de ciclo de vida de S3 se aplican a objetos de S3 tanto nuevos como existentes, lo que le ayuda a optimizar el almacenamiento y maximizar el ahorro en costos para todos los datos actuales y los datos nuevos que se ubiquen en S3 sin necesidad de realizar una revisión y migración de datos manual y laboriosa.

Dentro de una regla del ciclo de vida, el campo de prefijo identifica los objetos sujetos a la regla. Para aplicar la regla a un objeto individual, especifique el nombre de clave. Para aplicar la regla a un conjunto de objetos, especifique su prefijo común (por ejemplo, “logs/”). Puede especificar una acción de transición para archivar los objetos y una acción de vencimiento para eliminar los objetos. En cuanto al periodo de tiempo, proporcione la fecha de creación (por ejemplo, 31 de enero de 2015) o el número de días desde la fecha de creación (por ejemplo, 30 días) tras el cual desea que los objetos se archiven o eliminen. Puede crear varias reglas para distintos prefijos.

No se aplica un costo adicional por configurar y aplicar políticas del ciclo de vida. Una solicitud de transición se cobra por objeto cuando un objeto es apto para la transición según la regla del ciclo de vida. Consulte la página de precios de Amazon S3 para obtener información sobre los precios.

La política sobre el ciclo de vida de S3 que aplica un vencimiento a las cargas multiparte incompletas le permite ahorrar en costos al limitar el tiempo que se almacenan las cargas multiparte no completadas. Por ejemplo, si su aplicación carga varias partes de objetos multiparte, pero no llega a confirmarlas, se le seguirá cobrando por ese almacenamiento. Esta política puede reducir su factura de almacenamiento de S3 al eliminar automáticamente las cargas multiparte incompletas y el almacenamiento asociado tras un número predefinido de días. Obtenga más información sobre el uso del ciclo de vida de S3 para definir el vencimiento de cargas multiparte incompletas »

Sí, puede configurar las notificaciones de eventos de Amazon S3 para que le notifique cuando el ciclo de vida de S3 realice una transición o defina el vencimiento de un objeto. Por ejemplo, puede enviar notificaciones de eventos de S3 a un tema de Amazon SNS, a una cola de Amazon SQS o a una función AWS Lambda cada vez que el ciclo de vida de S3 mueva objetos a una clase de almacenamiento de S3 diferente o defina el vencimiento de un objeto.

Análisis e información de almacenamiento

Abrir todo

S3 Storage Lens brinda visibilidad en toda la organización del uso de almacenamiento de objetos y las tendencias de actividad y realiza recomendaciones prácticas para optimizar costes y aplicar prácticas recomendadas de protección de datos. El análisis de tipo de almacenamiento de S3 permite supervisar los patrones de acceso de objetos para ayudarlo a decidir cuándo transferir los datos al tipo de almacenamiento adecuado para optimizar los costes. Luego puede utilizar esta información para configurar una política de ciclo de vida de S3 que realice la transferencia de datos. Amazon S3 Inventory proporciona a diario o semanalmente un informe de los objetos y sus metadatos correspondientes para un bucket o prefijo de S3. Este informe se puede utilizar para controlar el estado de reproducción y cifrado de los objetos a fin de cumplir requisitos empresariales, de conformidad y normativos.

Amazon S3 Storage Lens brinda visibilidad en toda la organización del uso de almacenamiento de objetos y las tendencias de actividad, al igual que recomendaciones prácticas para optimizar costes y aplicar prácticas recomendadas de protección de datos. Storage Lens ofrece un panel de control interactivo con una vista única del uso de almacenamiento de objetos y la actividad de decenas o cientos de cuentas de su organización, con desgloses para obtener información en varios niveles de agregación. Esto incluye métricas como bytes, recuentos de objetos y solicitudes, así como métricas que detallan la utilización de las características de S3, como recuentos de objetos cifrados y recuentos de reglas de ciclo de vida de S3. S3 Storage Lens brinda también recomendaciones contextuales con las que puede reducir los costes de almacenamiento y aplicar prácticas recomendadas sobre protección de datos en decenas o cientos de cuentas y buckets. Las métricas gratuitas de S3 Storage Lens están habilitadas de manera predeterminada para todos los usuarios de Amazon S3. Si quiere sacar más partido a S3 Storage Lens, puede activar las recomendaciones y métricas avanzadas. Para obtener más información, visite la página de la guía del usuario de Storage Lens de S3.

S3 Storage Lens combina el uso del almacenamiento y las métricas de actividad a diario para verlos en el panel interactivo de S3 Storage Lens, o tenerlos disponibles como una exportación de métricas en formato de archivo CSV o Parquet. Se crea de forma automática un panel predeterminado a nivel de cuenta y tiene la opción de crear paneles de control personalizados adicionales. Los paneles de S3 Storage Lens pueden limitarse a su organización de AWS o cuentas específicas, regiones o buckets, o incluso a nivel de prefijos (disponible con las métricas avanzadas de S3 Storage Lens). También puede usar los grupos de S3 Storage Lens para agregar métricas mediante filtros personalizados basados en los metadatos del objeto, como la etiqueta, el tamaño y la antigüedad del objeto. Al configurar su panel de control, puede utilizar la selección de métricas predeterminada o actualizarla para recibir 35 métricas adicionales y agregaciones a nivel de prefijo por un costo adicional. Además, S3 Storage Lens proporciona recomendaciones contextualizadas con métricas de almacenamiento en el panel de control para que pueda tomar medidas que optimicen el almacenamiento en función de las métricas.

El panel de control de S3 Storage Lens está organizado en torno a cuatro tipos principales de preguntas sobre el almacenamiento. En el filtro Summary (Resumen), se pueden explorar preguntas de nivel superior relacionadas con el uso general del almacenamiento y las tendencias de actividad. Por ejemplo, “¿con qué rapidez aumenta el número total de bytes y el número de solicitudes con el tiempo?” En el filtro Cost Optimization (Optimización de costes), puede explorar preguntas relacionadas con la reducción de costes de almacenamiento. Por ejemplo, “¿puedo ahorrar dinero al retener menos versiones no actuales?”. Con los filtros Data Protection (Protección de datos) y Access Management (Administración de acceso), puede responder preguntas sobre cómo proteger los datos. Por ejemplo, “¿mi almacenamiento está protegido contra la eliminación accidental o intencional?”. Por último, con los filtros Performance (Rendimiento) y Events (Eventos), puede explorar formas de mejorar el rendimiento de los flujos de trabajo. Cada una de estas preguntas representa una primera capa de investigación que probablemente conduzca a un análisis detallado.

S3 Storage Lens contiene más de 60 métricas agrupadas en métricas gratuitas y métricas avanzadas (disponibles por un coste adicional). Con las métricas gratuitas, recibirá métricas para analizar el uso (basado en una instantánea diaria de sus objetos), las cuales se organizan en categorías de optimización de costes, protección de datos, administración de acceso, rendimiento y eventos. Con las métricas avanzadas, recibirá métricas relacionadas con la actividad (como el recuento de solicitudes), la optimización de costes profunda (como el recuento de reglas de ciclo de vida de S3), la protección de datos adicionales (como el recuento de reglas de reproducción de S3) y los códigos de estado detallado (como errores de autorización 403). Además, también se proporcionan métricas derivadas al combinar cualquier métrica base. Por ejemplo, “Retrieval Rate” (Tasa de recuperación) es una métrica que se calcula al dividir “Bytes Downloaded Count” (Recuento de bytes descargados) por “Total Storage” (Almacenamiento total). Para ver la lista completa de métricas, consulte la documentación de Lente de almacenamiento de S3.

Un panel de control predeterminado se configura de forma automática para toda la cuenta y tiene la opción de crear paneles personalizados adicionales en el ámbito de la organización de AWS o regiones o buckets específicos dentro de una cuenta. Puede configurar varios paneles de control personalizados, que pueden ser útiles si necesita alguna separación lógica en su análisis de almacenamiento, como segmentar en buckets para representar varios equipos internos. De forma predeterminada, en el panel de control recibirá las métricas gratuitas de S3 Storage Lens, pero tiene la opción de actualizar el servicio para recibir métricas y recomendaciones avanzadas de S3 Storage Lens por un coste adicional. Las métricas avanzadas de S3 Storage Lens tienen 7 opciones distintas: métricas de actividad, métricas avanzadas de optimización de costos, métricas avanzadas de protección de datos, métricas detalladas de códigos de estado, agregación de prefijos, publicación en CloudWatch y agregación de grupos de Storage Lens. Además, para cada panel puede habilitar la exportación de métricas, con opciones adicionales para especificar el bucket de destino y el tipo de cifrado.

Para las métricas que se muestran en el panel interactivo, las métricas gratuitas de Storage Lens retienen 14 días de datos históricos, mientras que las métricas avanzadas de Storage Lens retienen 15 meses de datos históricos por un coste adicional. Para la exportación opcional de métricas, puede configurar cualquier periodo de retención que desee y se aplicarán los cargos de almacenamiento estándar de S3.

S3 Storage Lens está disponible en dos niveles de métricas. Las métricas gratuitas están habilitadas de forma predeterminada y se encuentran disponibles para todos los clientes de S3 sin coste adicional. Los detalles de precios de recomendaciones y métricas avanzadas de S3 Storage Lens están disponibles en la página de precios de S3. Con las métricas gratuitas de S3 Storage Lens, recibe 28 métricas de uso a nivel de bucket y puede acceder a 14 días de datos históricos en el panel. Con las métricas y recomendaciones avanzadas de S3 Storage Lens recibirá 35 métricas adicionales, agregación a nivel de prefijo, compatibilidad con métricas de CloudWatch, filtrado personalizado de metadatos de objetos con grupos de S3 Storage Lens y podrá acceder a 15 meses de datos históricos en el panel de control.

S3 Inventory proporciona una lista de los objetos y metadatos correspondientes para un bucket de S3 o un prefijo compartido, que se puede utilizar para realizar un análisis a nivel de objeto del almacenamiento. S3 Storage Lens proporciona métricas que pueden agregarse por organización, cuenta, región, clase de almacenamiento, bucket, prefijo y niveles de grupo de S3 Storage Lens, lo que mejora la visibilidad de su almacenamiento en toda la organización.

El análisis de tipo de almacenamiento de S3 proporciona recomendaciones para un tipo de almacenamiento óptimo mediante la creación de grupos de edad de objeto basado en los patrones de acceso a nivel de objeto dentro de un bucket/prefijo/ etiqueta individual para los 30 a 90 días anteriores. S3 Storage Lens proporciona recomendaciones diarias a nivel de organización sobre formas de mejorar la rentabilidad y aplicar las prácticas recomendadas de protección de datos, con recomendaciones granulares adicionales por cuenta, región, clase de almacenamiento, bucket, grupo de S3 Storage Lens o prefijo (disponible con las métricas avanzadas de S3 Storage Lens). También puede usar filtros personalizados con los grupos de S3 Storage Lens para visualizar su almacenamiento según la antigüedad del objeto e informar su estrategia de archivado de almacenamiento.

Con el análisis de tipo de almacenamiento, puede analizar los patrones de acceso al almacenamiento a fin de determinar el tipo de almacenamiento óptimo para su almacenamiento. La característica de S3 identifica automáticamente los patrones de uso poco frecuente para ayudarle a transferir almacenamiento a S3 Estándar - Acceso poco frecuente. Puede configurar una política de análisis de tipo de almacenamiento para monitorear un bucket entero, un prefijo o una etiqueta de objeto. Una vez que se observe un patrón de acceso poco frecuente, podrá crear con facilidad una nueva política de ciclo de vida de S3 en función de los resultados. El análisis de tipo de almacenamiento también proporciona visualizaciones diarias del uso de su almacenamiento en la consola de administración de AWS y, además, puede habilitar un informe de exportación a un bucket de S3 para analizarlas con las herramientas de inteligencia empresarial que desee, como Amazon QuickSight. Obtenga más información y comience por visitar la guía de usuario del análisis de tipos de almacenamiento de S3.

El análisis del tipo de almacenamiento se actualiza a diario en la consola de administración de S3, pero las recomendaciones iniciales para las transiciones del tipo de almacenamiento se proporcionan después de 30 días.

Consultas in situ

Abrir todo

Amazon S3 permite a los clientes ejecutar consultas sofisticadas en datos almacenados sin la necesidad de migrar datos a una plataforma de análisis diferente. La capacidad para consultar estos datos in situ en Amazon S3 puede aumentar significativamente el rendimiento y reducir el costo de soluciones de análisis que utilizan S3 como lago de datos. S3 ofrece varias opciones de consulta in situ, que incluyen Amazon Athena y Amazon Redshift Spectrum, lo que le permite elegir la que mejor se adapte a su caso de uso.

Hay varias formas de consultar los datos en S3 entre las que puede elegir según su caso de uso específico. Utilice el filtrado del cliente para descargar un objeto de Amazon S3 a su procesamiento de AWS y filtre el contenido mediante las bibliotecas de análisis de datos de su aplicación cliente. Por ejemplo, en una aplicación de Python que consulta objetos de Parquet en Amazon S3, puede usar la API GET de Amazon S3 para descargar el objeto y filtrar el contenido mediante la biblioteca “Pandas”. Utilice Amazon Athena para procesar varios objetos de S3 en una sola consulta o incluso utilice operaciones de unión y funciones de ventana para consultar sus objetos de S3. Use S3 Object Lambda agregando su propio código a las solicitudes GET de S3 para filtrar los datos a medida que se devuelven a una aplicación. Debe usar S3 Object Lambda si desea agregar transformaciones mientras filtra los datos. Lea la entrada del para obtener más información sobre estos métodos para consultar sus datos en Amazon S3.

Amazon Athena es un servicio de consultas interactivo que facilita el análisis de datos en Amazon S3 mediante consultas SQL estándar. Athena no tiene servidor, por lo que no es necesario configurar ni administrar infraestructura, y puede comenzar a analizar los datos al instante. Ni siquiera tiene que cargar los datos en Athena, ya que funciona directamente con los datos almacenados en cualquier tipo de almacenamiento de S3. Para comenzar, inicie sesión en la consola de administración de Athena, defina sus esquemas y comience a realizar consultas. Amazon Athena utiliza Presto con compatibilidad absoluta con SQL estándar y admite varios formatos de datos estándar, como CSV, JSON, ORC, Apache Parquet y Avro. Si bien Athena es ideal para realizar consultas ad-hoc rápidas y se integra con Amazon QuickSight para una visualización sencilla, también es capaz de realizar análisis complejos, incluidas cadenas de gran tamaño, funciones de períodos y matrices.

Amazon Redshift Spectrum es una función de Amazon Redshift que le permite ejecutar consultas en exabytes de datos no estructurados en Amazon S3 sin necesidad de cargarlos ni de ETL. Cuando emite una consulta, va al punto de conexión de Amazon Redshift SQL, lo que genera y optimiza un plan de consulta. Amazon Redshift determina qué datos son locales y cuáles se encuentran en Amazon S3, genera un plan para minimizar el volumen de datos de Amazon S3 que necesita leerse, y solicita a los empleados de Redshift Spectrum un grupo de recursos compartidos para leer y procesar datos de Amazon S3. Redshift Spectrum escala horizontalmente a miles de instancias de ser necesario, por lo que las consultas se ejecutan rápidamente independientemente del volumen de los datos. Además, puede utilizar exactamente los mismos datos de SQL para Amazon S3 que utiliza en la actualidad para sus consultas en Amazon Redshift y conectarse al mismo punto de conexión de Amazon Redshift con sus herramientas de inteligencia empresarial. Redshift Spectrum permite separar el almacenamiento de la computación, por lo que puede escalar cada función de forma independiente. Puede configurar tantos clústeres de Amazon Redshift como necesite para realizar consultas en su lago de datos de Amazon S3, lo que brinda alta disponibilidad y simultaneidad ilimitada. Redshift Spectrum ofrece la posibilidad de almacenar los datos donde desee, en el formato que quiera, de modo que se encuentren disponibles para procesarlos cuando los necesite.

Replicación

Abrir todo

La replicación de Amazon S3 permite la copia automática y asincrónica de objetos en los buckets de Amazon S3. Los buckets que estén configurados para la replicación de objetos pueden pertenecer a la misma cuenta de AWS o a cuentas diferentes. Puede replicar nuevos objetos escritos en el bucket en uno o más buckets de destino entre diferentes regiones de AWS (replicación entre regiones de S3) o dentro de la misma región de AWS (replicación en la misma región de S3). También puede replicar el contenido del bucket existente (replicación por lotes de S3), incluidos los objetos existentes, los objetos que anteriormente no se pudieron replicar y los objetos replicados desde otro origen. Para obtener más información, consulte la guía del usuario sobre Replicación de S3.

La CRR es una característica de Amazon S3 que replica datos automáticamente entre buckets en regiones de AWS diferentes. Con la CRR, puede configurar la replicación en un nivel de bucket, un nivel de prefijo compartido o un nivel de objeto mediante etiquetas de objeto de S3. Puede utilizar la replicación entre diferentes regiones para facilitar una menor latencia en el acceso a datos situados en otras regiones geográficas. La replicación entre diferentes regiones también puede resultarle útil si, por exigencias normativas, necesita almacenar copias de los datos a cientos de kilómetros de distancia. Puede utilizar la CRR para modificar el propietario de una cuenta de objetos replicados a fin de proteger los datos de una eliminación accidental. Para obtener más información, consulte la guía del usuario sobre la CRR de S3.

La SRR es una característica de Simple Storage Service (Amazon S3) que replica datos automáticamente entre buckets dentro de una misma región de AWS. Con la SRR, puede configurar la replicación en un nivel de bucket, un nivel de prefijo compartido o un nivel de objeto mediante etiquetas de objeto de S3. Puede usar la SRR para crear una o más copias de los datos en la misma región de AWS. La SRR le permite cumplir con los requisitos de conformidad y soberanía de datos porque conserva una copia de los datos en una cuenta de AWS independiente en la misma región que la cuenta original. Puede utilizar la SRR para modificar el propietario de una cuenta de objetos replicados a fin de proteger los datos de una eliminación accidental. También puede usar la SRR para combinar fácilmente registros de diferentes buckets de S3 a fin de hacer procesamientos dentro de la región o para configurar la replicación en vivo entre los entornos de prueba y desarrollo. Para obtener más información, consulte la guía del usuario sobre SRR de S3.

La replicación por lotes de Amazon S3 replica los objetos existentes entre depósitos. Puede utilizar Replicación por lotes de S3 para replicar un bucket creado recientemente con objetos existentes, reintentar objetos que no se pudieron replicar anteriormente, migrar datos entre cuentas o agregar nuevos buckets a su lago de datos. Puede comenzar a utilizar Replicación por lotes de S3 con unos pocos clics en la consola de S3 o con una solicitud a la API. Para obtener más información, consulte la guía del usuario sobre la replicación por lotes de S3.

La replicación de Amazon S3 (CRR y SRR) se configura en un nivel de bucket de S3, un nivel de prefijo compartido o un nivel de objeto mediante etiquetas de objeto de S3. Para agregar una configuración de replicación en el bucket de origen, es necesario especificar un bucket de destino en la misma región o en una región diferente de AWS para su replicación. Puede utilizar la consola de S3, la API, la AWS CLI, los AWS SDK o AWS CloudFormation para habilitar la replicación. Para habilitar la replicación, es necesario tener activado el control de versiones tanto en el bucket de origen como en el de destino. Para obtener más información, consulte la sección Información general sobre la configuración de la replicación de S3 en la documentación de Amazon S3.

Primero deberá habilitar la replicación de S3 para los buckets. Consulte la pregunta anterior para saber cómo puede hacerlo. A continuación, puede iniciar un trabajo de replicación por lotes de S3 en la consola de S3 después de crear una nueva configuración de replicación, cambiar un destino de replicación en una regla de replicación desde la página de configuración de replicación o desde la página S3 Batch Operations Create Job (Crear trabajo de operaciones por lotes de S3). Como alternativa, puede iniciar trabajos de replicación por lotes de S3 a través de la AWS CLI o AWS SDK. Para obtener más información, consulte la sección Replicación de S3 en la documentación de Amazon S3.

Con la replicación de S3, puede establecer reglas de replicación para hacer copias de sus objetos en otra clase de almacenamiento, en la misma región o en una diferente. Las acciones de ciclo de vida no se replican, por lo que si desea implementar la misma configuración de ciclo de vida tanto en el bucket de origen como de destino, deberá activar la misma configuración de ciclo de vida en ambos. Por ejemplo, puede configurar una regla de ciclo de vida para migrar datos de la clase de almacenamiento S3 Standard a la clase S3 Standard-IA o S3 One Zone-IA o para archivar datos en un tipo de almacenamiento S3 Glacier en el bucket de destino. Si tiene un ciclo de vida de S3 configurado para su bucket de destino, le recomendamos desactivar las reglas del ciclo de vida mientras el trabajo de replicación por lotes está activo para mantener la paridad entre las versiones actuales y no actuales de los objetos en los buckets de origen y destino.

Puede encontrar más información sobre la configuración del ciclo de vida y la replicación en la documentación sobre la replicación de S3.

Sí. La replicación de S3 permite a los clientes replicar sus datos en varios buckets de destino, en la misma o en diferentes regiones de AWS. Al realizar la configuración, simplemente especifique el nuevo bucket de destino en la configuración de replicación existente o cree una nueva configuración de replicación con varios buckets de destino. Para cada nuevo destino que especifique, tiene la flexibilidad de elegir el tipo de almacenamiento del bucket de destino, el tipo de cifrado, las métricas y notificaciones de replicación, el control del tiempo de replicación (RTC) y otras propiedades.

P: ¿Puedo utilizar la replicación de S3 para configurar la replicación bidireccional entre buckets de S3?

Sí, para CRR y SRR, puede configurar la reproducción en todas las cuentas de AWS a fin de almacenar sus datos reproducidos en una cuenta diferente en la región de destino. Puede usar la sobrescritura de propiedad en la configuración de la replicación para mantener una pila de propiedad diferente entre el origen y el destino, y otorgar la propiedad de la cuenta de destino al almacenamiento replicado.

Las etiquetas de objetos admiten la replicación entre diferentes regiones de AWS. Para clientes con la replicación entre diferentes regiones ya habilitada, se requieren nuevos permisos para replicar las etiquetas. Para obtener más información sobre cómo configurar la replicación entre diferentes regiones, consulte Cómo configurar la replicación entre diferentes regiones en la documentación de Amazon S3.

Sí, puede replicar marcadores de eliminación del bucket de origen al de destino si tiene activada la replicación de marcadores de eliminación en la configuración de la replicación. Cuando replica los marcadores de eliminación, Amazon S3 se comportará como si el objeto se hubiera eliminado en ambos buckets. Puede activar la replicación del marcador de eliminación en una regla de replicación nueva o existente. Puede aplicar la replicación del marcador de eliminación a todo el bucket o a objetos de Amazon S3 que tengan un prefijo específico, con reglas de replicación basadas en el prefijo. La replicación de Amazon S3 no admite la replicación del marcador de eliminación para las reglas de replicación basadas en etiquetas de objetos. Para obtener más información sobre cómo activar la replicación del marcador de eliminación, consulte Replicación de marcadores de eliminación entre buckets.

No, la replicación de Amazon S3 no está disponible entre las regiones de AWS en China y las regiones de AWS fuera de China. Solo se puede replicar dentro de las regiones de China.

Sí. Puede usar la replicación por lotes de S3 para replicar objetos existentes entre buckets. Para obtener más información, consulte la guía del usuario de S3.

Sí. Puede usar la replicación por lotes de S3 para volver a replicar objetos que no se replicaron inicialmente. Para obtener más información, consulte la guía del usuario de S3.

La replicación S3 admite todos los tipos de cifrado que ofrece S3. S3 ofrece tanto el cifrado del lado del servidor como el del lado del cliente: el primero solicita a S3 que cifre los objetos por usted, y el segundo requiere que usted cifre los datos en el lado del cliente antes de subirlos a S3. Para el cifrado del lado del servidor, S3 ofrece el cifrado del lado del servidor con claves administradas por Amazon S3 (SSE-S3), el cifrado del lado del servidor con claves KMS almacenadas en el servicio de administración de claves de AWS (SSE-KMS) y el cifrado del lado del servidor con claves proporcionadas por el cliente (SSE-C). Para más detalles sobre estos tipos de cifrado y su funcionamiento, visite la documentación de S3 sobre el uso del cifrado.

La replicación de S3 le permite configurar la replicación entre diferentes cuentas en las que los buckets de origen y destino sean propiedad de distintas cuentas de AWS. Sin incluir los cargos de almacenamiento de S3 y de recuperación correspondientes, los clientes pagan por solicitudes PUT de replicación y transferencia SALIENTE de datos entre regiones desde S3 hasta la región de destino al usar la replicación de S3. El control del tiempo de replicación de S3 (S3 RTC), en caso de tenerlo activado en las reglas de replicación, está sujeto a cargos específicos distintos por las solicitudes PUT de replicación y la transferencia SALIENTE de datos. Para la replicación entre cuentas, la cuenta de origen paga toda la transferencia de datos (S3 RTC y S3 CRR) y la cuenta de destino paga las solicitudes PUT de replicación. Solo la replicación entre regiones de S3 (S3 CRR) y el control del tiempo de replicación de S3 (S3 RTC) están sujetos a cargos por transferencia de datos. La replicación en la misma región de S3 (S3 SRR) no incurre en estos gastos. Si utiliza la replicación por lotes de S3 para replicar objetos entre cuentas, incurrirá en los cargos de Operaciones por lotes de S3, además de los cargos de solicitudes PUT de replicación y los cargos de transferencia SALIENTE de datos (tenga en cuenta que S3 RTC no se aplica a la replicación por lotes). Los cargos por operaciones por lotes incluyen los cargos por trabajo y objeto, que se basan respectivamente en la cantidad de trabajos y la cantidad de objetos procesados. Además, si opta por el manifiesto generado por Simple Storage Service (Amazon S3), incurrirá en un cargo de manifiesto en función de la cantidad de objetos en el bucket de origen.

Visite la página de precios de Amazon S3 para obtener más información sobre los precios de S3 Replication.

El control del tiempo de replicación de Amazon S3 proporciona un rendimiento de replicación predecible y le ayuda a cumplir con los requisitos de conformidad o empresariales. El control del tiempo de replicación de S3 está diseñado para replicar la mayoría de los objetos en segundos, y el 99,99 % de los objetos en 15 minutos. S3 Replication Time Control está respaldado por un compromiso de acuerdo de nivel de servicio (SLA) según el cual el 99,9% de los objetos se replicarán en 15 minutos para cada par de regiones de replicación durante cualquier mes de facturación. El tiempo de replicación es compatible con todas las características de replicación de S3. Visite la documentación sobre la replicación para obtener más información.

El control del tiempo de replicación de Amazon S3 está habilitado como una opción para cada regla de replicación. Puede crear una política de replicación de S3 nueva con control del tiempo de replicación de S3 o activar la característica en una política existente. Puede utilizar la consola de S3, la API, la AWS CLI, los AWS SDK o AWS CloudFormation para configurar la replicación. Para obtener más información, visite la descripción general de la configuración de la replicación en la Guía para desarrolladores de Amazon S3.

Sí, puede habilitar el control del tiempo de replicación de Amazon S3 para replicar datos dentro y entre las regiones de AWS China (Ningxia) y China (Pekín).

La replicación de Amazon S3 proporciona cuatro métricas detalladas en la consola de Amazon S3 y en Amazon CloudWatch: operaciones pendientes, bytes pendientes, latencia de replicación y replicación fallida en las operaciones. Puede utilizar estas métricas para supervisar la cantidad total de operaciones y el tamaño de los objetos pendientes de replicación, la latencia de replicación entre los buckets de origen y destino y la cantidad de operaciones que no se replicaron correctamente para cada regla de replicación. Además, puede configurar las notificaciones de eventos de Amazon S3 del tipo s3:Replication para obtener más información sobre los objetos que no se pudieron replicar y el motivo de los errores. Recomendamos utilizar los motivos de los errores de replicación de Amazon S3 para diagnosticar los errores rápidamente y corregirlos antes de volver a replicar los objetos fallidos con la replicación por lotes de S3. Por último, si tiene activado el control del tiempo de replicación de S3 (S3 RTC) recibirá una notificación de evento de S3 cuando un objeto demore más de 15 minutos en replicarse y otra cuando el objeto se replique correctamente en el destino.

Las métricas y los eventos de replicación de Amazon S3 se pueden activar para las reglas de replicación nuevas o existentes y se activan de manera predeterminada para las reglas de control del tiempo de replicación de S3. Puede acceder a las métricas de replicación de S3 a través de la consola de Amazon S3 y a través de Amazon CloudWatch. Al igual que otros eventos de Amazon S3, los eventos de replicación de S3 se encuentran disponibles mediante Amazon Simple Queue Service (Amazon SQS), Amazon Simple Notification Service (Amazon SNS) o AWS Lambda. Para obtener más información, consulte Monitoreo del avance con las métricas de replicación y las notificaciones de eventos de Amazon S3 en la guía para desarrolladores de Amazon S3.

No puede utilizar métricas como los bytes pendientes, las operaciones pendientes y la latencia de replicación para realizar un seguimiento del progreso de la replicación por lotes de S3. Sin embargo, puede utilizar la métrica de replicación fallida de las operaciones para monitorear los objetos existentes que no se replican correctamente con la replicación por lotes de S3. Además, también puede utilizar los informes de finalización de operaciones por lotes de S3 para realizar un seguimiento de los objetos que se replican con la replicación por lotes de S3 Batch Replication.

El control del tiempo de replicación de Amazon S3 se diseñó para replicar el 99,99 % de los objetos en un plazo de 15 minutos y cuenta con el respaldo del acuerdo de nivel de servicio. Si se replican menos del 99,9 % de los objetos en 15 minutos en un par de regiones de replicación durante un ciclo de facturación mensual, el acuerdo de nivel de servicio de S3 RTC prevé un crédito de servicio para cualquier objeto que haya tardado más de 15 minutos en replicarse. El crédito para el servicio cubre un porcentaje de todos los cargos relacionados con la replicación que estén asociados con los objetos que no cumplieron el acuerdo, que incluye el cargo del control del tiempo de replicación, los cargos de solicitudes y ancho de banda de la replicación y el costo asociado con el almacenamiento de réplicas en la región de destino en el ciclo de facturación mensual en cuestión. Para obtener más información, lea el SLA de control del tiempo de replicación de S3.

Para la replicación S3 (replicación entre regiones y replicación en la misma región), paga los cargos de S3 por almacenamiento en los tipos de almacenamiento S3 de destino seleccionados, los cargos de almacenamiento para la copia principal, las solicitudes PUT de replicación y la tarifas de recuperación de almacenamiento de acceso no frecuente que se apliquen. Para CRR, también paga la transferencia de datos saliente entre regiones desde S3 a la región de destino. Las métricas de replicación de S3 se facturan al mismo precio que las métricas personalizadas de Amazon CloudWatch. Además, cuando utiliza el Control del tiempo de replicación de S3, también paga un cargo de transferencia de datos de Control del tiempo de replicación. Para obtener más información, visite la página de precios de Amazon S3. Si se carga el objeto de origen a través de la característica de carga multiparte, se replicará usando el mismo número de partes y tamaño de parte. Por ejemplo, si carga un objeto de 100 GB a través de la característica de carga multiparte (800 partes de 128 MB cada una), se aplicarán costos asociados a 802 solicitudes (800 solicitudes de carga de las partes + 1 solicitud para iniciar la carga multiparte + 1 solicitud para completar la carga multiparte) al replicar. Tendrá un cargo de solicitud de 0,00401 USD (802 solicitudes x 0,005 USD por 1000 solicitudes) y, si la replicación se realizó entre regiones de AWS diferentes, un cargo de 2,00 USD (0,020 USD por GB transferido x 100 GB) para transferencias de datos entre regiones. Tras la replicación, los 100 GB generarán cargos de almacenamiento en función de la región de destino.

Los puntos de acceso multirregionales de Amazon S3 aceleran el rendimiento hasta en un 60% al acceder a conjuntos de datos que se replican en varias regiones de AWS. Con base en AWS Global Accelerator, los puntos de acceso para varias regiones de S3 toman en cuenta factores como la congestión de la red y la ubicación de la aplicación de solicitud para dirigir de forma dinámica las solicitudes a través de la red de AWS a la copia de los datos con menor latencia. Este enrutamiento automático permite aprovechar la infraestructura global de AWS mientras se conserva una arquitectura de aplicaciones simple.

Los puntos de acceso de varias regiones de S3 aceleran y simplifican el almacenamiento para sus aplicaciones en varias regiones. Gracias a que dirigen de forma dinámica las solicitudes de S3 realizadas a un conjunto de datos replicado, los puntos de acceso para varias regiones de S3 reducen la latencia de las solicitudes, de forma que las aplicaciones se ejecutan hasta un 60 % más rápido. Los puntos de acceso multirregionales de S3 también pueden ser de ayuda para crear aplicaciones resilientes, multirregionales y multicuentas que estén más protegidas contra la eliminación de datos accidental o no autorizada. Con los puntos de acceso multirregionales de S3 puede aprovechar la infraestructura global de AWS mientras conserva una arquitectura de aplicaciones simple y agnóstica.

Los puntos de acceso de varias regiones dirigen de forma dinámica las solicitudes de los clientes a uno o más buckets de S3 subyacentes. Puede configurar su punto de acceso para varias regiones para dirigir a un bucket por región de AWS en un máximo de 17 regiones de AWS. Cuando crea un punto de acceso para varias regiones, S3 genera de forma automática un nombre compatible con DNS. Este nombre se utiliza como punto de conexión global que pueden utilizar sus clientes. Cuando sus clientes envían solicitudes a este punto de conexión, S3 las dirigirá de forma dinámica a uno de los buckets subyacentes especificados en la configuración de su punto de acceso de varias regiones. Las solicitudes basadas en Internet se incorporan a la red global de AWS para evitar segmentos congestionados en Internet. Esto reduce la latencia y la fluctuación de la red al tiempo que mejora el rendimiento. Con base en AWS Global Accelerator, las aplicaciones que acceden a S3 en Internet pueden ver el rendimiento mejorado en hasta un 60 % por los puntos de acceso de varias regiones de S3. Para controlar directamente este enrutamiento, puede operar los puntos de acceso de varias regiones de S3 en una configuración activa-activa o activa-pasiva. En una configuración activa-pasiva, puede utilizar los controles de conmutación por error de los puntos de acceso de varias regiones de S3 para iniciar una conmutación por error a fin de cambiar el tráfico de la solicitud de acceso a datos de S3 a la cuenta y la región de AWS alternativa en cuestión de minutos.
En una configuración activa-activa, los puntos de acceso de varias regiones de S3 toman en cuenta factores como la congestión de la red y la ubicación de la aplicación de solicitud para dirigir de forma dinámica las solicitudes a la red de AWS con la menor copia de latencia de los datos. Los puntos de acceso de varias regiones de S3 enrutan sus solicitudes a través de la ubicación de AWS más cercana a su cliente y luego a través de la red global privada de AWS para S3. En cualquiera de las configuraciones, los puntos de acceso de varias regiones de S3 le permiten aprovechar la infraestructura global de AWS mientras conserva una arquitectura de aplicaciones simple.

S3 CRR y los puntos de acceso de varias regiones de S3 son características complementarias que funcionan conjuntamente para replicar datos entre regiones de AWS y a continuación dirigir las solicitudes a la copia replicada con la menor latencia. Los puntos de acceso de varias regiones de S3 lo ayudan a administrar las solicitudes en las regiones de AWS, mientras que CRR le permite mover datos en las regiones de AWS para crear réplicas aisladas. Utilice los puntos de acceso de varias regiones de S3 junto con CRR para crear un conjunto de datos de varias regiones replicado que se pueda dirigir mediante un único punto de conexión global.

Cuando utiliza un punto de acceso para varias regiones de S3 para dirigir solicitudes en AWS, paga un cargo por GB bajo de enrutamiento de datos por cada GB procesado, así como cargos estándares de solicitud, almacenamiento, transferencia de datos y replicación de S3. Si la aplicación se ejecuta fuera de AWS y accede a S3 por Internet, se incrementa el rendimiento de los puntos de acceso para varias regiones de S3 mediante el enrutamiento automático de las solicitudes a través de una ubicación de borde de AWS, mediante la red global privada de AWS, hacia la copia de datos más cercana de acuerdo con la latencia de acceso. Cuando acelera las solicitudes realizadas a través de Internet, paga el cargo de enrutamiento de los datos y un cargo de aceleración de Internet. El precio por la aceleración de Internet de los puntos de acceso de varias regiones de S3 varía en función de si el cliente de origen se encuentra en la misma ubicación o en una diferente de la región de destino de AWS y se suma al precio de transferencia de datos estándar de S3. Para usar los controles de conmutación por error de los puntos de acceso de varias regiones de S3, solo se le cobrarán los costos de la API de S3 para ver el estado actual del control de enrutamiento de cada región y para enviar cualquier cambio de control con el fin de iniciar una conmutación por error. Consulte la página de precios de Amazon S3 y la pestaña de transferencia de datos para obtener más información sobre los precios.

Sí, puede configurar los buckets subyacentes del punto de acceso multirregional de S3 para que sean buckets de pagos por solicitante. Con los pagos por solicitante, el solicitante paga todo el costo asociado al uso del punto de conexión, incluido el costo de las solicitudes y el costo de transferencia de datos asociado tanto al bucket como al punto de acceso multirregión. Lo normal es configurar los buckets como buckets de pago por solicitante si desea compartir datos, pero no incurrir en gastos asociados al acceso de otros a los datos. En general, los propietarios de un bucket pagan por todo el almacenamiento de Amazon S3 asociado a su bucket. Para obtener más información, visite Pago por solicitante de S3.

Los puntos de acceso de varias regiones de S3 y la aceleración de transferencias de S3 ofrecen beneficios similares de rendimiento. Puede usar la aceleración de transferencias de S3 para dar más velocidad a la transferencia de contenido desde Amazon S3 y hacia este con la red global de AWS. La aceleración de transferencias de S3 ayuda a acelerar las transferencias de larga distancia de objetos más grandes desde un único bucket de Amazon S3 y hacia este. Con los puntos de acceso de varias regiones de S3, puede realizar transferencias aceleradas similares mediante la red global de AWS, pero a través de muchos buckets de S3 en varias regiones de AWS para solicitudes basadas en Internet, basadas en VPC y solicitudes en las instalaciones desde S3 y hacia este. Cuando combina los puntos de acceso de varias regiones de S3 con S3 CRR, proporciona la capacidad para que los puntos de acceso de varias regiones de S3 enruten de forma dinámica sus solicitudes a la copia de latencia más baja de sus datos para aplicaciones de clientes en varias ubicaciones.

La consola de S3 proporciona un flujo de trabajo guiado simple para configurar rápidamente todo lo que necesita para ejecutar el almacenamiento multirregional en S3 en solo tres pasos sencillos. Primero, cree un punto de conexión para un punto de acceso multirregional de Amazon S3 y especifique las regiones de AWS entre las que quiere replicar y conmutar por error. Para agregar buckets en varias cuentas de AWS a un nuevo punto de acceso multirregional de S3, ingrese los ID de las cuentas que sean propietarias de los buckets en el momento de la creación. Segundo, para cada región de AWS y bucket de S3 detrás de su punto de conexión del punto de acceso multirregional de S3, especifique si su estado de enrutamiento es activo o pasivo, dónde las regiones de AWS aceptan el tráfico de solicitudes de datos de S3 y si las regiones pasivas no se enrutan hasta que inicie una conmutación por error. Tercero, configure sus reglas de S3 CRR para sincronizar sus datos en S3 entre las regiones o las cuentas. Puede iniciar una conmutación por error en cualquier momento entre las regiones de AWS en cuestión de minutos para cambiar sus solicitudes de datos de S3 y monitorear el cambio de su tráfico de S3 a su nueva región de AWS activa en Amazon CloudWatch. Como alternativa, puede utilizar AWS CloudFormation para automatizar su configuración de almacenamiento multirregional. Todos los componentes necesarios para configurar el almacenamiento multirregional en S3, incluidos los puntos de acceso multirregionales de S3, son compatibles con CloudFormation. Esto le permite automatizar fácilmente un proceso de configuración repetible fuera de la consola de administración de S3.

Procesamiento de datos

Abrir todo

S3 Object Lambda le permite agregar su propio código a las solicitudes GET, LIST y HEAD de S3 para modificar y procesar los datos a medida que se devuelven a una aplicación. Puede utilizar código personalizado para modificar los datos que devuelven las solicitudes GET de S3 a fin de filtrar columnas, redimensionar imágenes de forma dinámica, ocultar datos confidenciales y mucho más. También puede usar S3 Object Lambda para modificar la salida de las solicitudes LIST de S3 a fin de crear una vista personalizada de los objetos en un bucket y las solicitudes HEAD de S3 para modificar los metadatos del objeto, como su nombre y tamaño. S3 Object Lambda lo ayuda a cumplir con facilidad los requisitos de formato de datos únicos de cualquier aplicación sin tener que crear y operar infraestructura adicional, como una capa de proxy, ni crear y mantener varias copias derivativas de sus datos. S3 Object Lambda utiliza funciones de AWS Lambda para procesar automáticamente la salida de una solicitud GET, HEAD o LIST de S3 estándar. AWS Lambda es un servicio de computación sin servidor que ejecuta código definido por el cliente sin necesidad de administrar los recursos de computación subyacentes. Con tan solo unos clics en la consola de administración de AWS, puede configurar una función de Lambda y adjuntarla a un punto de acceso de servicio de S3 Object Lambda. A partir de ese punto, S3 llamará automáticamente a la función de Lambda para procesar cualquier dato recuperado a través del punto de conexión de S3 Object Lambda, para devolver un resultado transformado a la aplicación. Puede crear y ejecutar funciones de Lambda propias y personalizadas, con lo que es posible adaptar la transformación de datos de S3 Object Lambda a casos de uso específicos. Para comenzar a utilizar S3 Object Lambda, puede utilizar la consola de administración de S3, el SDK o la API. Obtenga más información en la página de S3 Object Lambda o en la guía del usuario de S3 Object Lambda.

S3 Object Lambda es indispensable si desea procesar datos en línea con una solicitud GET, LIST o HEAD de S3. Puede utilizar S3 Object Lambda para compartir una única copia de los datos entre muchas aplicaciones, lo que evita la necesidad de crear y operar una infraestructura de procesamiento personalizada o de almacenar copias derivadas de los datos. Por ejemplo, mediante el uso de S3 Object Lambda para procesar solicitudes GET de S3, puede enmascarar datos confidenciales con fines de conformidad, reestructurar datos sin procesar con el fin de que sean compatibles con aplicaciones de machine learning, filtrar datos para restringir el acceso a contenido específico dentro de un objeto de S3 o para abordar una amplia gama de casos de uso adicionales. Puede usar S3 Object Lambda para ampliar sus listas de objetos al consultar un índice externo que contiene metadatos de objetos adicionales, filtrar y enmascarar sus listas de objetos para incluir solo objetos con una etiqueta de objeto específica, o agregar una extensión de archivo a todos los nombres de objetos en sus listas de objetos. Por ejemplo, si tiene un bucket de S3 con varios conjuntos de datos discretos, puede usar S3 Object Lambda para filtrar una respuesta de S3 LIST según el solicitante. S3 Object Lambda se puede configurar con tan solo unos clics en la consola de administración de Amazon S3. Lea la guía del usuario para obtener más información.

S3 Object Lambda utiliza funciones de Lambda especificadas por usted para procesar la salida de las solicitudes GET, LIST y HEAD. Una vez que haya definido una función de Lambda para procesar los datos solicitados, puede asociar esa función a un punto de acceso de S3 Object Lambda. Las solicitudes GET, LIST y HEAD que se realizan mediante un punto de acceso de Lambda para objetos de S3 invocarán a partir de ahora la función Lambda especificada. Tras ello, Lambda obtendrá el objeto de S3 solicitado por el cliente y lo procesará. Una vez completado el procesamiento, Lambda transmitirá el objeto procesado al cliente que lo ha llamado. Lea la guía del usuario de S3 Object Lambda para obtener más información.

S3 Object Lambda se puede configurar de varias formas. Para configurar S3 Object Lambda en la consola de S3, vaya a la pestaña Access Point (Punto de acceso) de Object Lambda. A continuación, cree un punto de acceso de S3 Object Lambda, la función de Lambda que quiere que S3 ejecute en las solicitudes GET, LIST y HEAD y un punto de acceso de S3 de apoyo. Conceda permisos a todos los recursos para que interactúen con Object Lambda. Por último, actualice su SDK y la aplicación para utilizar el nuevo punto de acceso de S3 Object Lambda y obtener datos de S3 mediante el SDK en el lenguaje que elija. Puede utilizar un alias de punto de acceso de S3 Object Lambda al realizar solicitudes. Los alias de los punto de acceso de S3 Object Lambda se generan automáticamente y son intercambiables con los nombres de los buckets de S3 para los datos a los que se accede a través de S3 Object Lambda. Para los puntos de acceso de S3 Object Lambda existentes, los alias se asignan automáticamente y están listos para su uso. En la documentación de AWS hay ejemplos de implementaciones de funciones de Lambda que le permitirán comenzar. También puede usar AWS CloudFormation para automatizar la configuración de S3 Object Lambda. Al usar la plantilla de AWS CloudFormation, la función de Lambda que se implementa en su cuenta devolverá los objetos de S3 a la aplicación o cliente solicitante sin cambiar nada. Puede agregar código personalizado para modificar y procesar datos al devolverlos a una aplicación. Para obtener más información, consulte la guía del usuario de S3 Object Lambda.

Todas las operaciones admitidas en una función de Lambda son compatibles con S3 Object Lambda. Esto ofrece una amplia gama de opciones disponibles para procesar las solicitudes. Tiene que proporcionar su propia función de Lambda para ejecutar cálculos personalizados con respecto a las solicitudes GET, LIST y HEAD, lo que permite la flexibilidad de procesar los datos de acuerdo con las necesidades de la aplicación. El tiempo de procesamiento de Lambda está limitado a un máximo de 60 segundos. Para obtener más información, consulte la documentación de S3 Object Lambda.

S3 Object Lambda admite solicitudes GET, LIST y HEAD. Cualquier otra llamada de la API de S3 realizada a un punto de acceso de S3 Object Lambda devolverá la respuesta de la API de S3 estándar. Obtenga más información sobre S3 Object Lambda en la guía del usuario.

Si se produce un error en una función de S3 Object Lambda, recibirá una respuesta de solicitud en la que se explica el error. Al igual que con las demás invocaciones de funciones Lambda, AWS también monitorea automáticamente las funciones en su nombre y reporta las métricas mediante Amazon CloudWatch. Para ayudarlo a solucionar los errores, Lambda registra todas las solicitudes procesadas por la función y almacena automáticamente los registros generados por el código con Registros de Amazon CloudWatch. Para obtener más información sobre el acceso a los registros de CloudWatch para AWS Lambda, consulte la documentación de CloudWatch.

S3 Object Lambda conecta Amazon S3, AWS Lambda y, opcionalmente, otros servicios de AWS que usted elija para entregar objetos relevantes para las aplicaciones que hagan solicitudes. Todos los servicios de AWS utilizados en relación con S3 Object Lambda seguirán rigiéndose por sus respectivos acuerdos de nivel de servicio (SLA). Por ejemplo, si algún servicio de AWS no cumple con su compromiso de servicio, usted podrá recibir un crédito de servicio según se indica en el acuerdo de nivel de servicio correspondiente. La creación de un punto de acceso de S3 Object Lambda no afecta a la durabilidad de los objetos. Sin embargo, S3 Object Lambda invoca la función de AWS Lambda especificada y usted debe asegurarse de que la función de Lambda especificada es la prevista y correcta. Consulte el acuerdo de nivel de servicio más reciente de Amazon S3 aquí.

Al utilizar S3 Object Lambda, se paga un cargo por GB por cada gigabyte de datos que se devuelva a través de S3 Object Lambda. También se le cobran las solicitudes según el tipo (solicitudes GET, LIST y HEAD) y los cargos de computación de AWS Lambda por el tiempo que la función especificada se ejecuta para procesar los datos solicitados. Para ver los detalles de los precios y ver un ejemplo, consulta la página de precios de S3.

Acceso a los datos

Abrir todo

Mountpoint para Amazon S3 es un cliente de archivos de código abierto que puede usar para montar un bucket de S3 en su instancia de proceso y acceder a él como un sistema de archivos local. Mountpoint para Amazon S3 traduce las operaciones del sistema de archivos local en llamadas a la API de REST en objetos almacenados en Amazon S3. Con Mountpoint para Amazon S3, puede lograr un alto rendimiento de instancia única para terminar los trabajos más rápido. Mountpoint para Amazon S3 cuenta con el respaldo de AWS Support. Los clientes con acceso a AWS Enterprise Support reciben soporte técnico las 24 horas del día, los 7 días de la semana por parte de los ingenieros de soporte de Amazon y orientación arquitectónica en el contexto de sus casos de uso. Mountpoint para Amazon S3 funciona con el sistema operativo Linux y los servicios informáticos de AWS, como Amazon Elastic Compute Cloud (EC2). Obtenga más información en la página de Mountpoint for Amazon S3 o en la guía del usuario.

Mountpoint para Amazon S3 es ideal para cargas de trabajo de lagos de datos de lectura intensiva que procesan petabytes de datos mediante operaciones de lectura aleatorias y secuenciales en archivos existentes y operaciones de escritura secuencial para crear archivos nuevos. Estas cargas de trabajo escriben desde un único nodo y no modifican los datos existentes en Amazon S3. Los casos de uso comunes incluyen la simulación de vehículos autónomos a escala de petabytes, la capacitación en machine learning, el análisis genómico y la representación de imágenes. Estas cargas de trabajo aumentan y disminuyen rápidamente y se basan en la elasticidad de Amazon S3 para minimizar la capacidad infrautilizada y evitar el costo del sobreaprovisionamiento del rendimiento. Puede ahorrar en costos de procesamiento con Mountpoint para Amazon S3 al utilizar de manera eficiente el uso del ancho de banda de la red de sus instancias de proceso y escalar de manera confiable a miles de instancias de proceso para cargas de trabajo de lagos de datos a escala de petabytes.

Mountpoint para Amazon S3 admite operaciones básicas del sistema de archivos, como leer archivos de hasta 5 TB de tamaño, escribir archivos nuevos, enumerar archivos existentes y crear y enumerar directorios. Mountpoint para Amazon S3 no admite la modificación de archivos existentes ni la eliminación de directorios existentes. Con estas operaciones, Mountpoint para Amazon S3 es ideal para aplicaciones que leen y escriben datos con un alto rendimiento en los lagos de datos de Amazon S3. No es adecuado para aplicaciones que necesitan colaboración y coordinación entre varios usuarios o instancias de proceso. Por lo general, estas aplicaciones necesitan características de un sistema de archivos compartidos, como la adición a los archivos existentes y el bloqueo de archivos. Puede usar Amazon FSx para Lustre para aplicaciones de lagos de datos que necesitan la semántica POSIX y las características del sistema de archivos compartidos.

Puede empezar a usar Mountpoint para Amazon S3 montando un bucket de S3 en un directorio local de su instancia de proceso siguiendo las instrucciones que se proporcionan en la documentación. Una vez que monte el bucket de S3 en un directorio local, sus aplicaciones podrán acceder a los objetos de S3 como archivos disponibles localmente en su instancia de proceso. Mountpoint para Amazon S3 admite operaciones de lectura secuenciales y aleatorias en objetos de Amazon S3 existentes y admite escrituras secuenciales para objetos nuevos. Consulte la documentación semántica de Mountpoint para Amazon S3 para obtener más información sobre las operaciones del sistema de archivos compatibles. Puede usar Mountpoint para Amazon S3 para acceder a los objetos de todas las clases de almacenamiento de S3, excepto los objetos de S3 Glacier Flexible Retrieval, S3 Glacier Deep Archive y los objetos de los niveles Archive Access y Deep Archive Access de S3 Intelligent-Tiering.

No se aplica ningún cargo adicional por el uso de Mountpoint para Amazon S3. Usted paga por las solicitudes de la API de S3, como las solicitudes GET, PUT y LIST realizadas por Mountpoint para Amazon S3, cuando ejecuta operaciones del sistema de archivos, como las operaciones de lectura, escritura de archivos y listado de directorios. Para obtener información sobre los precios de S3, visite la página de precios.

Mountpoint para Amazon S3 ofrece el mismo rendimiento que los SDK de AWS. Esto significa que las aplicaciones de lagos de datos logran altas velocidades de transferencia de una sola instancia, utilizando de manera eficiente el ancho de banda de la red disponible en su instancia de Amazon EC2. Para lograr un rendimiento aún mayor, estas aplicaciones pueden agregar el rendimiento en varias instancias para obtener varios TB/s.

Al usar Mountpoint para Amazon S3, puede controlar el acceso a sus datos mediante los mecanismos de control de acceso existentes de Amazon S3, incluidas las políticas de bucket y las políticas de AWS Identity and Access Management (IAM). Mountpoint para Amazon S3 traduce las operaciones del sistema de archivos, como la lectura y la escritura, en solicitudes de API de objetos realizadas en su bucket de S3. Posteriormente, Amazon S3 evalúa todas las políticas pertinentes, como las del usuario y el bucket, para decidir si autoriza la solicitud. Mountpoint para Amazon S3 no introduce nuevos mecanismos de control de acceso.

Mountpoint para Amazon S3 no admite la lectura ni la escritura de metadatos de tipo POSIX, como el ID de usuario, el ID de grupo y los campos de permisos. Puede usar Amazon FSx para Lustre con Amazon S3 o AWS DataSync para almacenar metadatos de estilo POSIX para objetos de S3.

Sí, Mountpoint para Amazon S3 admite el acceso a través de AWS PrivateLink. AWS PrivateLink para S3 brinda conectividad privada entre Amazon S3 y el sistema en las instalaciones. Puede aprovisionar su VPC con puntos de conexión de VPC de interfaz para S3 para conectar sus aplicaciones en las instalaciones directamente a S3 a través de AWS Direct Connect o AWS VPN.

Sí, Mountpoint para Amazon S3 admite el acceso a través de puntos de conexión de VPC para puerta de enlace. Le recomendamos que utilice puntos de conexión de VPC de interfaz basados en AWS PrivateLink para acceder a S3 locales o desde una VPC en otra región de AWS. Para los recursos que acceden a S3 desde una VPC en la misma región de AWS que su bucket de S3, recomendamos utilizar puntos de conexión de VPC de puerta de enlace, ya que no se facturan.

Sí, puede acceder a Amazon S3 desde Amazon EKS mediante el SDK de AWS y la CLI de AWS. Para las aplicaciones que utilizan una interfaz de sistema de archivos para leer y escribir datos, puede utilizar el controlador de la interfaz de almacenamiento de contenedores (CSI) de Mountpoint para Amazon S3. Con el controlador de CSI de Mountpoint para Amazon S3, puede lograr altos niveles de rendimiento agregado (hasta terabits por segundo) sin cambiar ni una sola línea del código de la aplicación ni el modelo de permisos. Al igual que Mountpoint para Amazon S3, el controlador CSI de S3 admite operaciones de lectura secuencial y aleatoria en archivos existentes y operaciones de escritura secuencial para crear archivos nuevos. Para obtener más información sobre las operaciones del sistema de archivos compatibles, lea el comportamiento del sistema de archivos de Mountpoint para Amazon S3. Puede instalar, configurar y actualizar el controlador de CSI de Mountpoint para Amazon S3 con solo unos clics en la consola de EKS, la CLI de AWS, la API de EKS o AWS CloudFormation. A fin de obtener más información, visite la página de GitHub del controlador CSI de Mountpoint para Amazon S3.

El navegador de almacenamiento para Amazon S3 es un componente de código abierto que usted puede agregar a sus aplicaciones web para ofrecer a los usuarios finales, como clientes, socios y empleados, una interfaz sencilla para los datos almacenados en S3. Con el navegador de almacenamiento para S3, puede dar acceso a los usuarios finales autorizados a fin de que exploren, descarguen, carguen, copien y eliminen datos fácilmente en S3 directamente desde sus propias aplicaciones.

Debe usar el navegador de almacenamiento si quiere agregar una interfaz de usuario sencilla diseñada específicamente para explorar, descargar y cargar datos de S3 en sus aplicaciones sin tener que escribir su propio código para respaldar esta experiencia de usuario. El navegador de almacenamiento realiza llamadas a la API a S3 en su nombre y puede personalizar la interfaz para que coincida con el diseño y la marca de su aplicación actual.

Puede agregar el navegador de almacenamiento a su aplicación en solo tres pasos. En primer lugar, añada una referencia en su aplicación web para llamar al navegador de almacenamiento cuando se cargue una página específica. Para ello, importe el paquete NPM del navegador de almacenamiento y añada código a la aplicación tal como se define en la Guía del usuario de S3. En segundo lugar, configure la autorización configurando el navegador de almacenamiento para que funcione con IAM Identity Center, Amazon Cognito o su propio servicio de autorización personalizado. En tercer lugar, configure las reglas de uso compartido de recursos entre orígenes y las políticas de seguridad del contenido en los buckets que desea presentar a los usuarios en el navegador de almacenamiento, tal como se define en la Guía del usuario de S3. En este punto, los usuarios finales autenticados que visiten la página de la aplicación que eligió para inicializar el navegador de almacenamiento podrán trabajar con los datos de S3 a los que tengan acceso.

Para utilizar la autorización administrada por AWS, primero tiene que configurar un IAM Identity Center y configurar las concesiones de permisos para sus usuarios y grupos en S3 Access Grants, tal como se define en la Guía del usuario de S3 para configurar el navegador de almacenamiento. A continuación, conecta la aplicación a Identity Center y la configura para intercambiar un token de identidad de su proveedor de identidad externo por uno de Identity Center. Por último, configura la aplicación para que proporcione el token del centro de identidad al navegador de almacenamiento cuando un usuario abra la página de la aplicación para acceder a sus datos en S3. Como alternativa al Identity Center, puede usar Amazon Cognito para proporcionar credenciales de acceso al navegador de almacenamiento cuando un usuario final abra la página que elija para presentar una interfaz a sus datos de S3. Para usar Cognito, debe configurar un almacén de identidades en Cognito, asociarlo a un recurso de autenticación en Amplify, implementar el recurso en Amplify y, a continuación, conectar el código de la aplicación a su recurso de autenticación tal y como se define en la documentación de AWS Amplify. Luego, una vez que añada el navegador de almacenamiento a su aplicación, autorizará el acceso a los datos de los usuarios finales en su nombre según el método de autorización que haya elegido.

Para aplicar la autorización personalizada, configure su aplicación para proporcionar al navegador de almacenamiento tokens STS que autoricen al usuario a trabajar con los conjuntos de datos de S3 a los que tiene permiso para acceder. En la política de sesión de cada token STS, debe incluir los niveles de acceso del usuario final para cada conjunto de datos de S3 al que esté autorizado a acceder.

Puede registrar cualquier acceso a sus datos realizado a través del navegador de almacenamiento mediante los registros de AWS CloudTrail. Puede habilitar estos registros para los buckets que usa el navegador de almacenamiento con solo unos clics en la Consola de administración de AWS. Cuando usa S3 Access Grants, S3 registra las identidades de los usuarios finales que acceden a sus datos en los registros de CloudTrail.

Con el navegador de almacenamiento, los usuarios finales pueden buscar buckets y prefijos, ordenar por metadatos de objetos y buscar prefijos y objetos por nombre. Los usuarios finales también pueden cargar, descargar, copiar y eliminar objetos en S3. Consulte la hoja de ruta del navegador de almacenamiento para ver la lista de características que estamos evaluando.

No. El navegador de almacenamiento no admite el cambio de nombre de prefijos ni objetos.

Sí. Puede agregar un logotipo personalizado y personalizar los colores primarios, el relleno, la alineación, el idioma y otros aspectos de la interfaz del navegador de almacenamiento para que coincidan con el diseño y la marca de su aplicación. Visite la Guía del usuario de AWS Amplify para ver la lista completa de los elementos que puede personalizar.

Navegador de almacenamiento para Amazon S3