La próxima generación de Amazon SageMaker se basa en una arquitectura de lake house abierto que unifica todos los datos en los lagos de datos de Amazon Simple Storage Service (Amazon S3), incluidas Tablas de S3, y los almacenes de datos de Amazon Redshift, lo que ayuda a crear potentes aplicaciones de análisis e IA/ML en una sola copia de los datos. Solo pagará por los recursos que use en el lake house. El almacenamiento de metadatos y las solicitudes de API siguen los precios del Catálogo de datos de AWS Glue, incluido el nivel gratuito de AWS. Los costos de almacenamiento y computación de los datos dependen de la elección de Amazon S3 o Amazon Redshift Managed Storage (RMS). Los precios de los recursos subyacentes se describen a continuación.

Metadatos: las definiciones de datos se organizan en una jerarquía lógica de catálogos, bases de datos y tablas mediante el Catálogo de datos de AWS Glue.

  • Catálogo: contenedor lógico que incluye objetos de un almacén de datos, como esquemas, tablas, vistas o vistas materializadas de Amazon Redshift. Puede anidar catálogos en un catálogo para que coincidan con los niveles de jerarquías del origen de datos que está trayendo al lake house.
  • Base de datos: las bases de datos se pueden utilizar para organizar los objetos de datos, como tablas y vistas, en el lake house.
  • Tablas y vistas: las tablas y las vistas son objetos de datos en una base de datos que describen cómo acceder a los datos subyacentes, como el esquema, las particiones, la ubicación de almacenamiento, el formato de almacenamiento y la consulta SQL para acceder a los datos.

Se puede acceder a los metadatos del lake house desde las API de AWS Glue. El almacenamiento de metadatos y las solicitudes de API siguen los precios del Catálogo de datos de AWS Glue, incluido el nivel gratuito de AWS. Para obtener más información, visite Precios de AWS Glue.

Almacenamiento de datos y acceso: al acceder a los datos del lake house, puede leer y escribir datos en Amazon S3 o RMS. Según el tipo de almacenamiento que elija para almacenar los datos en el lake house, incurrirá en costos adicionales de almacenamiento y computación para acceder al almacenamiento subyacente. Visite Precios de AWS Glue para obtener más información sobre los precios de almacenamiento y computación para los tipos de almacenamiento.

Mantenimiento de estadísticas y tablas de Apache Iceberg: puede automatizar la recopilación de estadísticas en tablas de lagos de datos en Amazon S3 para una ejecución más rápida de las consultas y el mantenimiento de las tablas de Apache Iceberg, como la compactación, para optimizar el diseño de almacenamiento de las tablas de Apache Iceberg. Incurrirá en cargos adicionales cuando habilite estas características. Para obtener más información, visite Precios de AWS Glue.

Permisos: los permisos detallados se basan en AWS Lake Formation y se proporcionan sin costo adicional. Para obtener más información, visita Precios de Lake Formation.

Costos de integración sin ETL

SageMaker tiene integraciones sin ETL con las aplicaciones, lo que elimina la necesidad de crear y administrar canalizaciones de extracción, transformación y carga (ETL). Las aplicaciones compatibles incluyen Salesforce, ServiceNow, Zendesk y más.

Estas integraciones le proporcionan flexibilidad, por lo que puede elegir tablas de datos específicas en una aplicación para replicarlas automáticamente en Amazon Redshift. Esta flexibilidad le permite ejecutar análisis unificados en varias aplicaciones y orígenes de datos. AWS no cobra ninguna tarifa adicional por la integración sin ETL. Debe pagar por los recursos existentes que se utilizan para crear y procesar los datos de cambios creados como parte de una integración sin ETL. Esto incluye el almacenamiento adicional de Amazon Redshift para almacenar datos replicados, recursos informáticos para procesar la replicación de datos (o las RPU en Amazon Redshift sin servidor) y los costos de transferencia de datos entre zonas de disponibilidad para trasladar los datos del origen al destino. El procesamiento continuo de los cambios de datos mediante la integración sin ETL se ofrece sin costo adicional. Para obtener más información, consulte los precios de Amazon Aurora, los precios de la base de datos relacional de Amazon (Amazon RDS) para MySQL, los precios de Amazon DynamoDB, y los precios de AWS Glue.