Saltar al contenido principal

Catálogo de Amazon SageMaker

Descubra, gobierne y colabore en datos e inteligencia artificial de forma segura

Información general

La próxima generación de Amazon SageMaker ofrece una forma más sencilla de descubrir, gobernar y colaborar en datos e inteligencia artificial, y abarca tanto datos estructurados como no estructurados, modelos de IA, paneles de inteligencia empresarial y aplicaciones. Con el Catálogo de Amazon SageMaker, puede descubrir y acceder de forma segura a datos y modelos aprobados mediante búsqueda semántica con metadatos generados por IA generativa, o simplemente consultar a Amazon Q Developer en lenguaje natural para encontrar datos. Los usuarios pueden definir y aplicar políticas de acceso de manera coherente a través de un modelo unificado de permisos, con controles de acceso detallados administrados de forma centralizada en Amazon SageMaker Unified Studio. Comparta y colabore fácilmente en datos y activos de IA a través de flujos de trabajo simples de publicación y suscripción. Fortalezca la confianza en toda la organización con soluciones que permiten supervisar la calidad de los datos y clasificarlos, así como seguir el rastro tanto de los datos como de los modelos de machine learning (ML).

Consulte el catálogo de Amazon SageMaker en acción

Missing alt text value

Beneficios

Descubra los datos y activos de IA a escala con el Catálogo de SageMaker, creado en Amazon Datazone. Mejore el descubrimiento de datos con IA generativa que enriquece automáticamente los datos y metadatos con contexto empresarial, lo que facilita a todos los usuarios la búsqueda, comprensión y uso de los datos. Comparta los datos, modelos de IA, peticiones y activos de IA generativa con filtros por nombres de tablas, columnas o términos de glosarios empresariales. Recomiende automáticamente las columnas valiosas y las aplicaciones de análisis relevantes para cada conjunto de datos, lo que permite utilizar los datos adecuados para crear rápidamente los modelos correctos. Admita modelos de gobernanza centralizados y descentralizados mediante el intercambio fluido de datos e inteligencia artificial a través de flujos de trabajo de publicación y suscripción, todo dentro de una experiencia unificada mediante Proyectos.
Inspire confianza con visibilidad en tiempo real sobre la calidad de los datos, así como sobre el linaje de datos y modelos de machine learning en SageMaker. Automatice la generación de perfiles de datos y las recomendaciones sobre su calidad, supervise las reglas de calidad y reciba alertas. Resuelva problemas de calidad de datos difíciles de detectar mediante enfoques basados en reglas y machine learning para conciliar entidades, y así garantizar datos de alta calidad que respalden decisiones empresariales con confianza. Fomente la transparencia en las canalizaciones de datos y los proyectos de IA mediante la supervisión integrada de modelos, lo que permite detectar sesgos y comprender cómo cada característica influye en las predicciones del modelo.
Centralice la seguridad de los datos y la IA en SageMaker mediante controles de acceso detallados, clasificación de datos y barreras de protección, a fin de garantizar el uso adecuado de los datos, los análisis y los modelos de IA. Defina los permisos una sola vez y aplíquelos en los datos y modelos. Con Amazon Bedrock integrado de forma nativa, los clientes pueden aplicar las barreras de protección de Amazon Bedrock en aplicaciones de IA generativa para bloquear contenido perjudicial, filtrar alucinaciones y habilitar protecciones personalizables en materia de privacidad, seguridad y precisión. Identifique automáticamente información confidencial dentro de las canalizaciones mediante Amazon Comprehend.
Cumpla con los requisitos normativos y de auditoría mediante el control del uso de datos y el registro y la supervisión de modelos. Fomente el uso adecuado de los activos de análisis e IA en la organización mediante un aislamiento basado en proyectos. Comprenda cómo se utilizan los datos y los modelos en el lake house para fortalecer la seguridad. Utilice Amazon SageMaker Clarify para supervisar el sesgo, la precisión y la solidez de los modelos, y asegurarse de que cumplan con los estándares de IA responsable. Alinee los costos con las iniciativas empresariales y tenga una visión clara de las inversiones empresariales.

Características

Datos seleccionados para crear contexto y facilitar la búsqueda

El catálogo de SageMaker incorpora el contexto empresarial a los metadatos técnicos y permite enriquecerlos con ese mismo contexto. Puede hacer que los datos sean visibles dentro de un contexto empresarial, lo que permite a todos los usuarios encontrarlos, comprenderlos y confiar en ellos de forma rápida y sencilla.

Recomendaciones de metadatos automatizadas

Automatice la incorporación de nombres y descripciones empresariales a los datos, lo que facilita la comprensión del contexto y evita tener que enfrentarse a nombres técnicos crípticos. Esta automatización se basa en modelos de lenguaje de gran tamaño (LLM) para mejorar la precisión y la coherencia.

Ofrezca un nivel uniforme de seguridad en materia de IA en todas las aplicaciones.

Las barreras de protección de Amazon Bedrock ayudan a evaluar las entradas de los usuarios y las respuestas de los modelos fundacionales (FM) según políticas específicas para cada caso de uso, y ofrecen una capa adicional de protección independientemente de los FM subyacentes.

Audite y realice un seguimiento rápido de los modelos

Audite rápidamente y diagnostique problemas de rendimiento en todos los modelos, puntos de conexión y trabajos de supervisión de modelos a través de una vista unificada. Supervise las desviaciones respecto del comportamiento esperado del modelo, así como los trabajos de supervisión inactivos o ausentes, mediante alertas automatizadas.

Calidad de los datos

Gracias a las estadísticas de calidad de los datos, los consumidores pueden consultar métricas de calidad provenientes de sistemas de AWS o de terceros. Los consumidores de datos pueden confiar en los orígenes que utilizan para tomar decisiones y contar con contexto sobre la calidad de los datos mientras buscan activos. Los productores de datos y los equipos de TI también pueden usar las API para incorporar estadísticas de calidad de los datos provenientes de sistemas de terceros en un portal unificado fuera de la consola.

Linaje de datos y ML

Comprenda el movimiento de los datos y los modelos a lo largo del tiempo. El linaje puede aumentar tanto la confianza como el nivel de comprensión de los datos y la inteligencia artificial en una organización, ya que ayuda a los consumidores de datos a entender su origen, los cambios que ha sufrido y cómo se ha utilizado. Puede reducir el tiempo dedicado a mapear datos y activos de IA y sus relaciones, resolver problemas, desarrollar canalizaciones y consolidar las prácticas de gobernanza de datos e IA.

Clientes

Cisco

“Quiere descubrir, compartir y gobernar sus datos. Ya los llame malla de datos o tejido de datos, lo cierto es que los datos se encuentran distribuidos entre distintos equipos y silos, y necesita una forma de unificarlos. El catálogo de Amazon SageMaker conecta a los productores y consumidores de datos, lo que permite a los productores compartir datos con controles y contratos de datos integrados, y a los consumidores acceder a esos datos con las herramientas de su elección”

Shaja Arul Selvamani, director sénior de IA y ML de Cisco

The Cisco logo featuring the company's name in blue with a stylized bridge design above it.

Natera, Inc.

“Nuestra organización ha sabido aprovechar Amazon DataZone, Amazon SageMaker AI, Amazon Athena y Amazon Redshift para administrar y analizar nuestros datos clínicos y genómicos. Nos complace contar ahora con la gobernanza unificada del catálogo de Amazon SageMaker, que agilizará el descubrimiento y el acceso a los datos, y permitirá a nuestro equipo analizar rápidamente los datos relevantes en todo nuestro dominio. Esta integración nos ayudará a crear conjuntos de datos personalizados, lo que podría reducir el tiempo necesario para obtener información y, en última instancia, mejorar los resultados de los pacientes a medida que avanzamos en nuestro objetivo de hacer de las pruebas genéticas personalizadas una parte estándar de la atención”.

Mirko Buholzer, vicepresidente de ingeniería de software en Natera, Inc.

Missing alt text value

NatWest

“Nuestro equipo de ingeniería de plataformas de datos ha implementado varias herramientas para usuarios finales destinadas a tareas de ingeniería de datos, machine learning, SQL e IA generativa. A medida que buscamos simplificar los procesos en el banco, nos hemos enfocado en optimizar la autenticación de los usuarios y la autorización de acceso a los datos. Amazon SageMaker ofrece una experiencia de usuario lista para usar que nos ayuda a implementar un entorno unificado en la organización, lo que reduce en aproximadamente un 50 % el tiempo que nuestros usuarios de datos necesitan para acceder a nuevas herramientas”.

Zachery Anderson, director de datos y análisis de NatWest Group

Missing alt text value