Saltar al contenido principal

Optimice los costos, la latencia y la precisión

Mejora la precisión y el rendimiento, a la vez que controla los costos, con herramientas para evaluar y optimizar la IA en cada etapa

Nunca comprometa el rendimiento

Amazon Bedrock permite alcanzar el equilibrio óptimo entre costos, latencia y precisión, de modo que las aplicaciones de IA generativa operen con eficiencia y sin gastos innecesarios. Con características como la destilación de modelos, el direccionamiento de peticiones inteligente, el almacenamiento en caché de peticiones y opciones de inferencia flexibles, incluidas bajo demanda, por lotes y con rendimiento aprovisionado, Amazon Bedrock brinda el control para optimizar en todos los casos de uso y escalar con confianza. Ya sea que procese cargas de trabajo en tiempo real o por lotes, Amazon Bedrock permite crear sistemas de IA más inteligentes, eficientes y rentables.

Missing alt text value

Mejore el rendimiento. Reduzca los costos.

Utilice el almacenamiento en caché de peticiones para reducir los costos hasta en un 90 % y la latencia hasta en un 85 % en los modelos compatibles

Muchos casos de uso de modelos fundacionales (FM) reutilizan ciertas partes de las peticiones (prefijos) en las llamadas a la API. Con el almacenamiento en caché de peticiones, los modelos compatibles permiten guardar estos prefijos de peticiones repetidos para reutilizarlos entre solicitudes. Esta caché permite que el modelo omita el recálculo de los prefijos coincidentes.

  • Mejore el rendimiento para múltiples casos de uso
  • Almacene en caché las partes relevantes de la petición para reducir los costos de tokens de entrada
  • Integre con otras características de Amazon Bedrock para acelerar tareas de varios pasos o peticiones de sistema más extensas, a fin de refinar el comportamiento de los agentes sin reducir la velocidad de las respuestas
Missing alt text value

Acelere la ingeniería de peticiones para aplicaciones de IA generativa

La Administración de peticiones de Amazon Bedrock facilita la creación, evaluación, control de versiones y ejecución de peticiones, y permite a los desarrolladores obtener las respuestas más precisas de los modelos fundacionales para sus casos de uso.

  • La Administración de peticiones permite probar distintos modelos fundacionales, configuraciones, herramientas e instrucciones
  • La optimización de peticiones en la Administración de peticiones reescribe automáticamente las peticiones para mejorar la precisión y ofrecer respuestas más concisas de los modelos fundacionales
  • Pruebe peticiones con los modelos fundacionales más recientes de forma inmediata y sin necesidad de implementación
  • Cree aplicaciones de IA generativa de forma rápida y colabore en la creación de peticiones en Amazon SageMaker Unified Studio
Missing alt text value

Maximice el rendimiento a un menor costo con el direccionamiento de peticiones inteligente

El direccionamiento inteligente de peticiones de Amazon Bedrock dirige las peticiones a distintos modelos fundacionales dentro de una misma familia de modelos, y ayuda a optimizar la calidad de las respuestas y los costos. El direccionamiento de peticiones inteligente puede reducir los costos hasta en un 30 % sin comprometer la precisión.

  • Amazon Bedrock dirige las solicitudes de forma dinámica al modelo que prevé con mayor probabilidad ofrecer la respuesta deseada al menor costo.
  • Reduzca el esfuerzo de desarrollo, evalúe distintos modelos y cree flujos de trabajo de orquestación complejos. Para ello, elija los enrutadores de peticiones predeterminados que ofrece Amazon Bedrock o configure los suyos propios.
  • Depure con facilidad mediante solicitudes totalmente rastreables
Missing alt text value

Los modelos destilados en Amazon Bedrock son hasta un 500 % más rápidos y hasta un 75 % más económicos que los modelos originales, con una pérdida de precisión inferior al 2 % en casos de uso como RAG.

Utilice modelos más pequeños, rápidos y rentables que ofrezcan una precisión específica para el caso de uso, comparable a la de los modelos más avanzados en Amazon Bedrock.

Refine un “modelo de alumno” con un “modelo de profesor” que tenga la precisión deseada.

  • Maximice el rendimiento de los modelos destilados mediante la síntesis de datos patentados
  • Reduzca los costos al incorporar datos de producción. La destilación de modelos permite proporcionar peticiones y utilizarlas para generar respuestas sintéticas y refinar los modelos de alumno.
  • Aumente la precisión en la predicción de llamadas a funciones para los agentes. Permita que los modelos más pequeños predigan con precisión las llamadas a funciones, con el fin de ofrecer tiempos de respuesta considerablemente más rápidos y reducir los costos operativos
Missing alt text value