Amazon Bedrock

Optimice el coste, la latencia y la precisión

Mejore la precisión y el rendimiento a la vez que controla los costes con herramientas para evaluar y optimizar la inteligencia artificial (IA)

Nunca comprometa el rendimiento

Amazon Bedrock permite alcanzar el equilibrio óptimo entre costos, latencia y precisión, de modo que las aplicaciones de IA generativa operen con eficiencia y sin gastos innecesarios. Con características como la destilación de modelos, el direccionamiento de peticiones inteligente, el almacenamiento en caché de peticiones y opciones de inferencia flexibles, incluidas bajo demanda, por lotes y con rendimiento aprovisionado, Amazon Bedrock brinda el control para optimizar en todos los casos de uso y escalar con confianza. Ya sea que procese cargas de trabajo en tiempo real o por lotes, Amazon Bedrock permite crear sistemas de IA más inteligentes, eficientes y rentables.

Mejore el rendimiento y Reduzca los costos.

Utilice el almacenamiento en caché de peticiones para reducir los costos hasta en un 90 % y la latencia hasta en un 85 % en los modelos compatibles

Muchos casos de uso de modelos fundacionales (FM) reutilizan ciertas partes de las peticiones (prefijos) en las llamadas a la API. Con el almacenamiento en caché de peticiones, los modelos compatibles permiten guardar estos prefijos de peticiones repetidos para reutilizarlos entre solicitudes. Esta caché permite que el modelo omita el recálculo de los prefijos coincidentes.

Mejore el rendimiento para múltiples casos de uso
Almacene en caché las partes relevantes de la petición para reducir los costos de tokens de entrada
Integre con otras características de Amazon Bedrock para acelerar tareas de varios pasos o peticiones de sistema más extensas, a fin de refinar el comportamiento de los agentes sin reducir la velocidad de las respuestas

Más información sobre el almacenamiento en caché de peticiones

Acelere la ingeniería de peticiones para aplicaciones de IA generativa

La Administración de peticiones de Amazon Bedrock facilita la creación, evaluación, control de versiones y ejecución de peticiones, y permite a los desarrolladores obtener las respuestas más precisas de los modelos fundacionales para sus casos de uso.

La Administración de peticiones permite probar distintos modelos fundacionales, configuraciones, herramientas e instrucciones
La optimización de peticiones en la Administración de peticiones reescribe automáticamente las peticiones para mejorar la precisión y ofrecer respuestas más concisas de los modelos fundacionales
Pruebe peticiones con los modelos fundacionales más recientes de forma inmediata y sin necesidad de implementación
Cree aplicaciones de IA generativa de forma rápida y colabore en la creación de peticiones en Amazon SageMaker Unified Studio

Ver la demostración

Maximice el rendimiento a un menor costo con el direccionamiento de peticiones inteligente

El direccionamiento inteligente de peticiones de Amazon Bedrock dirige las peticiones a distintos modelos fundacionales dentro de una misma familia de modelos, y ayuda a optimizar la calidad de las respuestas y los costos. El direccionamiento de peticiones inteligente puede reducir los costos hasta en un 30 % sin comprometer la precisión.

Amazon Bedrock dirige las solicitudes de forma dinámica al modelo que prevé con mayor probabilidad ofrecer la respuesta deseada al menor costo.
Reduzca el esfuerzo de desarrollo, evalúe distintos modelos y cree flujos de trabajo de orquestación complejos. Para ello, elija los enrutadores de peticiones predeterminados que ofrece Amazon Bedrock o configure los suyos propios.
Depure con facilidad mediante solicitudes totalmente rastreables

Más información sobre el direccionamiento de peticiones

Los modelos destilados en Amazon Bedrock son hasta un 500 % más rápidos y hasta un 75 % más económicos que los modelos originales, con una pérdida de precisión inferior al 2 % en casos de uso como RAG.

Utilice modelos más pequeños, rápidos y rentables que ofrezcan una precisión específica para el caso de uso, comparable a la de los modelos más avanzados en Amazon Bedrock.

Refine un “modelo de alumno” con un “modelo de profesor” que tenga la precisión deseada.

Maximice el rendimiento de los modelos destilados mediante la síntesis de datos patentados
Reduzca los costes al incorporar sus datos de producción. La destilación de modelos permite proporcionar peticiones y utilizarlas para generar respuestas sintéticas y refinar los modelos de alumno.
Aumente la precisión en la predicción de llamadas a funciones para los agentes. Permita que los modelos más pequeños predigan con precisión las llamadas a funciones, con el fin de ofrecer tiempos de respuesta considerablemente más rápidos y reducir los costos operativos

Más información sobre la destilación de modelos

Clientes

Blog

Yuewen Group

Yuewen Group aumentó la precisión de las tareas y agilizó el proceso de ingeniería de peticiones con Optimización de peticiones de Bedrock

Lea la publicación en el blog

Blog

Smartsheet

Smartsheet incrementa la productividad de los desarrolladores con Amazon Bedrock y Roo Code

Lea la publicación en el blog

Recursos

Blog

Optimización de costos para el uso de modelos fundacionales con Amazon Bedrock

Lea la publicación en el blog

Blog

Realice el seguimiento, la asignación y la administración de los costos y el uso de la IA generativa con Amazon Bedrock

Lea la publicación en el blog

¿Ha encontrado lo que buscaba hoy?

Ayúdenos a mejorar la calidad del contenido de nuestras páginas compartiendo sus comentarios

Optimice el coste, la latencia y la precisión

Nunca comprometa el rendimiento

Mejore el rendimiento y Reduzca los costos.

Utilice el almacenamiento en caché de peticiones para reducir los costos hasta en un 90 % y la latencia hasta en un 85 % en los modelos compatibles

Acelere la ingeniería de peticiones para aplicaciones de IA generativa

Maximice el rendimiento a un menor costo con el direccionamiento de peticiones inteligente

Los modelos destilados en Amazon Bedrock son hasta un 500 % más rápidos y hasta un 75 % más económicos que los modelos originales, con una pérdida de precisión inferior al 2 % en casos de uso como RAG.

Clientes

Yuewen Group

Smartsheet

Recursos

Optimización de costos para el uso de modelos fundacionales con Amazon Bedrock

Realice el seguimiento, la asignación y la administración de los costos y el uso de la IA generativa con Amazon Bedrock

¿Ha encontrado lo que buscaba hoy?

Aprender

Recursos

Desarrolladores

Ayuda