亚马逊AWS官方博客
Category: Artificial Intelligence
基于 Amazon SageMaker 有状态路由优化大规模推理集群下的 KV Cache 复用方案
本文基于 Amazon SageMaker 的 Stateful Session(有状态会话路由)机制,通过唯一会话 ID 确保同一会话的所有请求路由到同一实例,从而在分布式环境下实现有效的 KV 缓存复用。
Amazon Q Developer 结合 MCP 实现智能化云成本分析
本文详细介绍了如何利用 Amazon Q Developer 结合 Model Context Protocol (MCP) 技术,实现 Amazon 成本和使用报告(CUR)的智能化分析。
RAG-MCP 性能剖析:在 Amazon Bedrock 中多维度测试提示词优化的效果
RAG-MCP 框架在 Amazon Bedrock 环境中的性能表现。通过多维度测试,对 RAG 在 Tool 调用时产生的价值做了评估。
Amazon Nova Canvas 更新:推出虚拟“试穿”和样式选项
您是否想过在购买之前能快速想象出一套新衣服在您身上的样子? 或者是一件家具在您家客厅里的样子? 今天,我们很高 […]
在 Amazon Bedrock 中结合 RAG 与 MCP 高效缓解提示词膨胀问题
本文详细介绍了在 Amazon Bedrock 中结合 RAG 与 MCP 来解决大语言模型工具选择中的提示词膨胀问题。文章阐述了 RAG-MCP 的架构设计、实现步骤和优化策略,包括工具数据获取、向量化存储和语义检索等核心环节。
Amazon Q Developer CLI + 飞书——打造对话式的 AI Agent 智能运维平台
主要介绍如何通过Amazon Q CLI + Bedrock + MCP + 飞书打造对话式的智能运维平台
AWS 一周综述:Project Rainier、Amazon CloudWatch 调查、AWS MCP 服务器等(2025 年 6 月 30 日)
每次到访西雅图时,在机场首先映入眼帘的总是 Mount Rainier 山峰。您知道吗?AWS 最具创新性的项 […]
利用 Amazon SageMaker Sticky Session 实现大语言模型推理加速
本文探讨了 Amazon SageMaker Sticky Session 技术如何解决大语言模型推理中的性能挑战。通过会话绑定机制,确保同一用户的请求路由至相同计算实例,实现 KV Cache 复用和上下文保持,这一技术显著降低多轮对话延迟,提升用户体验,特别适合交互式 AI 应用场景。
快时尚电商行业智能体设计思路与应用实践(三)借助 Transcribe/Polly 打造新一代智能语音客服,实现媲美人工客服的对话体验
在快时尚电商行业智能化生态系统的演进历程中,随着文本驱动智能体在逻辑推理和任务执行层面的日趋成熟,进一步提升交互体验的关键突破口正转向更加拟人化的语音到语音(S2S)解决方案。这一技术演进的核心目标是根本性改变传统语音交互中机械化应答所带给客户的负面感受,为用户打造更自然、更富有情感共鸣的智能对话体验。
基于 AWS 构建企业 AI 助手:云南神农集团案例分析
在核心系统迁移到 AWS 后,在 AWS SA 的指导下,企业构建了综合性企业 AI 助手系统。通过使用整合大语言模型、企业知识库及业务系统数据 MCP Server,实现了对业务场景的深度理解与实际问题解决能力。