亚马逊AWS官方博客

Category: Artificial Intelligence

750B MoE 模型从自建 RoCE 集群迁移至 AWS EFA:Prefill-Decode 分离推理的通信架构验证

客户在自建机房使用基于 ConnectX 系列网卡的 RoCE 集群运行 GLM-5.1-FP8(750B MoE)模型推理服务,采用 Prefill-Decode (PD) 分离架构:2 台 Prefill 节点 + 2 台 Decode 节点,每台 8×H200 GPU。期望利用 AWS 弹性算力扩展本地 GPU 计算资源,同时获得更快的硬件迭代能力,从而降低硬件采购和折旧风险。AWS EFA 能否在这种极端复杂的通信负载下,达到 ConnectX 系列 + RoCE 方案的性能水平?我们基于客户的实际部署需求进行了完整的理论分析和实际验证

AWS 一周综述:AWS FinOps 代理预览版、Bedrock 上的 Gemma 4、Kiro Pro Max 等(2026 年 6 月 15 日)

本周,纽约市将举办 AWS Summit。届时,构建者、客户和 AWS 技术团队将齐聚贾维茨会展中心,进行一整天的新品发布、现场演示和技术会议。我为本次峰会发布的部分新功能撰写了博客,很高兴看到这些功能在本周上线。可惜我无法亲临现场。我将参加为期四天的音乐节,一边努力弄清楚如何搭帐篷,一边在手机上关注发布会。如果您也和我一样,无法到场,6 月 17 日将开放主题演讲直播,由代理式人工智能副总裁 Swami Sivasubramanian 博士、安全服务与可观测性副总裁 Chet Kapoor 主讲,覆盖开发工具、AI 基础设施、安全领域的新功能。

从 N 台 EC2 到 Amazon EKS + Amazon S3 Files:Waylens 的 OpenClaw 多智能体平台改造

本文以车载视频 AI 与车队智能化厂商 Waylens 的真实案例为例,介绍如何把分散在多台 Amazon EC2 实例上的 OpenClaw 多智能体(multi-agent)框架,迁移到由 Amazon Elastic Kubernetes Service(Amazon EKS)+ Custom Resource Definition(CRD)+ Operator 统一管理的形态。改造前,Waylens 工程师用于调试 agent 平台的时间已经超过实际使用 agent 完成业务的时间;改造后,升级、巡检、故障恢复都由 agent 自己完成:Operator 负责 EKS 层的滚动升级与 liveness 自愈,Admin agent 负责跨 agent 的升级编排和日常运维,Admin 自身出问题时由 Rex(Backup EKS Operator)接管,多 agent 平台的日常运维交给 agent 自行处理。附 aws-samples/sample-your-opc-eks-agents 一键部署仓库。

基于 Amazon Bedrock AgentCore 与 AWS DevOps Agent 打造对话式多账户运维助手

本文介绍一套基于 Amazon Bedrock AgentCore、Strands Agents SDK 和 Amazon CloudWatch 构建的多账户智能运维系统。系统实现了 Amazon RDS / Amazon ElastiCache / Amazon EC2 闲置资源自动检测、AI 智能巡检报告生成、跨账户 AWS DevOps Agent 根因调查,并通过飞书/钉钉 IM 机器人提供自然语言对话式运维体验。

当 Agentic AI 重塑生产关系 – 智能体浪潮下的企业战略与行动框架

Agentic AI 正驱动第四次工业革命的生产力跃迁,其自主规划、多智能体协作与持久记忆能力正系统性重构企业组织形态与决策机制。本文基于多行业实证与前沿研究,提出”生产力决定生产关系”的分析框架,论证企业级智能体驾驭平台对弥合技术能力与管理秩序间张力的关键作用,并为组织智能化转型提供行动路径。

试用 Amazon Bedrock 中的新控制台体验,该体验针对兼容 Anthropic 和 OpenAI 的 API 进行了优化

今天,我们宣布在 Amazon Bedrock 中推出新的控制台体验,您可以在 Amazon Bedrock 为实现高性能、可靠性和安全性而构建的下一代推理引擎上,使用最新的人工智能模型进行实验、迭代和扩展。该控制台刷新了工作流程,针对 bedrock-mantle 端点进行了优化,支持最新的 GPT、Claude 和开放权重模型,包括 OpenAI Responses API、OpenAI Chat Completions API 和 Anthropic Messages API。