亚马逊AWS官方博客
Category: Containers
Mountpoint S3 与 S3 Files 在 EKS 上的实战对比
本文对比了在 EKS 上通过 Mountpoint S3 CSI 和 S3 Files + EFS CSI 两种方案访问 S3 数据的差异。Mountpoint S3 是基于 FUSE 的轻量客户端,设计目标是高吞吐而非完整 POSIX 语义;S3 Files 是 2026 年 4 月 GA 的新服务,通过 NFSv4.1+ 协议和全托管智能缓存层,首次让 S3 原生支持完整文件系统语义。
两种方案并非互斥,工作负载特征互补,在同一 EKS 集群中混合部署、按场景选型,是当前 AWS 上 S3 数据接入的最佳实践。
规划 Amazon EKS 从 1.32 升级到 1.35:关键变更识别与逐版本实施路径
Amazon EKS 不支持跨多个版本直接升级,且有时 Kubernetes 版本之间都伴随一系列废弃 API、运行时变更和节点 OS 调整。本文以一个真实集群从 EKS 1.32 升级到 1.35 为例,介绍如何对集群中的自管理组件和托管组件做风险分级评估、识别 cgroup v1、containerd、Ingress NGINX 等关键变更带来的影响,并给出一套可复制的逐版本升级路径,帮助企业以最小风险完成跨多个 Kubernetes 大版本的升级。
基于 Amazon ECS Fargate 和 Graviton 构建企业级多租户 AI Agent 平台:OpenClaw + Hermes 双 Agent 实践
AI Agent 从实验走向生产,企业需要让不同团队各跑独立实例且互不可见。本文介绍基于 Amazon ECS Fargate + Graviton 的轻量级多租户方案,同时部署 OpenClaw(开箱即用 Web Agent)与 Hermes(自进化 AI 助手),四层隔离机制保障企业级安全,并演示 Hermes 通过自然语言驱动 Spark on EKS 数据分析。
在 Amazon EKS 上使用 NVIDIA GPU Operator 管理自定义 GPU 驱动与 CUDA 工作负载
在 EKS 上结合 GPU Operator 与 Kiro+EKS MCP,管理自定义 GPU 驱动和 CUDA 工作负载。
从IDC到云上GPU:基于 Amazon EKS 的大模型推理混合云弹性部署实践
基于 Amazon EKS 与 NVIDIA NIM 构建混合云大模型推理架构,实现本地 GPU 优先、云上 Spot 实例弹性兜底,结合 KEDA 和 Karpenter 达成 0→N 自动扩缩容与成本最优。
增强Amazon EKS 节点自愈方案:基于 NPD 的故障持久化与安全修复探索
本文介绍了 npd-node-replace 组件的整体架构与实现原理,重点阐述了如何基于该组件对节点问题事件进行采集与分析,并对异常节点状态进行自动化处理。通过对节点异常场景的自动修复机制进行方案设计与实践探索,提升集群的可用性与整体稳定性。
基于 Amazon EKS 和 Graviton 构建多租户 AI Agent 平台:OpenClaw on Kubernetes 实践
随着生成式 AI 的快速普及,越来越多的企业需要为内部团队或外部客户提供 AI Agent 服务。如何在保障安全隔离的前提下,实现高效、低成本的多租户 AI Agent 部署,成为一项关键的技术挑战。本文介绍如何基于 Amazon EKS、AWS Graviton 和 Kubernetes Operator 模式,构建一个支持多租户、多模型的 OpenClaw AI Agent 平台,并通过 CloudFront + Cognito + ALB 的前端架构实现用户自助 Provisioning。
在Amazon EKS上部署OpenClaw AI Agent:基于Kata Containers的企业级沙箱实践
在Amazon EKS上部署OpenClaw AI Agent:基于Kata Containers的企业级沙箱实践
告别 Ingress-NGINX:用 Amazon Load Balancer Controller Gateway API 实现更强大的流量管理
Kubernetes 官方宣布 Ingress-NGINX 将于 2026 年 3 月退役,这标志着 Kubernetes 网络管理进入新阶段。本文深入探讨从 Ingress-NGINX 迁移到 Amazon Load Balancer Controller Gateway API 的完整方案,涵盖两者的架构差异、功能对比、五大典型场景的配置示例(基础转发、URL 重写、金丝雀发布、HTTPS 证书管理、基于 Host 的路由),以及基于 ingress2gateway 工具的七步迁移路径。通过 DNS 加权路由实现零停机迁移,帮助 EKS 用户平滑过渡到下一代网络标准。
使用 Karpenter 和 HAMi 实现 GPU 分片和动态扩缩容
本文将介绍如何结合Karpenter 和HAMi(Heterogeneous AI Computing Virtualization Middleware)来实现 GPU 资源的细粒度分片和自动扩缩容