跳至主要内容
2025 年

Riot Games 通过迁移到 Amazon EKS 每年削减 1000 万美元的基础设施成本

了解视频游戏开发商 Riot Games 如何通过 Amazon EKS 迁移基础设施并实现其现代化、削减成本和简化全球部署

优势

超过 1.8 亿

无缝支持的月活跃用户

10

实现的基础设施费用节省(百万美元)

90%

基础设施设置速度提高了

12 倍

基础设施部署速度提高了

概述

Riot Games(Riot)是《英雄联盟》、《无畏契约》等全球热门游戏的幕后工作室,该公司致力于实现游戏基础设施的现代化和自动化,以恪守其提供世界级玩家体验的承诺。2016 年迁移至 Amazon Web Services(AWS)后,Riot 开始基于 Amazon Elastic Kubernetes Service(Amazon EKS)对解决方案进行现代化改造。Amazon EKS 是一项托管 Kubernetes 服务,可在 AWS 和本地数据中心运行 Kubernetes。

通过采用 Amazon EKS,Riot 简化了基础设施,降低了新区域的基础设施成本并缩短了部署时间。同时,该公司还构建了一个托管开发者环境,让团队能够专注于打造引人入胜的玩家体验,而非管理复杂的基础设施。“最令人兴奋的是,基础设施现在变得‘不再棘手’,”Riot 高级首席工程师 David Press 表示,“我们现在只需 1-2 个月,而不是以前的几年,就能为新游戏启动基础设施,从而更好地为玩家带来新体验。”

Missing alt text value

Riot Games 简介

Riot Games 总部位于美国加利福尼亚州洛杉矶,是《英雄联盟》、《无畏契约》等热门在线多人游戏背后的视频游戏开发商和发行商。该公司成立于 2006 年,始终专注于打造玩家至上的游戏体验。

机会 | 借助 Amazon EKS 降低 Riot 开发人员基础设施的复杂性

作为一家以玩家为中心的游戏工作室,Riot 拥有超过 1.8 亿月活跃用户,致力于打造大型、长效的直播服务类游戏,并为全球玩家提供卓越体验。Riot 在北美、欧洲、韩国、日本、中国和东南亚拥有庞大的玩家群。为满足低延迟游戏体验的需求,Riot 最初选择租用数据中心空间。

随着业务规模扩大,Riot 采用 Mesosphere DC/OS(Mesos)来编排容器化工作负载。但在宣布计划停用 Mesos 后,该公司需要为其游戏服务器平台评估新的解决方案。该工作室需要具备全球覆盖(以实现低延迟)、高可用性、高效资源管理和自动扩缩等关键特性。随着 Riot 玩家群体和游戏产品组合的扩大,这些特性变得越来越重要。

2021 年,Riot 开始迁移到 Amazon EKS。“迁移到 Amazon EKS 为我们解锁了自动扩缩功能,带来了巨大的成本节省,”Press 说。借助 Amazon EKS,Riot 构建了一个集中管理的开发者环境,为游戏开发人员抽象了基础设施层,提升了全公司的环境一致性。

解决方案 | 每年削减 1000 万美元基础设施成本

通过迁移至 Amazon EKS 并使用 Karpenter(Kubernetes 集群的开源节点生命周期管理器),Riot 实现了高效的资源分配与管理,同时获得了自动扩缩能力,每年节省 1000 万美元的成本。该工作室不再需要在技术堆栈中管理许可成本或专属主机逻辑。为持续提供新功能并满足玩家需求,Riot 通过更精细的应用程序模块化和容器化对平台进行现代化改造,提高了为每位玩家部署定制化服务的效率。“我们能够按需分配资源,”Riot 高级系统工程师 Lance Laursen 表示,“我们无需订购硬件即可在 AWS 上创建新集群,我们只需做出尝试,然后快速迭代。”

Riot 的托管开发者环境可帮助开发者按照治理政策快速获取计算、联网和存储资源,而无需直接使用 AWS 管理控制台。该公司已将 80% 的基础设施标准化到这个集中管理的环境中,将开发人员在基础设施任务上的工作负载减少了 40%。开发人员现在可以在 30 分钟内加入环境并部署工作负载,将更多精力投入在游戏开发上。

“这种抽象帮助我们实现了快速迁移,”Riot 云与基础设施技术负责人 Zach Koncir 表示,“我们有一个标准、一致的接口,开发人员只需将容器组(pod)部署目标从数据中心切换到 Amazon EKS 云环境即可。迁移过程几乎无需额外操作。”

随着在 AWS 上推出更多新游戏并对早期游戏进行现代化改造,Riot 还从多租户集群模式转型为单租户集群模式,为每款游戏或每个使用案例创建独立集群。这种隔离机制将问题响应时间缩短了 50%,并改善了容量管理。“这种方式增强了隔离性,简化了容量和成本分配的管理,”Press 表示。

Riot 利用 Terraform、Karpenter 和其他开源技术,实现了 246 个集群大部分管理和治理工作的自动化。自动化还提高了 Riot 的运营效率,将基础设施部署时间减少了 90%。借助 Kubernetes,Riot 在全球范围内(包括其在中国的游戏托管服务提供商处)都能使用相同的基础设施。

最重要的是,通过使用 AWS Local Zones(在更靠近终端用户和工作负载的位置运行 AWS 基础设施的服务),Riot 有效降低了延迟,玩家感受到的卡顿和抖动更少。该公司还使用 AWS Outposts(将 AWS 基础设施和服务部署到几乎任何本地或边缘站点的完全托管式解决方案系列)将工作负载部署在更靠近玩家的位置,从而满足《无畏契约》等游戏服务等级协议中 35 毫秒的严格延迟要求。

此外,Riot 还拓展到了南非、东南亚和南美等此前需要大量硬件投资的未充分服务市场。“有了 AWS 上的自动化和开发者环境,我们能轻松在新地区部署服务以覆盖玩家,”Press 表示。

成果 | 利用可扩展的 AWS 基础设施加速游戏创新

Riot 已通过 Amazon EKS 完成基础设施的迁移、现代化改造、自动化和标准化,现在正寻求扩展其开发者环境以支持更多功能和使用案例。Riot 还借助 AWS 基础设施的灵活性,更快推出新游戏。例如,Riot 为《英雄联盟》推出了一个名为 Swarm 的限时游戏模式,为玩家带来惊喜。“在这个新时代,我们能在许多地方立即启动 AWS 上的基础设施,我们现在可以思考以前不可能做到的事情,”Press 表示。

Missing alt text value
Migrating to Amazon EKS has unlocked automatic scaling for us, which has been a big cost savings.

David Press

Senior Principal Engineer, Riot Games