亚马逊云科技-拳头游戏优化弹性扩缩容策略节省1000万美元
关键字: [亚马逊云科技, 游戏部署平台, 弹性扩缩容策略, 云优化成本, 游戏流量分发算法, 云环境优化]
导读
拳头游戏与亚马逊云科技合作,将英雄联盟等游戏迁移到云端。在游戏部署平台(GDP)上,拳头优化了弹性扩缩容策略,采用Round Robin算法分配游戏流量,将CPU利用率控制在合理范围,避免剧烈波动影响游戏体验。这一优化措施节省了1000万美元成本,简化了游戏管理,提高了云端资源利用效率。拳头的实践表明,要充分发挥云端优势,需要对业务进行改造优化,而非简单迁移。
演讲精华
以下是小编为您整理的本次演讲的精华。
拳头游戏是一家知名的游戏开发商,推出了包括英雄联盟、英雄联盟手游、无畏契约、云顶之弈等多款爆款游戏。早期,拳头游戏的全球架构基于传统数据中心,到2017年,他们在全球运营着12个数据中心的战斗服务器和6个数据中心的平台服务器。
2019年,拳头游戏与亚马逊云科技(亚马逊云科技)开始合作,将部分游戏服务和平台服务迁移到亚马逊云科技云上。合作初期,双方讨论了游戏服务器的迁移和部署方案。随后,合作关系越来越紧密,到2022年,亚马逊云科技帮助拳头游戏在全球范围内直播了包括英雄联盟、英雄联盟手游和无畏契约在内的三大电竞赛事,直播峰值达到了7500万在线观看人数。在这次直播中,亚马逊云科技为拳头游戏提供了一套基于Amazon SageMaker的强化学习方法,可以根据玩家英雄的走位、击杀情况和得分情况,预测不同战队的胜率。
拳头游戏最初在亚马逊云科技上的目标是利用云服务快速部署,并降低资本支出。但很快,他们意识到要真正发挥云计算的优势,必须优化弹性扩缩容策略。在传统数据中心,服务器数量是固定的;而在云上,弹性扩缩容可以根据负载动态调整资源,从而提高资源利用率,降低成本。
拳头游戏面临的一大挑战是不同游戏的CPU利用率波动剧烈不同。以英雄联盟和云顶之弈为例,英雄联盟在游戏后期CPU利用率会陡增,而云顶之弈在游戏中后期CPU利用率会逐渐降低。如果采用亚马逊云科技默认的EC2 Auto Scaling策略,很可能导致资源利用率低或玩家体验差。根据数据,英雄联盟一局游戏通常在25分钟左右结束,而云顶之弈一局游戏基本在35分钟到40分钟之间。
为解决这一挑战,拳头游戏搜集了24小时真实游戏数据,评估了多种调度算法对CPU利用率的影响,包括轮循调度、随机调度等。经过评估,他们发现基于游戏连接数的轮循调度算法(Round Robin)可以将CPU利用率控制在较高水平,同时避免剧烈波动,给玩家带来良好体验,因此最终选择了这种算法。
采用新的调度算法后,拳头游戏不仅提高了资源利用率,还简化了游戏管理和容量规划,为团队腾出更多精力专注游戏开发。最重要的是,新策略使拳头游戏节省了1000万美元的运营成本,创造了拳头游戏历史上最大的一笔成本优化。
这个案例说明,单纯将业务从内部数据中心迁移到云上,很难实现成本优化。要充分发挥云计算的弹性优势,必须对业务流程进行改造,将负载优化到极致。拳头游戏通过优化弹性扩缩容策略,最大限度利用了云资源,实现了降本增效。
在迁移到亚马逊云科技云上的过程中,拳头游戏面临了三大挑战:首先是将游戏迁移到亚马逊云科技的多个区域、本地区域和Outposts;其次是将Windows系统迁移到Linux系统;第三个也是最大的挑战是优化自动扩缩容技术。
拳头游戏意识到,在云环境下,弹性扩缩容是实现资源优化和降低成本的关键。与传统数据中心固定的服务器数量不同,云上可以根据负载动态调整资源数量。然而,拳头游戏发现采用亚马逊云科技默认的EC2 Auto Scaling策略并不能完全满足游戏服务的需求。
不同类型的游戏对CPU利用率的需求差异很大。以英雄联盟和云顶之弈为例,英雄联盟在游戏后期CPU利用率会陡增,因为玩家可以不断释放技能;而云顶之弈在游戏中后期CPU利用率会逐渐降低,因为玩家数量逐渐减少。如果采用传统的EC2 Auto Scaling策略,很可能导致资源利用率低或玩家体验差。根据数据,在英雄联盟游戏中,CPU利用率在游戏后期会陡然升高;而在云顶之弈中,CPU利用率会在游戏进行到3/4时达到峰值,之后逐渐降低。
为了解决这一问题,拳头游戏搜集了24小时真实游戏数据,评估了多种调度算法对CPU利用率的影响,包括基于游戏连接数的轮循调度、基于CPU利用率的轮循调度、随机调度等。经过评估,他们发现基于游戏连接数的轮循调度算法(Round Robin)可以将CPU利用率控制在较高水平,同时避免剧烈波动,给玩家带来良好体验,因此最终选择了这种算法。
采用新的调度算法后,拳头游戏的资源利用率得到了提高,游戏管理和容量规划工作也得到了简化,为团队腾出更多精力专注游戏开发。最重要的是,新策略使拳头游戏节省了1000万美元的运营成本,创造了拳头游戏历史上最大的一笔成本优化。
这个案例说明,要充分发挥云计算的弹性优势,单纯将业务从内部数据中心迁移到云上是不够的,必须对业务流程进行改造,将负载优化到极致。拳头游戏通过优化弹性扩缩容策略,最大限度利用了云资源,实现了降本增效。
在优化弹性扩缩容策略的过程中,拳头游戏还面临着另一个挑战,那就是不同区域玩家的游戏习惯存在差异。比如美国玩家、中国玩家和韩国玩家在打游戏时的风格就有一些细微的差别,新的调度算法需要考虑到这一点。
为了解决这一挑战,拳头游戏在评估调度算法时,不仅关注了算法对CPU利用率的影响,还考虑了算法在跨区部署时的适用性。最终选择的基于游戏连接数的轮循调度算法不需要过多配置,就可以适用于不同区域的部署。
总的来说,亚马逊云科技与拳头游戏的合作不仅提升了游戏服务的性能和可靠性,更重要的是帮助拳头游戏释放了云计算的巨大潜能,创造了可观的经济价值。通过优化弹性扩缩容策略,拳头游戏最大限度地利用了云资源,实现了降本增效,节省了1000万美元的运营成本。
这一成功案例再次证明,要真正发挥云计算的优势,光是将业务从内部数据中心迁移到云上是不够的,必须对业务流程进行改造和优化,将负载优化到极致,才能充分释放云计算的潜能,创造更大的经济价值。
在与亚马逊云科技的合作中,拳头游戏不仅优化了弹性扩缩容策略,还在游戏服务的架构和部署方面进行了改革。早期,拳头游戏的游戏架构是基于传统硬件厂商提供的防御系统,存在一些限制,比如只能支持有限的游戏版本、无法满足新游戏的需求等。
为了解决这一问题,拳头游戏与亚马逊云科技合作,构建了一个名为GDP(Game Deployment Platform)的游戏部署平台系统。这个系统不仅替代了基于FPGA的旧防御系统,还能为不同游戏提供统一的部署服务,实现单一的发布模型和管理模型。GDP系统的核心目标是将不同游戏部署到相同的EC2实例上,与常规做法不同。这不仅能够承载测试环境、生产环境和大规模电竞赛事,还能最大限度地提高资源利用率,降低运营成本。
构建GDP系统的过程中,拳头游戏还面临着一个挑战,那就是如何将游戏从Windows系统迁移到Linux系统。经过谨慎测试,拳头游戏发现两个系统在游戏性能上基本没有差异,因此决定采用混合架构,基于Amazon Web Services Graviton的ARM架构和x86架构进行部署,进一步降低了成本。根据数据,通过混合部署架构,拳头游戏的整体成本得到了进一步降低。
通过GDP系统和混合架构的部署,拳头游戏不仅解决了早期架构的限制,还进一步优化了资源利用率和成本结构,为未来的发展奠定了基础。
除了优化弹性扩缩容策略和部署架构,拳头游戏还与亚马逊云科技合作,在网络架构和安全防御方面进行了创新。
早期,拳头游戏的网络架构是基于传统数据中心的,存在一些弊端,比如无法满足新游戏对网络延迟的更高要求。为了解决这一问题,拳头游戏与亚马逊云科技合作,在12个区域构建了核心服务,使用4个Amazon Outposts和5个拳头数据中心,通过Amazon Direct Connect专线服务连接实现了拳头骨干核心网。根据数据,无畏契约作为FPS游戏,对网络延迟的要求更高,需要将延迟控制在35毫秒以下。
在全球边缘网络上,拳头游戏使用了Amazon Global Accelerator服务,提供TCP/UDP优化,并利用Amazon Backbone Network核心骨干网,将网络延迟压缩到35毫秒以下,满足了新游戏对网络延迟的更高要求。
在安全防御方面,拳头游戏也借助亚马逊云科技的服务,构建了合理强大的DDoS防御系统,保护游戏服务器免受攻击。
通过与亚马逊云科技的深入合作,拳头游戏不仅优化了弹性扩缩容策略,节省了1000万美元的运营成本,还在游戏部署架构、网络架构和安全防御等多个领域进行了创新,全面提升了游戏服务的性能、可靠性和安全性,为未来的发展奠定了坚实基础。
这一成功案例充分展现了亚马逊云科技为游戏行业带来的价值,不仅在基础设施和服务方面提供了强大的支持,更重要的是帮助游戏公司释放云计算的潜能,实现业务创新和转型,创造更大的经济价值。
下面是一些演讲现场的精彩瞬间:
Riot Games, the developer of the popular game League of Legends, showcases its global operations on 亚马逊云科技, including its best-selling titles like League of Legends, Legends of Runeterra, Teamfight Tactics, and more.
在战斗服务中,每个服务器需要单独的IP地址,CPU利用率随着战斗逻辑的不同而变化,因此不会在前面放置负载均衡器。
通过提高CPU利用率来降低成本和提高效率,实现降本增效的目标。
The speaker explains the typical game duration for different games like League of Legends (around 25 minutes) and Teamfight Tactics (around 35-40 minutes) based on the graph shown.
A graph showing the CPU utilization rates of game servers, with the red line representing the highest, yellow the average, and green the lowest, illustrating how CPU usage increases towards the end of a MOBA game as heroes grow stronger and use more skills.
在传统的EC2 AutoScaling策略下,单个实例的CPU利用率可能已经很高,但平均值仍较低,导致无法满足游戏服务器的需求。
总结
在这个精彩的演讲中,亚马逊云科技的内容策展人分享了拳头游戏如何通过优化弹性扩缩容策略,在亚马逊云科技上节省了1000万美元的成本。演讲生动讲述了拳头游戏从传统数据中心迁移到云端的过程,以及在游戏部署平台(GDP)上应对不同游戏类型带来的弹性挑战。
拳头游戏最初采用的基于CPU利用率的传统弹性扩缩容策略,无法满足不同游戏类型(如MOBA、FPS等)在不同时间点的性能波动需求。通过分析历史数据,拳头游戏发现基于游戏连接数的Round Robin算法能最佳平衡性能和成本,将CPU利用率控制在合理区间,避免剧烈波动影响游戏体验。
采用优化后的弹性扩缩容策略,不仅提升了玩家体验,还极大简化了游戏管理和容量规划,最终为拳头游戏节省了1000万美元的成本。这个案例展示了在云环境下,单纯迁移是不够的,必须充分发挥云的弹性优势,对业务进行适当改造,才能真正实现降本增效。
我们正处在Agentic AI爆发前夜。2025亚马逊云科技中国峰会提出,企业要从“成本优化”转向“创新驱动”,通过完善的数据战略和AI云服务,把握全球化机遇。亚马逊将投入1000亿美元在AI算力、云基础设施等领域,通过领先的技术实力和帮助“中国企业出海“和”服务中国客户创新“的丰富经验,助力企业在AI时代突破。
胜宇配资-炒股配资官网平台-免费配资平台-重庆配资网提示:文章来自网络,不代表本站观点。