阿里云架构师解读四大主流游戏架构

阿里云架构师解读四大主流游戏架构,第1张

游戏 行业是阿里云最早聚焦的行业之一,近年来 游戏 行业的变化、云计算产品技术的变化都与日俱进。随着行业业务的变化、技术架构的演进以及阿里云产品的迭代演进,整体的产品技术选型在不同的 游戏 场景、业务场景也不尽相同。本文将聚焦阿里云d性计算产品在 游戏 行业的方案实践经验。

当前, 游戏 行业的各种场景和行业发展密不可分。简单回顾电子 游戏 的发展,80年代的黑白机,90年代的PC单机 游戏 ,00年代前夕随着互联网的发展网络 游戏 开始盛行,2010年后随着移动设备的逐渐普及,手游在国内开始兴起。

从 游戏 终端来区别,主要有:主机 游戏 (往往是3A 游戏 )、PC 游戏 、移动 游戏 和网页 游戏 等。目前出现跨平台多端 游戏 ,以及云 游戏 化的趋势。

关于 游戏 的品类区别会有非常多的维度:RPG(角色扮演)、MOBA类、竞技类、FPS(射击类)、休闲类、卡牌类、棋牌类、SLG(策略类)等等。目前有多品类融合玩法裂变的趋势。

随着国内防沉迷、版号因素,近年来 游戏 行业诞生了越来越多的精品 游戏 ,出海全球化乃至区域化,以及整体存量用户增速放缓,长线运营、精细运营以及私域社区等运营方式也在悄然变化。

不同的业务场景技术架构不尽相同,如竞技类 游戏 和卡牌类 游戏 对计算的需求就有所区别,云 游戏 与常规的网络 游戏 架构也有所区别。这里主要从 游戏 服和 游戏 平台、大数据、云 游戏 这四个目前常见的场景简单介绍其架构。

游戏 服,从 游戏 类型来看有RPG、FPS、MOBA、SLG、棋牌、休闲等等;从 游戏 平台来看通常有主机、手机、PC等;从业务发行来看有全球、国内、海外,从部署架构来看有集中部署和分区部署;从技术架构来看, 游戏 行业也有逐渐分层解耦的趋势,但与互联网应用相比,有一定其独特性。

因为 游戏 的强交互性特点, 游戏 技术架构与其他互联网应用相比有一定独特性。 游戏 需要保持会话连接,也就是从一个客户端到服务端的长连接,便于对客户端中玩家的 *** 作、行为等进行及时的反馈以及推送给共同 游戏 或对战的其他玩家,所以 游戏 普遍对网络质量更加敏感,网络质量较差的情况会使长连接断开或重连,引起玩家掉线。 游戏 也需要保持会话的状态,既服务端会保持一份玩家的实体,当玩家进行 *** 作时,下次通信的数据会依赖之前的通信的数据,这也是一些MMO(多人在线)大型 游戏 对网络吞吐性能要求较高的原因之一。再比如FPS、MOBA类等多人对战类 游戏 ,交互性更强,对网络延迟容忍度更低,要求低延迟。因为 游戏 需要比较高密度的记录玩家的 *** 作以及结果,所以有频繁写入数据的特点,这类场景需要较强的IO性能。因为 游戏 强交互性、低延迟的特点,其技术架构也和互联网应用不同,在逐渐分层解耦的同时,需要保证 游戏 玩家的交互效果,同时也会依赖到底层服务器的计算能力。

这些都是 游戏 场景普遍存在的特点:长连接保持会话、保持状态、低延迟网络、高IO吞吐、高计算性能。

游戏 的部署架构会结合 游戏 业务特点、 游戏 运营需求来制定 游戏 服务,有分区分服、全区全服业务逻辑,分区分服还是全区全服,最大的架构差异在于数据是不是一套。而从部署方式看,主要是集中式部署和分区域部署。

集中部署就是不论 游戏 玩家在哪里, 游戏 服务集中在一个区域,适合对网络延迟要求通常不高的 游戏 类型,如休闲类;分区部署是指 游戏 服务器根据 游戏 玩家地域分布,分区域部署,方便就近接入,适合对网络延迟要求较高的 游戏 类型,如MOBA、FPS类。

典型架构

MMO类有高并发特点,大量玩家并发的高计算量负载对服务器的计算能力和稳定性有着极高的要求。同时MMO类 游戏 有着比较强的PVE或PVP特性,对网络延迟的容忍度较低。

其中网关服务器负责所有网络数据包的转发,通常是网络负载较集中的点,对于网络吞吐能力要求较高。单个 游戏 区承载玩家数量高,逻辑服务器通常按照场景地图来划分,规模再大会通过分区的方式实现。

数据中心服务器负责缓存玩家数据并异步入库,保障玩家客户快速获取和写入数据,对于可用性要求较高,需要配合应用层实现数据容错机制。

日志服务器承载了大区所有业务行为的日志收集及处理的压力,对磁盘写入性能要求较高,通常采用多台分组方式实现。

(1)MMO 游戏 服性能与稳定需求,建议使用最第7代ECS实例,根据实际需求选型c计算型(CPU与内存配比1:2)/g通用型(1:4)/r内存型(1:8),Intel Ice Lake 29GHz基频35GHz睿频提供超高性能,能更好地优化 游戏 体验。

(2)异步落库以及日志服务器,对于磁盘读写性能要求高的场景,建议云上使用ESSD PL 0/1/2/3根据业务性能需要选择,避免磁盘读写瓶颈。

(3)在 游戏 日常版本更新中,需要各个地域Region镜像的快速复制,基于ESSD快照异地复制的能力,能够提升镜像复制效率。

(4)分区分服等场景往往需要快速地开服滚服合服,通过CADT云速搭、ESSd性伸缩、OOS运维编排、ROS资源编排等云上运维工具搭配产品使用,能够提升云上运维效率。

ii FPS、MOBA类 游戏 架构介绍

MOBA类 游戏 主要包括PVP系统、PVE系统、 游戏 平台等几个主要部分,其中PVP战斗是MOBA/FPS 游戏 的核心。

PVP、PVE、 游戏 平台功能部署于同一VPC中,构成 游戏 大区;战斗服务器(往往)单独跨地域部署。

游戏 客户端首先接入到登录服务器中,完成登录认证、计费等 游戏 平台逻辑。为避免单点问题,所以 游戏 平台服务往往需要高可用方案。可利用云上高可用方案,包括便捷的运维工具满足业务高可用需求。

FPS/MOBA竞技 游戏 ,往往对延迟特别敏感,可以想象,竞技类 游戏 中对战的 游戏 场景:玩家 *** 控人物,在地图里步伐飘逸,q声密集,每一颗子d都是一次时间加上空间的矢量计算,而且需要在主进程中完成计算,那么算力需求就随着房间玩家数量上升而指数爆炸,5V5的房间和大房间100人(吃鸡)对算力的需求完全不同。

游戏 这部分重算力场景,推荐阿里云7代高主频或七代实例,更高的单核性能提供更好的战斗效果。

战斗房间类 游戏 ,因为业务本身峰谷特性,灵活地使用云上资源的d性能力,往往会较好地优化整体的资源使用成本。阿里云d性计算本身提供了非常灵活的付费方式,包括常规的按量实例、包月包年实例、以及通过节省计划/预留实例券去抵扣按量实例资源,兼顾资源灵活使用的同时达到更优的成本。

此外,为更进一步释放开发运维的效率,当前一些 游戏 也采用了容器化技术架构,阿里云的ACK+ECS/ECId性容器实例组合搭配使用,更进一步释放了基础资源的灵活性和d性能力。

业务场景

游戏 平台(不限于FPS、MOBA类)主要提供的服务:官网、客服、注册、登录、充值、兑换、商城、推送、公告、社区、SDK及邮件、短信等公共服务;包括内容审核、视频录制、d幕、转码、剪辑、RTC这些业务需要的基础服务,以及运维监控、发布平台、测试平台这些运维等平台服务。

这部分更接近于通用的互联网技术架构,以服务为颗粒度解耦,接入->网关->应用->数据库。

技术特点

这往往通常需要构建高可用基础架构来提升稳定性,业务突发期往往需要一定的d性能力。相比于 游戏 服务这部分容器化就更加普及,也更容易通过云上的比如d性容器实例去应对流量峰值场景。在视频录制场景,对实时性要求较高时,往往会基于GPU能力构建,这部分阿里云也提供了vGPU/cGPU能力,释放GPU的灵活性。

大数据是当前 游戏 业务经营、 游戏 运营主要的技术手段,主要面向平台数据运营、 游戏 数据分析、广告转化分析、安全运营分析等 游戏 核心运营场景。不同的场景对实时性要求不同,实时查询检索通常是经营分析、客户受理、玩家监测、在线等场景;离线报表通常是玩家行为分析、用户画像、特征挖掘等场景。

总体而言,实时性业务更多是业务查询类、简单计算类任务,比如买量转化的分析;离线类基本是分析类、预测类任务,比如 游戏 玩法分析。

从技术架构来看,得益于开源社区技术栈的高丰富度,大数据具体的技术选择非常之多,整体从存算一体到存算分离,也诞生像数据仓库、数据湖乃至湖仓一体等概念。

从数据架构流程来看,从数据源->数据采集、传输->数据计算、存储->数据应用,其中可选看技术方案也需要因地制宜。

从部署架构来看,不同的 游戏 公司处在不同的数据建设阶段,会有不同的选择倾向,包括完全自建、基于云自建大数据、基于云上托管、以及利用更多云上成熟的产品技术去丰富整体的大数据能力集,而后者也成为越来越多客户的选择。

拿云上大数据方案举例来讲,比如实时计算部分,选择SLS采集、Kafka数据网关通道,通过Flink做数据计算,通过ES或CK做数据分析,通过ADB以及QuickBI做数据应用展示。离线方案通过OSS做冷数据存储,Spark、Hive、HDFS等组件做数据计算存储,通过CK汇聚分析,通过Dataworks做数据应用。

具体计算存储的产品选型,主要根据不同的业务特性以及大数据应用特性来区分,根据数据容量、IOPS、吞吐、读写特点以及性价比来选择。

如刚刚举例的实时计算/近实时计算场景,Flink具备高性能、低延迟特点,所以是计算密集、网络性能高场景,推荐选型七代ECS实例或6代增强实例;如HDFS需要超大存储容量,高吞吐,推荐D系列本地盘实例,如D2S存储型本地盘实例。Remote Shuffle Service等处理结果多的场景,读写处理频繁如大量的join计算,需要综合来看计算、网络、存储性能以及综合成本来选择通用实例(如第7代ECS实例)或i系列本地盘实例。所以,最终在云上的资源选型,在性能满足的前期下,需要评估通过网络传输数据成本高(云盘),还是就地取材计算成本高(本地盘),不同模型、不同量级选择不同。

从内存处理(成本最高、性能最好、存储容量最小)、SSD本地盘、HDD本地盘、ESSD云盘、OSS对象存储(成本最优、性能一般、存储容量最大),逐渐分层解耦,还带来一个好处:充分释放了云上d性的能力,可以利用更轻巧的d性计算产品(如SPOT抢占式实例方式,或ECI容器实例)进行大数据计算,达到更好的d性能力去满足业务需求的同时也能节约更多的成本。

云 游戏 主要分终端和云端。终端部分基于Windows、iOS、Linux等 *** 作系统的终端设备包括手机、平板、电脑、电视机、VR一体机等。云端架构主要是 游戏 应用层、云 游戏 平台层、IaaS基础资源层,应用层包括PC 游戏 、手游、VR 游戏 、H5 游戏 等多种类型的 游戏 应用;平台层云 游戏 必须的运营平台、支撑平台、流化技术平台等;IaaS基础资源层包括基础网络、基于X86架构以及ARM架构的GPU服务器。

云 游戏 落地,在技术上也经历了诸多挑战,为满足端到端高性能低时延,网络调度、指令串流、编解码、多终端的SDK适配等等都是云 游戏 场景中不可避免的技术问题。

对于云端算力来讲,阿里云解决了云端渲染、串流以及编解码问题,并通过全系列GPU产品来满足云手游、端游、VR乃至企业级视觉渲染场景的需求。

总结来讲,阿里云d性计算通过云上的串流、编码加速、渲染加速等全套的技术帮助 游戏 客户给云 游戏 玩家提供更好的性能体验,通过基于阿里云全球数据中心可以帮助云 游戏 客户覆盖更多的用户,通过GPU多种产品形态和整体的d性能力,也帮助到 游戏 客户去更快捷更灵活的构建其云 游戏 业务。

阿里云通过多年的技术积累和持续的运营,提供了大规模的基础设施云服务,目前在全球部署了26个地域、82个可用区,通过优异稳定的性能表现帮助 游戏 客户高效稳定地运行 游戏 业务,为玩家提供极致顺滑的 游戏 体验,并通过技术手段不断地帮助 游戏 客户优化用云成本。

国内的业务出海、 游戏 出海也是现阶段大的趋势之一,很多 游戏 公司已经把出海从业务可选项变成了必选项之一。在2022年3月,阿里云上线了韩国和泰国两大Region,能够为本地化的 游戏 业务提供更流畅、更稳定的 游戏 体验,以此希望能在 游戏 客户出海的业务领域,提供更多的帮助。

当然,作为内容与 科技 两大热门领域的交叉领域, 游戏 产业日新月异,架构也随着前端业务的需要不断改变。阿里云d性计算也针对 游戏 厂商的不同架构,陆续推出了不同的云服务器类型和付费方式,以及云上运维套件,以帮助客户降本增效。

原文链接:>致计算机“死机”的原因 .
如今的计算机已经接近全面普及的程度了,它给人们在工作和学习上提供了极大的方便,不过,计算机的“死机”对于普通的计算机用户来说,却成为了一个解不开、挣不脱的烦 恼。每当在计算机开机时、或启动 *** 作系统时、或使用一些应用程序时、或正准备退出 *** 作系统时,“死机”这一头“猛兽”随时都有可能迎面扑来。那么,怎么做才能避免计算机“死机”的烦恼呢?下面,就根据导致“死机”的原因和预防的方法分为几点给大家介绍一下,希望下面的文章能给遇到此类问题的朋友一些帮助。
一、导致计算机“死机”的原因:
1.BIOS设置不当所造成的“死机”
每种硬件有自己默认或特定的工作环境,不能随便超越它的工作权限进行设置,否则就会因为硬件达不到这个要求而死机。例如:一款内存条只能支持到 DDR 266,而在BIOS设置中却将其设为DDR 333的规格,这样做就会因为硬件达不到要求而死机,如果就算是能在短时间内正常的工作,电子元件也会随着使用时间的增加而逐渐老化,产生的质量问题也会导致计算机频繁的“死机”。
2.硬件或软件的冲突所造成的“死机”
计算机硬件冲突的“死机”主要是由中断设置的冲突而造成的,当发生硬件冲突的时候,虽然各个硬件勉强可以在系统中共存,但是不能同时的进行工作,比如能够上网的时候就不能听音乐等等。时间一长,中断的冲突就会频频的出现,最后将导致系统不堪重负,造成“死机”。
同样,软件也存在这种情况。由于不同的软件公司开发的软件越来越多,且这些软件在开发的过程中不可能做到彼此之间的完全熟悉和配合,因此,当一起运行这些软件的时候,很容易就发生大家都同时调用同一个DLL或同一段物理地址,从而发生冲突。此时的计算机系统由于不知道该优先处理哪个请求,造成了系统紊乱而致使计算机“死机”。
3.硬件的品质和故障所造成的“死机”
由于目前一些小品牌的计算机硬件产品往往没经过合格的检验程序就投放市场,其中,有很多质量不过关的硬件产品在品质完好计算机硬件的笼罩下是非常隐蔽的,普通人是不容易看出来的。就这些硬件产品来说,造成计算机经常“死机”的原因和它们有着非常直接的关系。另外,还有些硬件的故障是由于使用的年限太久而产生的。一般来说,内存条、CPU和硬盘等部件的寿命在超过三年后就很难保证了,从而也会产生很多隐蔽的“死机”问题。
4.计算机系统源耗尽所造成的“死机”
当计算机系统执行了错误的程序或代码时,会使系统的内部形成“死”循环的现象,原本就非常有限的系统资源会被投入到无穷无尽的重复运算当中,当运算到最后会因为计算机过大的使资源耗尽而造成“死机”。还有一点就是,在计算机 *** 作系统中运行了大量的程序,使得系统内存资源不足而造成“死机”。
5.系统文件遭到破坏所造成的“死机”
系统文件主要是指在计算机系统启动或运行时起着关键性支持的文件,如果缺少了它们,整个计算机系统将无法正常的运行,当然“死机”也就在所难免了。造成系统文件被破坏的原因有很多,病毒和黑客程序的入侵是最主要的原因。另外,初级用户由于错误 *** 作,删除了系统文件也会造成这种后果。
6.计算机内部散热不良所造成的“死机”
由于计算机内部的电子元器件的主要成分是硅(这是一种工作状态受温度影响很大的元素)。在计算机工作时电子元器件的温度就会随之而增高,其表面会发生电子迁移现象,从而改变当前工作状态,造成计算机在工作中突然“死机”。
7.初级用户的错误 *** 作所造成的“死机”
对初级用户而言,在使用计算机过程中一些错误的 *** 作也会造成系统的“死机”。比如热插拔硬件、在运行过程中震动计算机、随意删除文件或安装了超过基本硬件设置标准的软件等都可以造成“死机”。
8.其他方面造成的“死机”
除了笔者在上面所叙述的原因之外,还有很多千奇百怪的原因可能导致系统的“死机”。比如电压波动过大、光驱读盘能力下降、软盘质量不良、病毒或黑客程序的破坏等等原因。总之,导致计算机死机的原因是多方面的。
从上面的几点可见,计算机“死机”对一般用户来说并不是什么好事,不过也不是不可避免的,只要用户按照正常的电脑 *** 作,相信“死机”的机率就会减小到最少。下面,笔者就计算机死机的原因所总结的一些经验给大家介绍一下。
二、计算机“死机”的预防
1.保证正确的Bios设置。Bios里面的设置一定要合适,错误的Bios设置会使你在运行Windows的时候死机。
2.经常检查电脑配件接触情况。在板卡接触不良的情况下运行会引起系统死机,因此在更换电脑配件时,一定要使板卡与主机板充分接触。
3.定期清洁机箱。灰尘太多会使板卡之间接触不良,引起系统在运行中死机,因此机箱要随时清洁,不要让太多的灰尘积存在机箱中。
4.坚持认真查杀病毒。对来历不明的光盘或软盘,不要轻易使用,对邮件中的附件,要先用杀毒软件检查后再打开。
5.按正确的 *** 作顺序关机。在应用软件未正常结束运行前,别关闭电源,否则会造成系统文件损坏或丢失,引起在启动或运行中死机。
6.避免多任务同时进行。在执行磁盘整理或用杀毒软件检查硬盘期间,不要运行其他软件,否则会造成死机。
7.勿过分求新。各种硬件的驱动不一定要随时更新,因为才开发的驱动程序往往里面有bug,会对系统造成损害,引起系统死机,最新的不一定是最好的。
8.在卸载软件时,用自带的反安装程序或Windows里面的安装/卸载方式,不要直接删除程序文件夹,因为某些文件可能被其他程序共享,一旦删除这些共享文件,会造成应用软件无法使用而死机。
9.设置硬件设备时,最好检查有无保留中断(IRQ),不要让其他设备使用该中断号,以免引起中断冲突,造成系统死机。
10.在上网冲浪的时候,不要打开太多的浏览器窗口,否则会导致系统资源不足,引起系统死机。
11.如果你的机器内存不是很大,千万不要运行占用内存较大的程序,如Photoshop,否则运行时容易死机。
12.对于系统文件或重要的文件,最好使用隐含属性,这样才不至于因错误 *** 作删除这些文件,引起系统死机。
13.修改硬盘主引导记录时,最好先保存原来的记录,防止因修改失败而无法恢复原来的引导记录。
14.CPU、显卡等配件一般不要超频,若确实需要超,要注意超频后板卡的温度,CPU、显卡等长期在非正常频率和温度下工作轻则自动重启或死机,重者烧毁CPU、显卡、主板


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/10869687.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-11
下一篇 2023-05-11

发表评论

登录后才能评论

评论列表(0条)