抖音,淘宝,微信等打平台都是采取分布式服务器架构运行了。
什么是分布式服务器架构呢?打个比方:
我们北京的网友,上网肯定从北京电信运营商服务器节点开始访问,广州的网友就从广州电信运营商服务器节点开始访问,而平台在北京和广州的服务器上也有同样的程序和数据库,这样大家感觉网速就很快了。当地的平台服务器在给用户提供数据下行访问的时候,也会同步上传数据到主服务器。
再打个贴切点的比方:
我们每个人都能在全国线下各地超市买到我们平时用的产品,那是因为厂家每天都把货物运输到全国各地经销商代理商及门店里或者在各地建设仓储物流。
这是物流分布式节点。跟服务器部署类似一样。根据实际需要后台能最大化优化资源配置。
顺便普及一下为何运营商搞什么定向套餐(抖音流量包之类的),就是因为人家抖音本来服务器就在他们家服务器里面啊,相当于家里无线网络局域网一样。怎么用流量也就那么回事。
京东需要多大的仓库啊,才能供全国快速发货,及时发货?道理一样,因为就在家门口。
上亿人是不可能的。一个人给你01G,上亿人也要1000万GB带宽,国内主骨干网也顶不住这个流量啊。
就像你去坐大巴车,同一时间点有多辆车,目的地一样。抖音服务器集群就是这个道理
大的视频服务器平台都有CDN支持
分布式的域名越来越多,网页的IP地址难记。DNS全名叫domainnamesystem,是一个部署在分层的DNS服务器上的分布式数据库,通过访问DNS服务器,查询分布式数据库,能够让主机的域名转化为IP地址,,采用分布式,原因是域名越来越多,网页的IP地址难记。DNS分布式,使用了大量的DNS服务器,以层次方式组织,DNS映射分布在所有的DNS服务器上,解决了因信息量过大产生的网络崩溃的问题。
如果大家了解微服务和分布式服务器架构等技术的话,那么对于如何解决系统运行中出现的BUG造成的破坏和损失这些问题也应该有自己独到的见解吧。今天,电脑培训就一起来了解一下,在服务器运行过程中出现的问题都有哪些解决方法。
随着微服务和分布式云架构的崛起,Web变得日趋复杂,“随机性”的故障因此变得越来越难以预测,而我们对这些系统的依赖却与日俱增。
这些故障给公司造成巨大损失,也给用户带来很大的麻烦,影响他们进行在线购物、交易或打断他们的工作。即使是一些简单的故障也会触及公司的底线,因此,宕机时间就成为很多工程团队的KPI。2017年,有98%的企业表示,一小时的宕机时间将给他们带来超过10万美元的损失。一次服务中断有可能让一个公司损失数百万美元。近,英国航空的CEO透露,2017年5月发生的一次技术故障造成数千名乘客滞留机场,给公司造成8000千万英镑的损失。
企业需要想办法解决这些问题,因为等到下一次事故发生就为时已晚。为此,混沌工程应运而生。
混沌工程旨在将故障扼杀在襁褓之中,也就是在故障造成中断之前将它们识别出来。通过主动制造故障,测试系统在各种压力下的行为,识别并修复故障问题,避免造成严重后果。
混沌工程将预想的事情与实际发生的事情进行对比,通过“有意识地搞破坏”来提升系统的d性。
混沌工程简史
混沌工程先出现在互联网巨头公司中,这些公司拥有大规模的分布式系统,因为这些系统太过复杂,他们需要一些新的手段来测试它们。
2010年
NetflixEngTools团队开发出了ChaosMonkey。当时,Netflix从物理基础设施迁移到AWS上,为了保证AWS实例的故障不会给Netflix的用户体验造成影响,他们开发了这个工具,用来测试系统。
2011年
SimianArmy诞生,在ChaosMonkey的基础上增加了故障注入模式,可以测试更多的故障场景。Netflix认为,云的特点是冗余和容错,但没有哪个组件能够保证100%的可用性,所以他们必须设计出一种云架构,在这种架构里,个体组件的故障不会影响到整个系统。
2012年
Netflix在GitHub上开源了ChaosMonkey,并声称他们“已经找到了应对主要非预期故障的解决方案。通过经常性地制造故障,我们的服务因此变得更有d性。”
2014年
Netflix团队创建了一种新的角色,叫作混沌工程师。BruceWong发明了这个角色,并由DanWoods在Twitter上向广大的工程社区推广。DanWoods解释说,“我从KoltonAndrus那里学到了更多有关混沌工程的知识,他把它叫作故障注入测试”。
2014年10月,当时Gremlin的联合创始人KoltonAndrus还在Netflix,他们在SimianArmy的基础上提出了故障注入测试(FIT)概念,开发者可以更灵活地控制注入故障的“杀伤力范围”。因为SimianArmy有时候会造成非常严重的故障,所以Netflix的开发者对它抱有疑虑,而FIT可以更好地控制故障粒度,于是他们就由此想出了混沌工程这个概念。
随着信息技术的发展,网络阅卷系统在各类考试中逐渐得到应用,减少了人工阅卷方式在试卷处理、试卷评阅及成绩处理等环节的工作量。高考改卷采用网络阅卷系统较早,由于受电脑数量、评卷教师人数等因素限制,高考改卷一般采用分科集中阅卷的方式,每个学科由300人至400人分组单独阅卷,后期通过人工合成各科成绩。由于集中式网络阅卷在人员安排、电脑配置上的局限性,因此,需要研究在教育城域网内如何实现分布式网络阅卷,解决更大规模人数的阅卷问题。下面以我市为例介绍解决方式。台州市9个县区的学校有高中阶段每个年级各约2万考生,参加10个科目的统考。自2008年实施分布式网络阅卷系统(以下简称本系统)以来,台州市教育系统经过对本系统的多次调整优化,目前可以实现2400人同时评阅高中段6万考生的试卷,在2天内完成所有阅卷工作,并自动生成相应的学生成绩表及分析报表。本系统由网络系统、硬件系统及软件系统三部分组成。
一、网络系统设计
网络系统是实施分布式阅卷的基础,用于各个分布式阅卷点的网络接入。因为各个学校网络接入形式不一致,既有通过县区教育城域网统一出口的学校,也有直接接入互联网的学校。另外,各类考试的保密要求不同,如中考阅卷具有保密性要求,而高中期末考试则无相应要求。因此,本系统应考虑多种网络接入方式,无保密性要求的网络阅卷可通过互联网接入,具有保密要求的网络阅卷则可以通过专网接入,可采用MPLS 或SDH等方式通过光纤组网,确保系统运行时与其他网络物理隔离。
首先,需要考虑本系统网络的稳定性问题。由于SDH方式组网后对广播风暴抑制能力较弱,台州市中考阅卷采用MPLS 网络接入,每个县区设置一个接入点,用于当地阅卷客户端的接入及扫描数据上传。高中期末联考则采用MPLS 网络与互联网接入混合的方式。
其次,需要考虑本系统互联网出口带宽及MPLS 汇聚带宽的问题。经多次网络阅卷运行测试,每个评卷客户端在阅卷时主要传送试卷切分,所需平均带宽为40Kbps至50Kbps。台州市高中段一个年级2万考生所有学科评阅卷所需带宽约为72Mbps至80Mbps,按这样的带宽考虑本系统扩充问题,以及后期教育资源共享等应用业务的开展,互联网出口采用100Mbps专线,MPLS 网络采用1000Mbps专线。
二、硬件系统设计
1服务器系统
服务器系统包括数据库服务器、评卷服务器、图像服务器,是分布式阅卷软件运行的基础平台。数据库服务器为数据库系统的稳定运行提供保障,对CPU资源要求较高。本系统采用ORACLE 9i作为后台数据库。经实际测试,在2×2CPU+4G内存配置的单台服务器平台上同时进行高中段10个科目,每个科目单个年级段有2万条记录的网络评卷,系统运行稳定。评卷服务器实现网络阅卷界面的登录,主要负责>阿里云 SLB 是一个很好的调度员,把访问流量均衡的分配给后端的多台 ECS 实例服务器 ,达到加速访问,提高业务稳定性的作用。
你可以在负载均衡中添加多台 ECS 云服务器,并且提前设置好运行规则。当阿里云 SLB 启动后,就根据预先设定的规则分发流量。如果遇到某台云服务器故障,就会自动隔离掉故障服务器,保障了整个业务的稳定运行。
是网站中最常用的加速功能。通过分布式服务器布局,把网站业务内容缓存到各地的云服务器中,供访客就近访问。所以使用了 CDN 的网站业务,打开速度特别快。
阿里云CDN官方页面: 点我直达
关于阿里云 CDN 的问题及解答请移步 阿里云 CDN 配置过程及疑问解答 ,老魏强烈建议网站业务都要使用 CDN 加速功能。价格也不贵,普通网站一年几十块钱就搞定了。
局限性在于普通CDN加速只给静态内容加速,比如、文档等。
是有安全防护能力的CDN服务。用官方解释来说,SCDN 能够提前预判外界攻击行为,并将恶意请求切换到高防IP,无需人为 *** 作。目的是通过数据清洗把恶意流量去除。而真实用户的请求则正常打开页面,这样就兼顾了智能加速和安全工作。
官方网址: 点我直达
因为传统的CDN加速服务,只具备最基本的抗攻击功能,不过无法抵挡大规模的DDoS、CC攻击。单独使用高防IP保护源站的方式又无法兼顾加速。而在游戏、金融、政企安防、电商、医疗领域等易受攻击又必须兼顾加速的业务场景,需要同时有高防能力和稳定高效的安全CDN加速服务。阿里云SCDN 就是基于阿里云CDN 的优质加速能力,深度集成阿里云盾的专业攻防策略,可一站式提供安全和加速的整体解决方案。
全站加速(DCDN)
)是在CDN加速的基础上技术升级的云产品。智能区分访问的动态内容还是静态内容。如果是静态内容就直接用阿里云CDN加速,动态内容通过路由决策优化、协议优化等快速回源拉取内容数据。
和普通CDN加速只给静态内容加速,比如、文档相比,阿里云全站加速(DCDN)可以智能的对动态、静态内容都进行加速。请看表格的功能对比。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)