什么是服务器上下线动态感知,你了解多少!

什么是服务器上下线动态感知,你了解多少!,第1张

分布式服务器上下线动态感知(Hadoop HA)
HDFS集群中NameNode 存在单点故障问题,对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用,直到NameNode 重新启动。

影响HDFS集群不可用主要包括以下两种情况:

NameNode机器宕机,将导致集群不可用,重启NameNode之后才可使用。

计划需要对NameNode节点软件或硬件升级,导致集群在短时间内不可用。

为了解决上述问题,Hadoop给出了HDFS的 高可用 HA方案:HDFS的HA通常由两个NameNode组成,一个处于 active 状态,另一个处于 standby 状态。Active NameNode对外提供服务,比如处理来自客户端的RPC请求,而Standby NameNode则不对外提供服务,仅同步Active NameNode的状态,以便能够在它失败时快速进行切换。而这里的快速切换是如何实现的呢?是通过zookeeper的 动态上线感知 来实现的。

简单介绍下zookeeper是什么?

ZooKeeper 顾名思义  动物园管理员 ,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig)  的管理员, Apache Hbase和 Apache Solr 以及LinkedIn sensei  等项目中都采用到了 Zookeeper。ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,ZooKeeper是以Fast Paxos算法为基础,实现同步服务,配置维护和命名服务等分布式应用。这是zookeeper的官方介绍,对于程序原来说zookeeper在hadoop中的应用可以理解为是hadoop的整体监控系统,如果namenode宕机后,这时候Zookeeper 的重新选出leader。这是它最大的作用所在。

接下来看看zookeeper的 动态上线感知 图:

1、首先在hadoop中配置自动故障转移机制。

2、在配置HA的时候首先配置zookeeper集群,然后启动zookeeper集群。

3、在第一次启动hadoop的HA之前先初始化HA在zookeeper中的状态然后启动HA,在启动过程中会在各个NameNode节点上启动DFSZK Failover Controller,作用就是向zookeeper中注册服务器的信息,然后hadoop通过进程监控在zookeeper中的节点状态。

4、在zookeeper中注册的节点是临时节点,当服务器宕机下线的时候,zookeeper会把这个节点删除掉,这样才会产生事件,客户端(hadoop)才能监听到,然后hadoop将Standby NameNode转换为Active NameNode。

DNS(Domain Name System,域名系统), 记录ip地址的分布式服务器。 DNS解析过程如图

全球13组根域名服务器以英文字母A到M依序命名。

域名系统默认的不用写

顶级域名服务器主要负责管理在该顶级域名服务器注册的二级域名。

列:

举例:
baiducom 和 >基本原理 要实现网络机器间的通讯,首先得来看看计算机系统网络通信的基本原理,在底层层面去看,网络通信需要做的就是将流从一台计算机传输到另外一台计算机,基于传输协议和网络 IO 来实现,其中传输协议比较出名的有 >

阿里的,阿里十年前开始搞阿里云,建立数据中台(就是数据中心,打通各个模块的数据,比如说在淘宝领券后可以在闲鱼上用)

而腾讯去年底才开始做这件事!

还有,阿里云是分布式服务器。一台负责分发,分发给其他众多服务器分别一起处理!

促使马云下决心做阿里云的是当时的紧迫情况:淘宝访问量暴涨,服务器扛不住。买美国人的设施又太贵。(其实当时可以买,只是马云下决心自己做)

时至今日,阿里云已经是世界第一。以此为基础的城市大脑武装杭州市,使之成为全世界互联网最发达的城市。

采用的是分布式储存,不是一台服务器能完成的,而是区域性的群组分布式储存解决的!

抖音,淘宝,微信等打平台都是采取分布式服务器架构运行了。

什么是分布式服务器架构呢?打个比方:

我们北京的网友,上网肯定从北京电信运营商服务器节点开始访问,广州的网友就从广州电信运营商服务器节点开始访问,而平台在北京和广州的服务器上也有同样的程序和数据库,这样大家感觉网速就很快了。当地的平台服务器在给用户提供数据下行访问的时候,也会同步上传数据到主服务器。

再打个贴切点的比方:

我们每个人都能在全国线下各地超市买到我们平时用的产品,那是因为厂家每天都把货物运输到全国各地经销商代理商及门店里或者在各地建设仓储物流。

这是物流分布式节点。跟服务器部署类似一样。根据实际需要后台能最大化优化资源配置。

顺便普及一下为何运营商搞什么定向套餐(抖音流量包之类的),就是因为人家抖音本来服务器就在他们家服务器里面啊,相当于家里无线网络局域网一样。怎么用流量也就那么回事。

京东需要多大的仓库啊,才能供全国快速发货,及时发货?道理一样,因为就在家门口。

上亿人是不可能的。一个人给你01G,上亿人也要1000万GB带宽,国内主骨干网也顶不住这个流量啊。

就像你去坐大巴车,同一时间点有多辆车,目的地一样。抖音服务器集群就是这个道理

大的视频服务器平台都有CDN支持

分布式的


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13285341.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-08
下一篇 2023-07-08

发表评论

登录后才能评论

评论列表(0条)

保存