互联网时代的网络自动化运维
互联网上有两大主要元素"内容和眼球","内容"是互联网公司(或称ICP)提供的网络服务,如网页、游戏、即时通信等,"眼球"则是借指海量的互联网用户。互联网公司的内容往往分布在多个或大或小的IDC中,越来越多的"眼球"在盯着ICP所提供的内容,互联网公司进行内容存储的基础设施也呈现出了爆发式的增长。为了保障对内容的访问体验,互联网公司需要在不同的运营商、不同的省份/城市批量部署业务服务器用以对外提供服务,并为业务模块间的通信建立IDC内部网络、城域网和广域网,同时通过自建CDN或CDN专业服务公司对服务盲点进行覆盖。因此随着业务的增长,运维部门也显得愈发重要。他们经过这些年的积累,逐步形成了高效的运维体系。本文将结合国内互联网公司的经验,重点针对IT基础设施的新一代自动化运维体系展开讨论。
一、运维的三个阶段
● 第一个阶段:人人皆运维
在早期,一个公司的IT基础设施尚未达到一定的规模(通常在几台到几十台机器的规模),不一定有专门的运维人员或部门,运维的工作分担在各类岗位中。研发人员拥有服务器权限,自己维护和管理线上代码及业务。
● 第二个阶段:纵向自动化
随着业务量的增长,IT基础设施发展到了另外一个量级(通常在上百台至几千台机器的规模),开始有专门的运维人员,从事日常的安装维护工作,扮演"救火队员",收告警,有运维规范,但运维主要还是为研发提供后置服务。
这个阶段已经开始逐步向流程化处理进行过渡,运维部门开始输出常见问题处理的清单,有了自己业务范围适用的自动化脚本,开始利用开源软件的拼装完成大部分的工作。
具体表现为:各产品线有自己编写的脚本,利用如SVN+puppet或chef来完成服务器的上线和配置管理等工作。
● 第三阶段:一切皆自动
在互联网化的大潮中,越来越多的黑马团队应运而生,都曾有过短时间内用户访问量翻N倍的经历。在流量爆发的过程中,ICP的互联网基础服务设施是否能够很好的跟进,直接决定了业务内容能否满足海量用户的并发访问。
与此同时,运维系统需要足够地完善、高效、流程化。谷歌、腾讯、百度和阿里等规模的公司内一般都有统一的运维团队,有一套或多套自动化运维系统可供参照,运维部门与开发部门会是相互平行的视角。并且也开始更加关注IT基础设施在架构层面的优化以及超大规模集群下的自动化管理和切换(如图1所示)。
图1大型互联网公司IT基础设施情况概览
二、BAT(百度、阿里、腾讯)运维系统的分析
国内的互联网公司百度、阿里、腾讯(以下简称:BAT)所提供的主要业务内容不同,IT架构不同,运维系统在发展过程中有不同的关注点。
1腾讯运维:基于ITIL的运维服务管理
预计到2015年腾讯在全国将拥有60万台服务器。随着2012年自动化部署实践的成功,目前正在进行自动化验收的工作。在网络设备方面,后续将实现从需求端开始的全自动化工作:设备清单自动生成->采购清单自动下发->端口连接关系、拓扑关系自动生成->配置自动下发->自动验收。整个运维流程也已由初期的传统IT管理演进到基于ITIL的服务管理流程(如图2所示)。
图2腾讯基于ITIL的运维服务管理
2阿里运维系统:基于CMDB的基础设施管理+逻辑分层建模
CMDB(Configuration Management Database) 配置管理数据库(以下简称:CMDB),将IT基础架构的所有组件存储为配置项,维护每个配置项的详细数据,维护各配置项之间的关系数据以及事件、变更历史等管理数据。通过将这些数据整合到中央存储库,CMDB可以为企业了解和管理数据类型之间的因果关系提供保障。同时,CMDB与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。可实现IT服务支持、IT运维以及IT资产管理内部及三者之间的流程整合与自动化。在实际的项目中,CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。
3百度自动化运维:部署+监控+业务系统+关联关系
百度主要面临的运维挑战包括:突发的流量变化、复杂环境的关联影响、快速迭代的开发模式以及运维效率、运维质量、成本之间的平衡等等。百度的运维团队认为,当服务器规模达到上万台时,运维视角需要转为以服务为粒度。万台并不等于"百台100";机器的运行状态,也不再代表业务的工作状态;运维部门为研发提供前置服务,服务与服务之间关系也随着集群的扩大逐渐复杂起来。
图3百度自动化运维技术框架
百度的自动化运维技术框架,划分为部署、监控、业务系统、关联关系四大部分,整个框架更多突出了业务与IT基础设施的融合,注重"关联关系"的联动。所谓关联关系,主要是指任务与任务之间的时序依赖关系、任务与任务之间的数据依赖关系、任务与资源之间的引用依赖关系,分别对应到任务调度、数据传输、资源定位的服务流程中,形成了多条服务链。
关联关系的运维与业务较强相关,需要有一套系统能够理清楚关系的全貌,从而在复杂的服务链上,定位运行所在的环节,并在发生故障时预估影响范围,及时定位并通知相应的部门。在这样的一套系统中,自动化监控系统非常重要。百度的技术监控框架,主要通过数据采集、服务探测、第三方进行信息收集,进行监控评估后交给数据处理和报警联动模块处理,通过API接口进行功能扩充(如图4所示)。
图4百度自动化技术监控框架
其实无论是BAT等互联网企业还是其他行业的企业,在IT建设中都会遵循IT基础架构库(ITIL)或ISO20000服务管理的最佳实践,采用自动化IT管理解决方案以实现重要的业务目标,如减少服务中断、降低运营成本、提高IT效率等等。随着ISO20000、ITIL v30的发布和推广,两者已经成为事实上的某种标准。在当今企业IT管理领域,对两个标准有着很迫切的需求。特别是ISO20000的认证要求,已经成为企业越来越普遍的需求 。ITIL v30包含了对IT运维从战略、设计到转换、运营、改进的服务全生命周期的管理,相关方案往往覆盖了多个领域和多个产品,规划实施和工具的选择会比较纠结。如果选择开源的工具,从CMDB开始就会遇到很多的开发工作,对于很多注重成本收益比的企业,可以参考,但由于无法保证性能与效果并不一定适用。因此,成熟的商业方案会是更好的选择。
最新的iMC V7版本,围绕资源、用户、业务三个维度进行创新,发布了SOM服务运维管理(基于ISO20000、ITIL标准)等组件,增加了对服务器的管理,能很好的满足更多互联网化的场景需求。
通常认为,一个高效、好用的配置管理数据库一般需要满足6条重要标准,即联合、灵活的信息模型定义、标准合规、支持内置策略、自动发现和严格的访问控制。企业IT基础架构的元素类型、管理数据的类型往往有较多种,如网络设备、服务器、虚拟机等,因此对于多种信息的存储需要有合适的联合的方法。虽然 iMC智能管理平台在网络设备、服务器设备等方面已经能够较好的的满足,但是随着服务器虚拟化技术的发展,虚拟机正越来越多的成为IT基础架构的一大元素。因此,针对这一需求华三通信基于CAS CVM虚拟化管理系统,对服务器CPU、内存、磁盘I/O、网络I/O等更细节的重要资源以及虚拟机资源进行全面的管理。与BAT不同,华三通信的网管软件面向全行业,目前虽然没有对域名管理等特殊资源的'管理,但是能够通过API接口等方式与特有系统进行联动,进而满足定制化运维的需求,尤其是在互联网化的场景中,针对不同的业务需求,可以实现很多定制化的对接需求,例如,iMC+WSM组件与国内某大互联网公司自有Portal系统进行了对接,打通了iMC工具与用户自有运维平台,很好的实现了架构融和。另外,与阿里的逻辑分层建模相似,H3C "iMC+CAS"软件体系在上层也做了很多的逻辑抽象、分层,形成了诸多的模块,也即是大家看到的各种组件。
三、网络自动化运维体系
"哪怕是一个只有基础技术能力的陌生人,也能做专业的IT运维;哪怕是一个只有初中学历的运维人员,也能够带队完成中小型机房节点的建设,并负责数百至上千台服务器的维护管理工作"--这是一些公司对自己IT运行维护水平的一个整体评价。看似有些夸大的嫌疑,但实际上依托于强大的IT运维系统,国内已经有不少互联网公司能够达到或者接近这一标准。
这些企业都经历了运维发展过程中的各个阶段,运维部门曾经也是被动的、孤立的、分散的"救火队"式的团队,在后来的发展过程中,IT系统架构逐渐走向标准化、模型化,运维部门建立了完整的设备、系统资源管理数据库和知识库,包括所有硬件的配置情况、所有软件的参数配置,购买日期、维修记录,运维风险看板等等,通过网管软件,进行系统远程自动化监控。运维过程中系统会收集所有的问题、事件、变更、服务级别等信息并录入管理系统,不断完善进而形成一套趋向自动化的运作支撑机制。按照云计算的体系架构,在这样一套系统中,主要的IT资源包括计算、存储、网络资源,近些年随着网络设备厂商的推动,网络设备管理方面的自动化技术也得到十足的发展。
总结来看,一个企业在进行互联网化的建设初期,就需要考虑到随着用户访问量的增加,资源如何进行扩展。具体可以细化为规划、建设、管理、监控、运维五个方面。
1规划模型化
为了确保后续业务能够平滑扩容,网管系统能够顺利跟进,互联网企业一般在早期整体系统架构设计时便充分考虑到标准化、模型化,新增业务资源就好比点快餐,随需随取。
标准化:一是采用标准协议和技术搭建,扩展性好,使用的产品较统一,便于管理;二是采用数据中心级设备,保证可靠性、灵活性,充分考虑业务系统对低时延的要求。
模型化:基于业务需求设计网络架构模型,验证后形成基线,可批量复制,统一管理,也适宜通过自动化提高部署效率、网管效率。
图5常见互联网IDC架构
2建设自动化
互联网IT基础设施具备批量复制能力之后,可以通过自动化技术,提高上线效率。在新节点建设过程中,3~5人的小型团队即可完成机房上线工作。例如某互联网公司某次针对海外紧急业务需求,一共派遣了2名工程师到现场进行设备安装部署和基本配置,而后通过互联网链路,设备从总部管理系统中自动获取配置和设备版本,下载业务系统,完成设备安装到机房上线不超过1周时间。
要达到自动化运维的目标,建设过程中需要重点考虑批量复制和自动化上线两个方面(如图6所示)。
批量复制:根据业务需要,梳理技术关注点,设计网络模型,进行充分测试和试点,输出软、硬件配置模板,进而可进行批量部署。
自动化上线:充分利用TR069、Autoconfig等技术,采用零配置功能批量自动化上线设备,效率能够得到成倍提升。
图6批量配置与自动化上线
○ Autoconfig与TR069的主要有三个区别:
○ Autoconfig适用于零配置部署,后续一般需要专门的网管系统;TR069是一套完整的管理方案,不仅在初始零配置时有用,后续还可以一直对设备进行监控和配置管理、软件升级等。
○ Autoconfig使用DHCP与TFTP--简单,TR069零配置使用DHCP与>t
snmp-agent community read public \\默认的读团体字,不用改
snmp-agent community write private \\默认的写团体字,不用改
snmp-agent sys-info version all
snmp-agent target-host trap address udp-domain 192168101120 params securityname public \\此处的IP地址是你那个网管计算机的IP地址
snmp-agent trap queue-size 500
snmp-agent trap life 600 snmp-agent trap life 600
网管计算机网线插入网络之中,只要路由可达即可。
iMC管理软件一定要接在一台配置比较高的服务器上,否则后面运行起来速度会比较慢,并且你一旦注册了license后就绑定到这台不可以换了。
如果不对这些设备做以上配置,是不会发现这些设备的,更不能管理到。
iMC运行推荐硬件平台
服务器端:PC服务器:Xeon 24G(及以上)、内存2G(及以上)、硬盘80G(及以上)、48倍速光驱、100M网卡、显卡支持分辨率1024768、声卡
C/S又称Client/Server或客户/服务器模式。服务器通常采用高性能的PC、工作站或小型机,并采用大型数据库系统,如Oracle、Sybase、Informix或 SQL Server。客户端需要安装专用的客户端软件。
B/S是Brower/Server的缩写,客户机上只要安装一个浏览器(Browser),如Netscape Navigator或Internet Explorer,服务器安装Oracle、Sybase、Informix或 SQL Server等数据库。浏览器通过Web Server 同数据库进行数据交互。
C/S的优点是能充分发挥客户端PC的处理能力,很多工作可以在客户端处理后再提交给服务器。对应的优点就是客户端响应速度快。缺点主要有以下几个:
只适用于局域网。而随着互联网的飞速发展,移动办公和分布式办公越来越普及,这需要我们的系统具有扩展性。这种方式远程访问需要专门的技术,同时要对系统进行专门的设计来处理分布式的数据。
客户端需要安装专用的客户端软件。首先涉及到安装的工作量,其次任何一台电脑出问题,如病毒、硬件损坏,都需要进行安装或维护。特别是有很多分部或专卖店的情况,不是工作量的问题,而是路程的问题。还有,系统软件升级时,每一台客户机需要重新安装,其维护和升级成本非常高。
对客户端的 *** 作系统一般也会有限制。可能适应于Win98, 但不能用于win2000或Windows XP。或者不适用于微软新的 *** 作系统等等,更不用说Linux、Unix等。
B/S最大的优点就是可以在任何地方进行 *** 作而不用安装任何专门的软件。只要有一台能上网的电脑就能使用,客户端零维护。系统的扩展非常容易,只要能上网,再由系统管理员分配一个用户名和密码,就可以使用了。甚至可以在线申请,通过公司内部的安全认证(如CA证书)后,不需要人的参与,系统可以自动分配给用户一个账号进入系统。关于更换或者迁移域服务器:关于域服务器迁移的请教我通过部署一个简单的域管理公司40台左右的机器。域的作用主要是通过域用户来管理客户端,回收大部分的权限,使客户端系统非常稳定!整个域系统已经用了快4年了。另 外域服务器还兼任文件服务器,授权和设置了共享文件目录,让客户端可以通过这些共享目录交流和保存信息。现在公司购置了新的机器,需要将现在旧的域服务器迁移到这台新机上,旧的机器另有用途,我在考虑如何做才能让客户端受到的影响最小!先讲一下我现在的网络系统架构:ip段:192168760 2552552550DNS:1921687621DC(old):1921687621我想的迁移办法是:1先在新机上装好dc(new):19216876312在dc(new)上设置dns指向1921687621,然后作为DC(old)的额外域建立域,将dc(new)的域信息复制过来,然后配置dc(new)的dns中的ad zone,将dc(old)的dns资料也 复制过来,使dc(new)完全成为dc(old)的冗余备份!3将dc(old)的域正常卸载,让dc(new)承担起域的管理以上只是我以现有知识的设计方案,还没有实际实践,所以想请教几个问题:1dc(old)正常卸载后,dc(new)是否会自动管理起整个域?还需要什么后续的步骤吗?2另一个头痛的问题是如何使原客户端的dns指向新的dns,我想将dc(old)从网络下线后 ,直接修改dc(new)的ip为dc(old)的ip,但是觉得会有问题,不知道是否可行,或者有其他更好的办法。否则我还是要修改40多台客户端的dns指向新的dc(new)! 回答: 1这里要澄清一个问题,所有dc如果获得了完全复制,那么它们上面的数据库是完全同步的,这个通过过程是后台自动完成的,不需要人为干预。如果您的dns选择了与ad同步,那么dns的同步也是自动的。那么在新的dc作为additional dc添加进来并获得完全同步后,您所需要做的动作是,将原有primary dc所承担的角色转移过来,比如5个om,gc,如果有多站点,还有istg。注意是transfer,而不是seize。等待dc的状态稳定后,降级原来的primary dc就好了。相关的资料请参考: >
网络不好,建议开加速。
《Apex英雄》是由《泰坦天降》制作组Respawn研发的一款战术竞技游戏。 于2019年2月5日发行。玩家在游戏中将扮演外星战场上的星空战士。《Apex英雄》于 2020 年秋季登陆Nintendo Switch和 Steam 平台,并支持 PS4/Xbox One/Nintendo Switch/Steam/Origin跨平台联机。
《Apex英雄》共有18个传奇角色,三名玩家组成一个小队,第一个赛季将从3月份开始,并会推出季票,每个赛季会带来新的武器、角色和皮肤等内容。
目前《Apex英雄》支持以3人组队形式进行,一局总人数为60人,游戏共有20个小队,在右上角可以查看剩余小队数量和玩家数量。可能会出现掉线2人队或者1人队的情况,没有SOLO。没有跌落伤害,也就是说可以从高空或高层建筑物上跳下来快速移动而不受伤害。
Cdnctr:中文域名软件;位置:c:\Program Files\CNHIC\cdn\cdnupexeDingolOKS:开始程序;位置:c:\Program Files\Lenovo\DingLOKSexe
DingolVLR:结束程序;位置:c:\Program Files\联想(Lenovo)\LenovoDingol\DingolVLRexe
DMXLauncher: DMX视频软件;位置:c:\Program Files\Lenovo\dvdburning\DMXLauncherexe
iDubaPersonal Firewall:金山防火墙;位置:
IMCServerAutoStart:IMC服务器;位置:c:\Program Files\Lenovo\IMCSvrexe
IMJPMIG81:日文输入法;位置:“c:\WINDOWS\IME\imjp8-1\IMJPMIGEXE”Spoil/RemAdvDef\Mogration32
IMSCMig:位置:c:\PROGRA~1\COMMON~1\MICROS~1\IME\IMSC40A\IMSCMIGEXE/Preload
Kavrun:运行金山毒霸;位置:
KavStart:金山毒霸;位置:“c:\kav2005\KAVStartexe”-startup
1xBBPC-Client-AutoRun:联想宽带通;位置:c:\Program Files\Lenovo\联想宽带通\bbpcexe NetworkTestingOnly
Mydevice:本机预安装的硬件设备驱动程序;位置:“c:\Program Files\Common Files\Lenovo\digitalsuit\commondll\Mydeviceexe”
NvCplDaemon:显卡驱动程序:位置:RUNDLL32EXE c:\WINDOWS\system32\NvCpldll,Nvstarup
NvMediaCenter:MediaPlayer播放软件;位置:RUNDLL32EXE c:\WINDOWS\system32\NvMcTraydll,NvTaskbarInit
Nwiz:显卡驱动程序中的自动调整显示器分辨率;位置:Nwizexe/install
PHIME2002A:微软2002拼音输入法;位置:c:\WINDOWS\sytem32\IME\TINTLGNT\TINTSETPEXE/IMEName
PHIME2002ASync:微软2002拼音输入法;位置:c:\WINDOWS\sytem32\IME\TINTLGNT\TINTSETPEXE/SYNC
SoundMan:声卡驱动程序;位置:SOUNDMANEXE
TKBellExe:realplayer播放软件;位置:“c:\Program Files\Commom Files\Real\Update-oB\realsched,exe”-osboot
Eagleeye:网络爸爸;位置:c:\Program Files\tuEagles\Eaglesvrexe
SysExplr:超级解霸播放软件;位置:C:\Program Files\herosoft\超级解霸、SysExplrEXE
IdnMail:中文上网软件的中文域名邮件;位置:c:\WINDOWS\System32\IdnMailexe
Capp:中文上网软件;位置:c:\WINDOWS\System32\cappexe
QuickTimeTask:QuickTime播放软件;位置: “D:\Pram Files\qttaskexe”-atboottime请检查网络或者系统网络配置意思是联网失败。
解决方法:
一将原来的宽带连接删除重新建立连接: 双击打开网上邻居--在左侧栏点查看网络连接--右键删除原来的宽带连接--创建一个新的连接:
1新建连接向导 ,打开“欢迎使用新建连接向导”界面--“下一步” ;
2选择“连接到Internet”--“下一步”;
3选择“手动设置我的连接”--“下一步”;
4选择“用要求用户名和密码的宽带连接来连接”--“下一步”;
5在“ISP名称”文本框中输入名称--“下一步”;
6)在“用户名”文本框中输入所使用的用名称(ADSL账号),在“密码”文本框中输入密码,在“确认密码”文本框中重复输入密码确认,勾选“任何用户从这台计算机连接到Internet使用此帐户名和密码”和“把它做为默认Internet连接”—下一步;
7勾选“在我的桌面上添加一个到此连接的快捷方式”—单击“完成”后,你会看到桌面上多了个名为“ADSL”的连接图标。
二设置连接属性
1本地连接:开始—连接到—显示所有连接—右击本地连接—属性—常规—点选Internet协议(TCP/IP)--属性—选使用下面的IP地址(供参考):
IP地址:19216802
子网掩码:2552552550
默认网关:19216801。
使用下面的DNS服务器地址(供参考):
首选:1111
备用:24242424
2宽带连接:右击宽带连接—属性—网络—选自动获得IP地址—确定
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)