记一次服务器上架的总结和反思

记一次服务器上架的总结和反思,第1张

记一次服务器上架的总结和反思

因为最近时尚博主旗下企业订单增多,各项建设进度加快,原本处于饱和状态的服务器资源越来越着急。时尚博主很着急,就做了一系列的统计分析和资源应用分析,然后提交了采购计划。

比如题目《记录一个服务器货架的总结与反思》,服务器采购计划最终获批。时尚博主们愉快地等待着这些服务器的到来,设计了相关的发布步骤和自动化技术方案,最后进行了实际的实施。虽然在整个实施过程中遇到了一些困难,但都是不伤害主流程的小问题,步骤中也不乏被忽略的点和没有设计好的点,都是非常非常值得以后思考和反思的。毕竟这只是一次扩张,之后这种情况还会继续发生很多次。为了更好的未来和幸福,为了中华民族更好的繁荣,为了更好的未来。。。写博文记录服务器发布就行了!

来吧,我们别说话了。让我们进入文章的主题。


准备工作

在服务器到来之前,时尚博主们忙着统计分析服务器资源的应用现状,撰写服务器采购计划,采购物品,签订机房新服务器机柜的合同。

服务器资源的统计分析和分析

因为企业的卡在这些方面并不严格,所以采集了当前服务器的CPU、运行内存、硬盘的数据和信息指标值来反映今天服务器资源有多着急。。。已经太紧了。。。

服务器采购方案级别

首先将改进后的公司估值应用于当前框架中要调整的区域和预估的资源,计算出本次采购所需的资源总量,然后根据资源总量计算出相关的服务器配置,最后得出服务器硬件配置的空不足。

获取级别

因为企业规模不是很大,又是互联网公司,所以没有招标的办法。针对重点企业的很多常见供应商,进行了相关的询价采购,然后进行了框架对比。最后自然是选择性价比最高的(一定是性价比最高的)。

机房级别

提前通知机房的手机联系人讨论了新服务器机柜的要求。作为老客户,价格层面没什么好谈的。合同一签,机房就提前准备好新的服务器机柜。旧服务器机柜到新服务器机柜的网线也告诉机房提前给大家铺好。

服务器到来后,因为线上线下环境和资源都不够用。所以服务器分两批,一批到线上机房,一批到线下推广企业内部机房。本批次到网上机房应提前与机房核对并放行。机房会帮你记录服务器的SN(序列号)号和详细的mac地址。在正常情况下,这些信息可以贴在服务器侧板上。

这次我想把服务器的发布步骤连接起来,让所有的步骤尽可能自动化。所以,我和一个朋友当场让机房帮忙发布。睾丸早就疼了,还没开就送到服务器了。。。帮助机房工作人员拆卸服务器,拿到机房人肉服务器,记录人肉SN和mac进行CMDB仓储的实际 *** 作。


刚开始执行

下面你需要的只是开始自动技术安装的实际 *** 作!

首先我在一个服务器上部署了一套kickstart(应用cobbler也可以,只覆盖kickstart层)。因为这次发布的服务器是一批虚拟化技术服务器和一批存储服务器,所以我针对这两种情况写了两个ks文档。

要记住PXE安装,新的服务器应该首先做以下过程:

1。按F2键开始系统设置

2。选择“设备设置”下的“集成RAID控制器XXXX配置实用程序”菜单栏,并根据自己的服务器类型设置适当级别的RAID阵列

3。在IDRAC设置(即戴尔远程 *** 作设置)下,设置远程 *** 作的IP以及相关的网络端口和插座等。

4。在系统BIOS下默认设置服务器的启动和运行顺序。服务器的默认设置启动顺序很关键,所以必须设置为从硬盘启动,以免PXE重启后重复安装系统软件。

完成上述过程设置后,您可以根据戴尔的远程控制网页(即IDRACWEB)将服务器设置为仅在下次重新启动时进行PXE启动。

在全自动安装的步骤中,我将服务器安装、系统软件重置、应用程序重置和虚拟化技术部署分解为两大流程。

第一个过程:服务器安装

在这个过程中,关键是根据ks文档的设置,自动重拨服务器安装全过程中的各种设置,如root登录密码、时区时间、系统分区状态等。

这一步,其中一个关键就是如何确定你安装的服务器的IP地址和IP是你预设的?

我这样做是通过匹配服务器的序列号和预设的IP地址与IP地址,然后记录在CMDB。在ks的后装脚本制作中,我根据put-in指令(应用dmidecode-t1指令)获取了系统软件的SN号,然后根据SN号查看CMDB服务器,得到当前SN号匹配的IP地址和IP详细地址,然后进行进一步的设置和实际 *** 作。

第二个主要过程:系统软件复位,利用复位和虚拟化技术进行部署

在这个过程中,关键是要编写一个单独的重置专用工具来执行该过程的所有步骤的实际 *** 作。因为这个过程发生在服务器系统软件安装之后比较简单,所以大家都会在系统软件安装之后的脚本制作中设置一个专门的工具来自动获取这个重置。在服务器重启后实现,从而进行整个流程的实际 *** 作。

这个剧本制作的要点包括:

系统软件重置(服务器防火墙、selinux、核心主要参数、账户管理权限、服务器之间的相互信任以及相关安全策略等。)

与应用程序相关的重置(完全自动添加到zabbix监管、puppet和ldap)

虚拟化技术重置(虚拟化技术全自动部署,模板机根据CMDB的设置全自动创建vm虚拟机)

在自动化技术的整个过程中,现阶段充分考虑了上层。根据机房提供的SN和mac的详细地址,将信息输入CMDB。然后在服务器安装完成后,根据CMDB获取相关数据库,进行具体的实际 *** 作,完全发布给公司运维管理。不过我觉得只有一部分苦衷转嫁到了机房运维管理上,比如把服务器放在服务器机柜里,抄录SN和mac,设置raid和idrac。有些人还是要做。但是谁让我们为此付出代价呢?注意,我这里不是说黑机房运维。

问题总结

根据我上面所说的,似乎没有问题。下面是总结难题的时候了。

以下挑战:

1。提出采购计划时,忘记采购网线,导致机房前一天匆忙联系采购

2。去机房的时候工作专用工具没准备好(忘记带数据线)

3。在CMDB记录服务器的信息内容时,由于本人原因记录了两个字段名的信息内容,导致两台服务器安装后没有IP地址和IP

4。必须安装的包没有作为本地yum源码,导致整个安装过程缓慢,zabbix和puppet是主导因素。。。

5。因为疏忽。。系统磁盘大小102400MB,误写出1024000MB,导致重新安装两台服务器。。。

6。系统软件重置时,我忘记添加ssh端口的更改,导致在安装服务器后,需要编写另一个脚本来批量运行该作业。

7。写ks文档的时候没有测试用的应用服务器,造成了在戴尔服务器上运行时选择网络端口的难题。最后,谷歌添加了相关的主要参数来解决问题

啊,我好难过。。。在整个过程中,出现了不少问题。综上所述,不存在专业问题和天然壁垒,关键问题还是缺乏全面的应急预案,没有认真执行。唉,现在该想一波了。。。

到了这个阶段,上面的问题已经不小心调整好了。这些服务器的线下推广还没做,下周再做就很轻松了。

好了,这篇文章就到这里。这几天能抽时间把相关的执行文本文档写出来分享给大家。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/782434.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-04
下一篇 2022-05-04

发表评论

登录后才能评论

评论列表(0条)

保存