Linux启动故障处理_系统运维

【摘要】

当Linux系统出现故障无法正常启动系统时，Linux准备了单用户模式、救援模式等方式可以让我们有效的处理这类问题。本文简单分享一个利用救援模式解决Redhat系统无法启动的案例。

【正文】

一、问题背景

1) 问题描述

一台部署了RHEL 7.2的物理服务器，突发死机故障，在尝试重启时，发现服务器无法正常进入 *** 作系统，直接进入emergency mode。本文主要分享 *** 作系统启动异常的问题排查过程。（服务器死机据后续日志分析，确定为内核的bug所致，本文不进行累述）

2) 故障现象

系统启动后，提示无法找到/dev/mapper/rhel-root，并直接进入emergency mode。

二、排查思路

1) 收集系统启动异常的相关提示信息，获取到问题关键点：

Warning:/dev/rhel/root does not exist

初步定为配置文件问题或者逻辑卷root本身问题；

2) 尝试在应急模式下检查逻辑卷状态，发现当前情况并不稳定，常用命令无法使用、显示多为乱码；

3) 尝试进入单用户模式，发现情况和应急模式一样；

Redhat 7.2进入单用户模式：

1、开机启动至内核选择界面，选择第一项，按e进行编辑

2、定位到linux16这一行，找到ro，修改其为rw init=/sysroot/bin/sh

3、按ctrl+X启动至单用户模式

4) 利用系统安装光盘，进入Linux救援模式，进行排查。

Redhat 7.2救援模式启动方法：

1、把光盘加入光驱，然后启动，以光盘进行引导，选择救援模式（中间具体的步骤不再细说）

2、文件系统挂载到/mnt/sysimage目录下，这时切换到此目录下使用chroot /mnt/sysimage这条命令即可

5) 在救援模式下，首先查看服务器lv的情况，发现所有lv

status均为未激活状态。

查看lv

#Lvdisplay

修改lv

#vgchange -a y /dev/docker/root

6) 在尝试修改root的lv status时，发现root所在的vg名和启动时所指定的vg名不一致，基本确定问题点；

7) 修复

l 编辑文件/etc/default/grub

l 修改此文件中GRUB_CMDLINE_LINUX一行中rd.lvm.lv为合适的值

l 再执行以下命令重做grub ：

n UEFI: grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg

n 非UEFI：grub2-mkconfig -o /boot/grub2/grub.cfg

l 查看文件grub.cfg中是否修改为rd.lvm.lv=rhel/root

l 修改/etc/grub2.cfg中root=后接的lv路径改为实际的路径。

8) 系统启动后，通过history日志，确定为该系统业务部署时，使用了vgrename命令修改了vg名。

三、总结

对于Linux的问题处理，需要对Linux的运行原理有所理解，这此前提下才能根据有限的提示信息判断问题方向、确定排查范围、找到解决方法。同时，提醒各位初学linux的同事么，在进行linux的一些 *** 作时，需要充分考虑这些 *** 作可能造成的影响，避免类似上述的问题发生。

转自嘉为教育-rhce认证_rhce培训_linux培训_linux认证_linux考证

linux管理常见错误一：随意许可，原因是不理解许可

如果对许可配置不当，就会给黑客留下机会。处理许可问题的最简单方法是使用所谓的RWE方法，即Read(读取)、Write(写入)、Execute(执行)。假设你想让一个用户能够读取一个文件但不能写入文件。为此，你可以执行：chmod

u+w,u-rx 文件名，一些新用户可能会看到一个错误，说他们没有使用文件的许可，因此他们就使用了：Chmod 777

文件名，以为这样能够避免问题。但这样做实际上会导致更多的问题，因为它给了文件的可执行的权限。

记住这一点：777将一个文件的读取、写入、执行的许可给了所有用户，666将一个文件的读取、写入权限给了所有用户，而555将文件的读取、执行权限给了所有用户，还有444、333、222、111等等。

linux管理常见错误二：忽视更新

这并不是说Linux管理员缺乏技巧。不过，许多Linux管理员在运行了Linux之后，以为日后就无事可做了，以为它安全可靠。其实，新的更新可以为一些新的漏洞打上补丁。维持更新可以在一个易受损的系统与一个安全的系统之间构造分水岭。Linux的安全来自于不断地维护。为了实现安全性，为了使用一些新的特性和稳定性，任何管理员都应当跟上Linux的更新步伐。

linux管理常见错误三：不经过严格审核，从多种渠道下载安装各种类型的应用程序

乍看起来，这也许是一个不错的主意。如果你在运行Ubuntu,你会知道包管理程序使用的是。deb软件包。不过，你找到的许多应用程序是以源代码的形式提供的。没有问题吗?这些程序安装后也许能够正常工作。但是你为什么不能随意安装程序呢?道理很简单，如果你以源的形式安装了程序，那么，你的软件包管理系统将无法跟踪你所安装的东西。

因此，在程序包A(以源的形式安装)依赖于程序包B(从一个。deb库安装的)，而软件包B是从更新管理器更新的时候，会发生什么事情呢?程序包A可能运行，也可能无法运行。不过，如果程序包A和B都从。deb库安装的话，二者都能运行的机会将更高。此外，在所有的程序包都来自于同样的二进制类型时，更新程序包将更为容易。

linux管理常见错误四：将服务器启动进入到X

在一台机器是专用服务器时，你可能会想到安装X,这样一些管理任务就会简单一些。不过，这并不意味着用户需要将服务器启动进入到X.这样会浪费珍贵的内存和CPU资源。相反地，你应当在级别3上停止启动过程，进入命令行模式。这样做不但会将所有的资源留给服务器，而且还会防止泄露机器的机密。要登录到X,用户只需要以命令行方式登录，然后键入startx进入到桌面。

linux管理常见错误五：糟糕的口令

记住，root

的口令通常是linux王国的关键。所以为什么要让root的口令那么容易被破解呢?保障你的用户口令的健壮性至关重要。如果你的口令比较长，且难于记忆，可将这个口令存放在一个可被加密的位置。在需要这个口令时，可用解密软件解开这个口令使用之。

linux管理常见错误六：没有备份关键的配置文件

许多管理员都有这样的体会，在升级到某个X版本，如X11之后，却发现新版本破坏了你的xorg.conf配置文件，以至于你再也无法使用X?建议你在升级X之前，先对以前的/etc/x11/xorg.conf作一个备份，以免升级失败。当然，X的升级程序会设法为用户备份xorg.conf文件，但它却在/etc/x11目录内备份。即使这种备份看起来不错，你最好还是自己做一个备份吧。笔者的一个习惯是将其备份到/root目录中，这样，用户就可以知道只有根(root)用户能够访问此文件。记住，安全第一。这里的方法也适用于其它的关键备份，如Samba、Apache、Mysql等。

linux管理常见错误七：忽视日志文件

/var/log的存在是有理由的。这是存放所有的日志文件的唯一位置。在发生问题时，你首先需要看一下这里。检查安全问题，可看一下/var/log/secure.笔者看的第一个位置是/var/log/messages.这个日志文件保存着所有的一般性错误。在此文件中，你可以得到关于网络、媒体变更等消息。在管理一台机器时，用户可以使用某个第三方的应用程序，如logwatch,这样就可以创建为用户创建基于/var/log文件的各种报告。

linux管理常见错误八：没有安装一个可正常运行的内核

你可能不会在一台机器上安装10个以上的内核。但你需要更新内核，这种更新并没有删除以前的内核。你是怎么做的呢?你一直保持使用最近的可正常工作的内核。假设你目前正常工作的内核是2.6.22,而2.6.20是备份内核。如果你更新到2.6.26,而在新内核中一切都工作正常，你就可以删除2.6.20了。

linux管理常见错误九：逃避使用命令行

恐怕很少有人愿意记住那么多命令。在大多数情况下，图形用户界面是许多人的最爱。不过，有时，命令行使用起来更加容易、快捷、安全、可靠。逃避使用命令行是Linux管理的大忌。管理员至少应当理解命令行是如何工作的，至少还要掌握一些重要的管理命令。

linux管理常见错误十：以根用户身份登录

这是一种很危险的错误。如果用户需要根特权来执行或配置一个应用程序，可以在一个标准的用户账户中使用su切换到root用户。登录到root为什么不是一件好事儿?在用户以标准用户身份登录时，所有正在运行的X应用程序仍拥有仅限于此用户的访问权。如果用户以根用户身份登录，X就拥有了root的许可。这就会导致两个问题，一、如果用户由GUI犯了一个大错，这个错误对系统来说，有可能是一个巨大的灾难。二、以根用户的身份运行X使得系统更易于遭受攻击。

除了检查本机防火墙和云控制台安全组之外，可以通过 telnet 去连接

运行命令 tailf /var/log/messages

当linux服务启动失败的时候，系统会提示我们使用 journalctl -xe 命令来查询详细信息，定位服务不能启动的原因。

mod_evasive是Apache防御攻击的模块，有助于防止DoS、DDoS以及对Apache服务器的暴力攻击。它可以在攻击期间提供规避行动，并通过电子邮件和系统日志工具报告滥用行为。该模块的工作原理是创建一个IP地址和URI的内部动态表，并拒绝以下任何一个IP地址：

如果满足上述任何条件，则发送403响应并记录IP地址。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/7234699.html

Linux启动故障处理

发表评论

评论列表（0条）