linux系统重启网卡后网络不通(NetworkManager篇)

linux系统重启网卡后网络不通(NetworkManager篇),第1张

<div style="font-weight: 400"> <span></span> <h1>个人博客:<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.mianshi.host" target="_blank" rel="nofollow">点击这里进入</a></h1> <span></span> <h3>一.故障现象</h3> <blockquote> <p>RHEL7.6系统,使用nmcli绑定双网卡后,再使用以下命令重启network服务后主机网络异常,导致无法通过ssh远程登录系统。</p> </blockquote> <p>     <code># systemctl restart network</code></p><span></span> <h3>二.理论知识</h3> <blockquote> <p>Network service的制御网络接口配置信息改动后,网络服务必须从新启动,来激活网络新配置的使得配置生效,这部分 *** 作和从新启动系统时时一样的作用。制御(控制)是/etc/init.d/network这个文件,可以用这个文件后面加上下面的参数来 *** 作网络服务。例如:      <code># /etc/init.d/network restart</code> 同样也可以用service这个命令来 *** 作网络服务例如:      <code># service network restart</code>      <code># systemctl restart network</code>(NetworManager)是检测网络、自动连接网络的程序。无论是无线还是有线连接,它都可以令您轻松管理。对于无线网络,网络管理器可以自动切换到最可靠的无线网络。利用网络管理器的程序可以自由切换在线和离线模式。网络管理器可以优先选择有线网络,支持 VPN。网络管理器最初由 Redhat 公司开发,现在由 GNOME 管理</p> </blockquote><span></span> <h3>三.环境分析</h3> <blockquote> <p>系统版本:Red Hat Enterprise Linux Server release 7.6 内核版本:3.10.0-957.el7.x86_64 硬件类型:Huawei 2288H V5 首先检查系统网络配置,该系统配置两块bonding设备,分别是: bond0:业务网络 bond1: Oracle RAC心跳网络 分析系统日志,当重启network服务时(systemctl restart network),系统messages日志中无明显异常,测试发现,当停止NetworkManager服务后,问题现象消失,即执行如下 *** 作:</p> </blockquote> <p>     <code># systemctl stop NetworkManager</code></p> <blockquote> <p>此时再次重启network服务:</p> </blockquote> <p>     <code># systemctl restart network</code></p> <blockquote> <p>可以很快ping通bond0的业务地址10.116.6.194。 进一步分析发现,如果不停止NetworkManager服务,而是修改网卡配置文件,在bonding网卡和组成bonding的slave网卡的配置文件中增加一行配置,也可以解决该问题。</p> </blockquote> <p>     <code>NM_CONTROLLED=no</code></p> <blockquote> <p>参考红帽RHEL7配置网卡bonding的官方文档: <a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Faccess.redhat.com%2Fdocumentation%2Fen-us%2Fred_hat_enterprise_linux%2F7%2Fhtml%2Fnetworking_guide%2Fsec-network_bonding_using_the_command_line_interface" target="_blank" rel="nofollow">https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/7/html/networking_guide/sec-network_bonding_using_the_command_line_interface</a> 可以看到,官方文档的配置示例中设置了NM_CONTROLLED=”no”: <img src="https://upload-images.jianshu.io/upload_images/24736011-d9a54d4b359b41d0.png" alt=""> <img src="https://upload-images.jianshu.io/upload_images/24736011-466df81c683a5113.png" alt=""></p> </blockquote><span></span> <h3>四.原厂问题建议</h3> <blockquote> <p>该问题是由于NetworkManager服务引起,可以通过如下两种方法解决:</p> </blockquote> <ul> <li>在网卡配置文件中增加参数NM_CONTROLLED=no(“no”的引号可以不写),设置后重启network服务生效。设置NM_CONTROLLED=no的目的是将网络设备脱离NetworkManager服务的管理,设置后该网络设备仅由network服务管理,不受NetworkManager服务控制,因而nmcli命令对该网络设备不再生效;</li> <li>停止并禁用NetworkManager服务,停用后所有网络设备由network服务管理,不能通过nmcli命令来管理网络设备:</li> </ul> <p>     <code># systemctl stop NetworkManager</code>      <code># systemctl disable NetworkManager</code></p><span></span> <h3>五.解决方案</h3> <blockquote> <p>据上所述,可关闭NetworkManager服务或在BOND配置文件中添加参数,但因环境需要,需使用nmcli命令,故无法关闭NetworkManager,在多轮测试中进行思考,既然NetManager与network服务冲突,但nmcli命令属于NetworkManager,systemctl一般用来管理network,考虑两者管理命令可能也存在冲突后进行了一波测试,使用NetworkManager的nmcli进行网卡的重启 *** 作,使用以下命令后,网络可以即刻ping通并通过SSH连接</p> </blockquote> <p>     <code># nmcli connection down 网口名称</code>      <code># nmcli connection up 网口名称</code></p><span></span> <h3>六.结论</h3> <blockquote> <p>因NetworkManager与network服务存在冲突,且双网卡绑定时所使用的的nmcli进行绑定,nmcli归属于NetworkManager,故重启网卡时应用nmcli命令up/down,不应使用systemctl进行网卡重启</p> </blockquote>

因停电Linux机器重启,重启后远程连接正常,就没有在意。今儿有人报告连不上网。我本机测试了下网络显示是正常的,浏览器也能上网。打开终端尝试 ping baidu.com ,结果半天没反应。

心理犯嘀咕: “浏览器能上网,终端连不上网?”

做了以下尝试:

ping 是Windows、Unix和Linux系统下的一个命令。ping 也属于一个通信协议,是TCP/IP协议的一部分。利用“ping”命令可以检查网络是否连通。

如果ping不同可以通过以下方式查找故障原因:

127.0.0.1 是本机IP循环地址,如果本地址无法ping通,则表明本机TCP/IP协议不能正常工作。

用ifconfig查看本机IP,然后ping <本机IP>,通则表明网络适配器(网卡或MODEM )正常工作,不通则是网络适配器出现故障。

ping <同网段其他IP>,不通则表示网络线路出现故障;若网络中还包含有路由器,则应先ping 路由器在本网段端口IP,不通则此段线路有问题;通则再ping路由器所连目标计算机所在网段的端口IP,不通则是路由器出现故障;通则再ping目的计算机IP地址。

ping <网址>,比如ping baidu.com。若本机设置了DNS服务,则会显示该网址指向的IP,表明本机的DNS设置正确而且DNS解析正常,反之就可能是其中之一出现了故障。

以上前三项都通过没问题。最后连外网网址时DNS解析也正确,但是丢包。 Why?

是否是机器处于联网状态,但是屏蔽了ping命令?

因为有些服务器从网络安全的角度出发,会屏蔽ping命令,即屏蔽ICMP协议(我也不清楚这是啥)。

如何检查是否屏蔽?

Linux服务器中有一个文件 /proc/sys/net/ipv4/icmp_echo_ignore_all ,查看文件内容 cat /proc/sys/net/ipv4/icmp_echo_ignore_all

(1)当这个文件的内容为1时,为屏蔽ICMP协议;

(2)当为0时,为启用ICMP协议

两者是可以变换的,

那么我的问题是:上述所有配置都通过了,网卡、网关、icmp设置都正常,能ping通内网、网关,能解析外网,但但但但是丢包。

排除了自己机器的配置方式禁止ping,因为如果配置禁用了ping,则内部ping也将失效。怀疑是外网出口设置了防火墙、或者路由器里设置了wan口禁ping,禁止ping连通外网,但可以ping自己内部网络。

一把鼻涕一把泪,排查了一通问题还是没解决,但不影响使用,就这样吧。。。。。。

参考:1. Linux普通用户无法ping,linux无法ping的几种原因


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/6175451.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-17
下一篇 2023-03-17

发表评论

登录后才能评论

评论列表(0条)

保存