为什么会有服务器崩掉这一说法?

为什么会有服务器崩掉这一说法?,第1张

宕机是计算机术语,口语里面我们简单的把停掉机器叫做down机,转换为汉字是“宕机”,但很多人都叫做“当机”/“死机”,虽然不规范但却流行。
宕机,指 *** 作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。它属于电脑运作的一种正常现象,任何电脑都会出现这种情况。
口语里面我们简单的把停掉机器叫做down机,转换为汉字是“宕机”,但很多人都叫做“当机”,虽然不规范但却流行。
down就是up的反义,就是电脑不能正常工作了,包括一些原因而导致出现的死机。
(1)一般情况下指的就是计算机主机出现意外故障而死机。
(2)其次,一些服务器例如数据库死锁也可以称为宕机,一些服务器的某些服务挂掉了,就可以这么说。
如今的计算机已经接近全面普及的程度了,它给人们在工作和学习上提供了极大的方便,不过,计算机的"蓝屏"对于普通的计算机用户来说,却成为了一个解不开、挣不脱的烦恼。每当在计算机开机时、或启动 *** 作系统时、或使用一些应用程序时、或正准备退出 *** 作系统时,"蓝屏"这一头"猛兽"随时都有可能迎面扑来。

计科专业从事嵌入式软件开发多年,最近因为公司需要搞后台研发,经常选择升级的时机放在凌晨,而且大型的数据处理也是放在这个时间段内,经常发生的服务器宕机也是在这个时段。都是在用户使用少的时候开始折腾,折腾的次数多也就容易出现服务器问题。由于做的是物联网设备,在工作中遇到的宕机主要有这么几种情况,对大量数据的 *** 作导致CPU占比在一段时间内骤增从而导致数据接收模块出问题,导致系统监控出现问题,很多设备信息检测不到了。

对数据库的 *** 作太频繁导致效率的下降,也是影响系统性能很重要的一部分,其实服务器也是普通电脑的构成,主要的资源是CPU和内存,这两个因素无论是哪种都有可能导致系统的崩盘,如果是CPU被占满了,系统的反应会变得异常缓慢,时间长了可能还会慢慢缓过劲来,内存如果占满了那么会导致系统的崩溃,直接运行不下去了,其实宕机核心点不会跑出这两种因素。

现在就常见的服务器宕机问题做个归纳总结:

1磁盘空间被占满,现在程序员运行的时候都习惯于带上log打印,如果时间长了加上没有清理的机制早晚会出问题,这个错误在平时运行过程中经常出现,如果使用的云计算服务器通常在系统崩盘之前都会发个短信,通知你的系统处于崩溃的边缘。

2并发性能问题,如果多个人同时 *** 作一个数据库或者数据块,会导致系统假死状态,这种属于争抢CPU资源问题,可以通过增加硬件配置以及优化软件代码的效率去解决,数据量如何足够大就可以考虑分布式的管理

3数据受损或者被破坏导致系统崩盘,所以常见的做法是都会配置备份盘,出现问题抓紧拿到备份盘来顶上,现在公司使用的是阿里云的服务器,稳定性相比之前好太多了,中间换过电信云,腾讯云虽然价格低点,最后受不了直接换成阿里云,再也不想换回去了,数据的稳定性永远是第一位的。

4,一些没有必要的误 *** 作,很多时候是因为程序员或者运维人员的误 *** 作大致服务器大面积的宕机,这种事件在很多云服务提供商身上都发生过,根本层面还是管理问题。后台管理的任何细节都有可能

服务器宕机查找问题的几个线索:

1看看服务器是不是存在内存泄漏问题,有些时候重启机器开始还能正常运行弄了一段时间之后就会变得非常缓慢,十有八九都是内存的问题

2是否有黑客入侵造成,有些非常关键重要的数据也是黑客最感兴趣的,一般来讲这种概率不是很高

3是不是数据库死锁导致的,访问量过大导致,连接数过多造成的。

服务器宕机一旦发生就会引起用户的无数的投诉,无论在什么情况下稳定永远是第一位,现在大的功能升级除非已经百分百验证成功,否则引起的后果不堪设想。

希望能帮到你。

之前我们单位夜晚有一台设备down了,这台设备做的堆叠,而不是备份,所有下联线路全部连接在主设备上。结果当晚凌晨,主设备的电源模块损坏了!这 你能看出规律吗?我也想知道为什么它偏偏凌晨损坏了!

所以说,偶然性事件,不能说大部分!

但是夜间割接倒是正常,选择在用户最少的时候做可能影响业务的必要事情是常识。

虽说在凌晨的时候,使用系统的用户非常少,但是服务器在这个时候要做的工作可能一点儿也没有少:
再说一个很久以前看到的,同行们分享的服务器宕机的经历,有些经历非常之神奇,大家就当段子看吧(为了方便,我就按照第一人称来讲述)。

我们服务的甲方是一家医院,机房就在医院的楼中,最近机房的服务器经常性的发生宕机,公司的工程师去了几次也没有发现问题;后来公司被折腾的没办法了,决定让一个工程师晚上住在机房,看看半夜机房中究竟发生了什么事儿,想着就算找不到原因,也能在服务器宕机后第一时间重启。

后来发现原因,到了凌晨三四点的时候,机房门打开了,进来一个值夜班的小护士,看了一眼说:“又没有人,开着空调不浪费电么?”然后就把机房的空调关掉了,然后气温上升
我将持续分享Java开发、架构设计、程序员职业发展等方面的见解,希望能得到你的关注。
偶发性的,可以能是你浅意识的,因为这种问题印像最深刻,可能认为比较多,通过做记录去试下。
宕机一般分5种情况:

1、程序上出了问题导致程序崩溃。

2、cpu\\Gpu 、内存占满了。

3、硬盘空间满了

4、数据库表空间满了

5、机房温度过高
以上是个人在运维过程中所遇到的问题,做的总结性回答

这里需要说明一下,服务器宕机是什么意思呢? 我们日常说的“宕机”中的“宕”其实指的是英文“down”,宕机表示当前服务器或服务无响应或者不在线状态。

服务器的宕机可分为人为控制的宕机、不可控的宕机。 这两者有什么区别呢,下面来具体说明一下:

1、人为可控的宕机行为

服务器长时间的运行可能会带来一些(非致命性)问题,又或者我们需要对服务器进行软/硬件的升级维护时,可能需要停机或者重启 *** 作。这种情况下的宕机是可控的,在我们的计划之内。

2、不可控宕机行为

这种因素就很多了,比如说 服务器突然蓝屏、服务异常崩溃、突然断电断网了 ,这时候服务(器)就无法正常提供服务,这些都是不可控因素导致的。

而 在我们的日常运维工作中,计划性的宕机维护一般都选择在半夜 来做这些事,为什么呢,原因主要有这几点:
1、 减少对用户的影响

凌晨大家基本上都休息了,用户量较白天来说小得多,所以选择在此时进行系统及硬件的维护导致的宕机对用户的影响较小,就算有影响也只是影响小部分用户。

2、 有足够的时间来处理故障

在凌晨进行维护,就算有问题,技术人员也有足够的时间(比如说:00~05点)去处理故障。如果换成在日间维护,服务(器)宕机1小时以上投诉单全都过来了,压力很大的。

服务器宕机是指服务器因为一些原因导致服务器无法正常运行,造成网络断开,无法正常使用网络。服务器宕机一般都发生在凌晨,为什么会出现这种情况呢? 像我们公司是从事 科技 互联网设备生产的,为了不影响正常生产,系统升级的时候一般都是在凌晨,而且很多的数据处理也放在这个时候,服务器在这个时候也容易出现问题,具体分析有以下几种原因:
1 系统在升级或处理大的数据时,硬盘空间被占满,如果没有人能及时清理磁盘空间,服务器就会出现卡顿的问题造成宕机。

2如果是多台设备同时在 *** 作,使用这一个数据库,会引起系统假死的现象,这个是属于抢占CPU的资源造成的,会导致服务器不堪自负,网站访问量猛增,程序中毒遭到很多的应用都在消耗服务器,最终死机无法响应。
3由于凌晨维护人员减少,会出现断电,温度过高等等环境因素的影响,使服务器死机等等,不过这种情况是很少见的,因为现在机房都有发电机备用避免停电造成的数据丢失,温度也是采用的恒温系统。

4有的企业为了节省服务器的费用,会租用较低配置的服务器来从事很多的工作,使服务器超负荷运转,结果是可以预料得到的,宕机就会经常发生。

5服务器宕机一般和内存有很大的关系,有些服务器运行了一段时间后速度就变慢了,基本上就是内存出现问题,要检查一下内存是否存在泄漏的问题。
服务器宕机会出现一系列的问题,造成的损失也是无法估量的,只有平时定期做好维护,在凌晨的时候也要注意掌握使用状况才能避免宕机,无论在任何时候,服务器的稳定运转才是最重要的。

服务器应用软件在运行过程中状态很稳定,一般不会发生问题。宕机发生在凌晨概率高的原因是:一是功能升级、硬件更换多在凌晨,导致问题发生概率高;二是批量执行多在凌晨,瞬间资源消耗很大,数据问题、硬件资源问题、甚至处理逻辑问题都容易导致宕机。另外,如果是联机交易出了问题,很容易被发现,不会让系统宕机。

原理其实很简单:这就如同我们白天忙碌着很多事物性的工作,就如同搬运工一样,不停的搬运物品入库,只有在物品都搬运完了的时候,我们才能开始整理这些物品,整理仓库,。

其二,服务器在白天的时候,其实都在实时处理数据的“搬运工”状态,只有在实时性数据处理工作(搬运工作)完成以后,才有机会或才能腾出手来去做数据的归纳和整理。所以,服务器的宕机时间,通常会发生在使用率最低的时间段。仅此。

正常跑稳的业务,一般很难因为正常业务 *** 作造成服务器宕机的。服务器资源问题大部分情况下是可预测,可控制的。

最容易造成宕机的事情,反而是开发/运维的不当 *** 作造成的。比如更换服务器硬件,升级/安转os程序包,发布新代码,批量更新数据等等,这些事一般都是半夜业务量小的时候做。

因为凌晨是最困得时候,服务器一打盹就宕机了。

1、手机软件出现闪退可能是手机系统或者软件没有更新引起的,应该对手机系统或者软件进行更新使其保持在最新版本。
2、清理手机内存,手机内存占用过多可能会导致手机运行不流畅,要保持手机有一定的内存,才不会引起个别软件在运行过程中出现闪退。减少应用软件后台运行数量,过多的软件同时运行会导致手机卡顿出现闪退现象。
3、要经常对手机软件的缓存文件进行清理,软件的缓存文件会占用大量的手机内存,过多的软件缓存文件可能会造成手机闪退。
4、检查手机使用的网络是否流畅稳定,不稳定的网络有时会造成软件断网而闪退,建议用WiFi使用容易闪退的软件。
5、必要时,可以对手机文件备份处理,然后对手机进行恢复出厂值 *** 作。
软件崩溃。有很多种原因。有可能是服务器承受不了过多人的访问,还有一种可能本身软件就不稳定。况且也有可能是这款软件在这个机型上面不兼容。他会与。机型上的一些软件有冲突。
1设备碎片化:由于设备极具多样性,App在不同的设备上可能有表现不同。
2带宽限制:带宽不佳的网络对App所需的快速响应时间可能不够。
3网络的变化:不同网络间的切换可能会影响App的稳定性。
4内存管理:可用内存过低,或非授权的内存位置的使用可能会导致App失败。5用户过多:连接数量过多可能会导致App崩溃。
6代码错误:没有经过测试的新功能,可能会导致App在生产环境中失败。
7第三方服务:广告或d出屏幕可能会导致App崩溃。

1一个死循环不大可能把linux搞崩溃,尤其是到24以后,内核都有相应的保护机制,多半情况下这种进程会被杀死的。当然,你可以试试提高进程的优先级(这种我没做过,不知道结果,请事先保存好数据,以免不必要的损失)
2还有,大量地消耗系统内存。这方法也不能成功。
比如:
======================================
#BOF
#include <unistdh>
#include <stdlibh>
#include <stdioh>
#define ONE_K (1024)
int main ()
{
char some_memory;
int size_to_allocate = ONE_K;
int megs_obtained = 0;
int ks_obtained = 0;
while (1) {
for (ks_obtained = 0; ks_obtained < 1024; ks_obtained++) {
some_memory = (char)malloc(size_to_allocate);
if (some_memory == NULL) exit (EXIT_FAILURE);
sprintf(some_memory, "Hello,World");
}
megs_obtained++;
printf("Now allocated %d Megabytes\n", megs_obtained);
}
exit(EXIT_SUCCESS);
}
#EOF
====================
运行之后,


Out of Memory:Killed process 2365
Killed
======================================
系统为了保护自己的安全运行,终止了这个危险的进程。
3驱动程序出现问题,比如驱动有bug崩溃了,这时间系统就危险了,但现在的社区里面写的开源驱动大都能和内核很好地结合,bug也没抓得差不多了。(关于驱动程序,可以参看Minix作者写的 *** 作系统原理那本书,作者分析,70%的系统崩溃是由于驱动程序引起的,所以minix采用了微内核设计,只把必要的几千行代码放在内核而剩下的都放到了用户层,他认为这样做能极大地提高系统的稳定性。关于微内核的优劣,不好评论,反正我了解一点,GNU中的一个项目是做一个叫做Hurd的微内枋系统,这个项目已经有好几年了,可以去>1、硬盘损坏
最近电脑是不是有非法关机的情况,比如:突然断电。最好是修复一下硬盘试试。
2、内存条松动
如果你最近有搬动过电脑,可能就会造成内存条的松动,内存条接触不良就会经常死机。这种情况最好是检查一下内存条是否松动,然后重新插一下内存条。
3、电脑灰尘太多,散热不良。
电脑主机内的灰尘多会影响CPU和显卡的散热,最终主板就会过热,而主板如果可以检测到CPU的温度,它出于保护自己的目的,可能就会强行让电脑关机。所以,如果你长时间没有清理过灰尘,最好是清理一下灰尘,给CPU和显卡的散热片加一层硅胶。
>

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13093212.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-30
下一篇 2023-05-30

发表评论

登录后才能评论

评论列表(0条)

保存