如果数据库服务器死机,以下哪几个会发生

如果数据库服务器死机,以下哪几个会发生,第1张

根据电脑死机发生时的情况可将其分为四大类:
①开机过程中出现死机:在启动计算机时,只听到硬盘自检声而看不到屏幕显示,或干脆在开机自检时发出鸣叫声但计算机不工作、或在开机自检时出现错误提示等;
②在启动计算机 *** 作系统时发生死机:屏幕显示计算机自检通过,但在装入 *** 作系统时,计算机出现死机的情况;
③在使用一些应用程序过程中出现死机:计算机一直都运行良好,只在执行某些应用程序时出现死机的情况;
④退出 *** 作系统时出现死机:就是在退出Win98等系统或返回DOS状态时出现死机。
由干在“死机”状态下无法用软件或工具对系统进行诊断,因而增加了故障排除的难度。死机的一般表现有:系统不能启动、显示黑屏、显示“凝固”、键盘不能输入、软件运行非正常中断等。死机的原因大概有千千万万种,但只有两个方面:一是由电脑硬件引起的,一是软件设计不完善或与系统和系统其它正在运行的程序发生冲突。在硬件方面,祸首就是近来在电脑DIY界流行的“超频’一—让CPU工作在额定运行频率以外的时钟频率上,CPU处于超额工作状态,出现死机就不奇怪了;其次一个原因是某个硬件过热,或者硬件资源冲突。当然还有其他一些硬件方面的原因。在软件方面,因为软件原因而造成的死机在电脑中几乎占了大多数(超频了的电脑除外)。在Windows9x系列中使用了16位和32位混合的内核模式,因此安全性很低,因程序内存冲突而死机是经常会发生的事情。下面就来介绍一下遇到死机故障后一般的检查处理方法。
一、排除系统“假”死机现象
1.首先排除因电源问题带来的“假”死机现象。应检查电脑电源是否插好,电源插座是否接触良好,主机、显示器以及打印机、扫描仪、外置式MODEM,音箱等主要外接电源的设备电源插头是否可靠地插入了电源插座、上述各部件的电源开关是否都处于开(ON)的状态。
2.检查电脑各部件间数据,控制连线是否连接正确和可靠,插头间是否有松动现象。尤其是主机与显示器的数据线连接不良常常造成“黑屏”的假死机现象。
二、排除病毒感染引起的死机现象
用无毒干净的系统盘引导系统,然后运行KILL,AV95、SCAN等防病毒软件的最新版本对硬盘进行检查,确保电脑安全,排除因病毒引起的死机现象。
另外,如果在杀毒后引起了死机现象,这多半是因为病毒破坏了系统文件、应用程序及关键的数据文件,或是杀毒软件在消除病毒的同时对正常的文件进行了误 *** 作,破坏了正常文件的结构。碰到这类问题,只能将被损坏(即运行时引起死机)的系统或软件重装。
三、排除软件安装、配置问题引起的死机现象
1.如果是在软件安装过程中死机,则可能是系统某些配置与安装的软件冲突。这些配置包括系统BIOS设置、CONFIGSYS和AUTOEXECBAT的设置、WININI、SYSTEMINI的设置以及一些硬件驱动程序和内存驻留程序的设置。
可以试着修改上述设置项。对BIOS可以取其默认设置,如“LOAD SETUP DEFAULT”和“LOAD BIOS DEFAULT”;对CONFIGSYS和AUTOEXECBAT则可以在启动时按F5跳过系统配置文件或按F8逐步选择执行以及逐项修改CONFIGSYS和AUTOEXECBAT中的配置(尤其是EMM386中关于EMS、XMS的配置情况)来判断硬件与安装程序什么地方发生了冲突,一些硬件驱动程序和内存驻留程序则可以通过不装载它们的方法来避免冲突。
2.如果是在软件安装后发生了死机,则是安装好的程序与系统发生冲突。一般的做法是恢复系统在安装前的各项配置,然后分析安装程序新装入部分使用的资源和可能发生的冲突,逐步排除故障原因。删除新安装程序也是解决冲突的方法之一。
四、根据系统启动过程中的死机现象来分析
系统启动过程中的死机现象包括两种情况:
1.致命性死机,即系统自检过程未完成就死机,一般系统不给出提示。对此可以根据开机自检时致命性错误列表的情况,再结合其它方法对故障原因作进一步的分析。
2.非致命性死机,在自检过程中或自检完成后死机,但系统给出声音、文字等提示信息。可以根据开机自检时非致命性错误代码表和开机自检时鸣笛音响对应的错误代码表来检查;开机自检时鸣笛音响对应的错误代码表中所列的情况是对可能出现故障的部件作重点检查,但也不能忽略相关部件的检查,因为相当多的故障并不是由提示信息指出的部件直接引起,而常常由相关部件故障引发。
五、排除因使用、维护不当引起的死机现象
电脑在使用一段时间后也可能因为使用、维护不当而引起死机,尤其是长时间不使用电脑后常会出现此类故障。引起的原因有以下几种:
1.积尘导致系统死机:灰尘是电脑的大敌。过多的灰尘附着在CPU、芯片、风扇的表面会导致这些元件散热不良,电路印刷板上的灰尘在潮湿的环境中常常导致短路。上述两种情况均会导致死机。
具体处理方法可以用毛刷将灰尘扫去,或用棉签沾无水酒精清洗积尘元件。注意不要将毛刷和棉签的毛、棉留在电路板和元件上而成为新的死机故障源。
2.部件受潮:长时间不使用电脑,会导致部分元件受潮而不能正常使用。可用电吹风的低热挡均匀对受潮元件“烘干”。注意不可对元件一部分加热太久或温度太高,避免烤坏元件。
3.板卡、芯片引脚氧化导致接触不良:将板卡、芯片拔出,用橡皮擦轻轻擦拭引脚表面去除氧化物,重新插入插座。
4.板卡、外设接口松动导致死机:仔细检查各I/O插槽插接是否正确,各外设接口接触是否良好,线缆连接是否正常。
六、排除因系统配置不当引起的死机现象
系统配置与电脑硬件设备和系统BIOS、主板上跳线开关设置密切相关,常见的死机故障原因有:
1.主频设置不当:此类故障主要有CPU主频跳线开关设置错误、Remark的CPU引起的BIOS设置与实际情况不符、超频使用CPU,或CPU性能不良死机。
2.内存条参数设置不当:此类故障主要有内存条设置错误和Remark内存条引起的BIOS设置与实际情况不符。
3.CACHE参数设置不当:此类故障主要有CHCHE设置错误、RemarkCACHE引起的BIOS设置与实际情况不符。
4.CMOS参数被破坏:频繁修改CMOS参数,或病毒对CMOS参数的破坏,常常会导致CMOS参数混乱而很难恢复。可以采用对CMOS放电的方法并采用系统BIOS默认设置值重新设定CMOS参数。CMOS的放电方法可参照主板说明书进行。如果是病毒感染引起的,在重设CMOS参数后,还必须对硬盘杀毒。
七、排除因硬件安装不当引起的死机现象
硬件外设安装过程中的疏忽常常导致莫名其妙的死机,而且这一现象往往在电脑使用一段时间后才逐步显露出来,因而具有一定的迷惑性。
1.部件安装不到位、插接松动、连线不正确引起的死机,显示卡与I/0插槽接触不良常常引起显示方面的死机故障,如“黑屏”,内存条、CACHE与插槽插接松动则常常引起程序运行中死机、甚至系统不能启动,其它板卡与插槽(插座)的接触问题也常常引起各种死机现象。要排除这些故障,只须将相应板卡、芯片用手摁紧、或从插槽(插座)上拔下重新安装。如果有空闲插槽(插座),也可将该部件换一个插槽(插座)安装以解决接触问题。线缆连接不正确有时也会引发死机故障。
2.安装不当导致部件变形、损坏引起的死机口径不正确、长度不恰当的螺钉常常导致部件安装孔损坏,螺钉接触到部件内部电路引起短路导致死机,不规格的主板、零部件或不规范的安装步骤常常引起机箱、主板、板卡外形上的变异因而挤压该部件内部元件导致局部短路、内部元件损坏从而发生莫名其妙的死机。如果只是电脑部件外观变形,可以通过正确的安装方法和更换符合规格的零部件来解决;如果已经导致内部元件损坏,则只能更换新的零部件了。
八、排除因硬件品质不良引起的死机现象
一般说来,电脑产品都是国际大厂商按照国际标准流水线生产出来的,部件不良率是很低的。但是高利润的诱惑使许多非法厂商对电脑标准零部件改头换面、进行改频、重新标记(Remark)、以次充好甚至将废品、次品当作正品出售,导致这些“超水平”发挥的产品性能不稳定,环境略有不适或使用时间稍长就会频繁发生故障。尤其是CPU、内存条、主板等核心部件及其相关产品的品质不良,是导致无原因死机的主要故障源。应着重检查以下部件:
1.CPU CPU是被假冒得最多也是极容易导致死机的部件。被Remark的CPU在低温、短时间使用时一切正常,但只要在连续高温的环境中长时间使用,其死机弊端就很容易暴露。使用Windows、3DS等对CPU特性要求较高的软件比DOS等简单软件更能发现CPU的问题。如需确认是否为此故确认是否为此故障可参照说明书将CPU主频跳低1到2个档次使用,比如将166降为150、133或120使用。如果死机现象大幅度减少或消失,就可以判断是CPU有问题。也可以用交换法,更换同型号的正常CPU,如果不再死机一般可以断定是CPU的问题。有些用户喜欢把CPU超频使用以获得高速的性能,这也是常导致计算机死机的原因。一般将CPU跳回原频率就能解决死机问题。
2.内存条 内存条常常被做的手脚有:速度标记被更改,如:70ns被Remark为60ns,非奇偶校验冒充奇偶校验内存,非EDO内存冒充EDO内存,劣质内存条冒充好内存条。在BIOS中将内存条读写时间适当增加(如:从60ns升为70ns),如果死机消失可以断定是内存条速度问题。如果是内存本身的质量问题,只有更换新的内存条才能解决。
3.主板 一般主板的故障常常是最先考虑然而却是要到最后才能确定的。除了印刷板上的飞线、断线和主板上元件被烧焦、主板受挤压变形、主板与机箱短路等明显的现象外,主板本身的故障只有在确认了主板上所有零部件正常(将你的板卡、CPU、内存条等配件拿到好的主板上使用正常,而别人使用正常的板卡、器件插到你的主板上就不能正常运行)时才能判断是否是主板故障,如果更换了好的同型号主板死机依然存在、则可能是该主板与某个零部件不兼容。要么更换兼容的其它型号的主板、要么只能用拔插法依次测试各板卡、芯片,找出不兼容的零部件更换之。
4.电源、风扇、机箱等 劣质电源、电源线缆故障、电源插接松动、电源电压不稳都是引起不明原因死机的罪魁祸首。CPU风扇、电源风扇转动不正常、风扇功率不足则会引起CPU和机箱内“产热大户”元件散热不良因而引起死机。
九、系统黑屏故障的排除
系统死机故障多半表现为黑屏(即显示器屏幕上无任何显示)、这类故障与显示器、显示卡关系很密切,同时系统主板、CPU、CACHE、内存条,电源等部件的故障也能导致黑屏。系统黑屏死机故障的一般检查方法如下:
1.排除“假”黑屏:检查显示器电源插头是否插好,电源开关是否已打开,显示器与主机上显示卡的数据连线是否连接好、连接摇头是否松动,看是否是因为这些因素而引起的黑屏。另外,应该动一下鼠标或按一下键盘看屏幕是否恢复正常。因为黑屏也可能是因为设置了节能模式(可在BIOS设置中查看和修改)而出现的假死机。
2.在黑屏的同时系统其它部分是否工作正常,如:启动时软/硬盘驱动器自检是否通过、键盘按键是否有反应等。可以通过交换法用一台好的显示器接在主机上测试、如果只是显示器黑屏而其它部分正常,则只是显示器出了问题,这仍是一种假死机现象。
3.黑屏发生在系统开机自检期间,请参见第四步。
4.黑屏发生在显示驱动程序安装或显示模式设置期间,显然是选择了显示系统不能支持的模式,应选择一种较基本的显示方式。如:Windows下设置显示模式后黑屏或花屏,则应在DOS下运行Windows目录下的SETUPEXE程序选择标准VGA显示方式。
5.检查显示卡与主板I/O插槽接触是否正常、可靠,必要时可以换一个I/O槽插入显示卡试试。
6.换一块已确认性能良好的同型号显示卡插入主机重新启动,若黑屏死机现象消除则是显示卡的问题。
7.换一块已确认性能良好的其它型号显示卡插入主机重新启动,若黑屏死机现象消除则是显示卡与主机不兼容,可以考虑更换显示卡或主板。
8.检查是否错误设置了系统的核心部件,如CPU的频率、内存条的读写时间、CACHE的刷新方式、主板的总线速率等,这些都可能导致黑屏死机。
9.检查主机内部各部件连线是否正确,有一些特殊的连线错误会导致黑屏死机。
10.请参见本文的其它步骡所列的死机故障诊断方法,这些故障导致的死机常常也伴随着黑屏。

计科专业从事嵌入式软件开发多年,最近因为公司需要搞后台研发,经常选择升级的时机放在凌晨,而且大型的数据处理也是放在这个时间段内,经常发生的服务器宕机也是在这个时段。都是在用户使用少的时候开始折腾,折腾的次数多也就容易出现服务器问题。由于做的是物联网设备,在工作中遇到的宕机主要有这么几种情况,对大量数据的 *** 作导致CPU占比在一段时间内骤增从而导致数据接收模块出问题,导致系统监控出现问题,很多设备信息检测不到了。

对数据库的 *** 作太频繁导致效率的下降,也是影响系统性能很重要的一部分,其实服务器也是普通电脑的构成,主要的资源是CPU和内存,这两个因素无论是哪种都有可能导致系统的崩盘,如果是CPU被占满了,系统的反应会变得异常缓慢,时间长了可能还会慢慢缓过劲来,内存如果占满了那么会导致系统的崩溃,直接运行不下去了,其实宕机核心点不会跑出这两种因素。

现在就常见的服务器宕机问题做个归纳总结:

1磁盘空间被占满,现在程序员运行的时候都习惯于带上log打印,如果时间长了加上没有清理的机制早晚会出问题,这个错误在平时运行过程中经常出现,如果使用的云计算服务器通常在系统崩盘之前都会发个短信,通知你的系统处于崩溃的边缘。

2并发性能问题,如果多个人同时 *** 作一个数据库或者数据块,会导致系统假死状态,这种属于争抢CPU资源问题,可以通过增加硬件配置以及优化软件代码的效率去解决,数据量如何足够大就可以考虑分布式的管理

3数据受损或者被破坏导致系统崩盘,所以常见的做法是都会配置备份盘,出现问题抓紧拿到备份盘来顶上,现在公司使用的是阿里云的服务器,稳定性相比之前好太多了,中间换过电信云,腾讯云虽然价格低点,最后受不了直接换成阿里云,再也不想换回去了,数据的稳定性永远是第一位的。

4,一些没有必要的误 *** 作,很多时候是因为程序员或者运维人员的误 *** 作大致服务器大面积的宕机,这种事件在很多云服务提供商身上都发生过,根本层面还是管理问题。后台管理的任何细节都有可能

服务器宕机查找问题的几个线索:

1看看服务器是不是存在内存泄漏问题,有些时候重启机器开始还能正常运行弄了一段时间之后就会变得非常缓慢,十有八九都是内存的问题

2是否有黑客入侵造成,有些非常关键重要的数据也是黑客最感兴趣的,一般来讲这种概率不是很高

3是不是数据库死锁导致的,访问量过大导致,连接数过多造成的。

服务器宕机一旦发生就会引起用户的无数的投诉,无论在什么情况下稳定永远是第一位,现在大的功能升级除非已经百分百验证成功,否则引起的后果不堪设想。

希望能帮到你。

之前我们单位夜晚有一台设备down了,这台设备做的堆叠,而不是备份,所有下联线路全部连接在主设备上。结果当晚凌晨,主设备的电源模块损坏了!这 你能看出规律吗?我也想知道为什么它偏偏凌晨损坏了!

所以说,偶然性事件,不能说大部分!

但是夜间割接倒是正常,选择在用户最少的时候做可能影响业务的必要事情是常识。

虽说在凌晨的时候,使用系统的用户非常少,但是服务器在这个时候要做的工作可能一点儿也没有少:
再说一个很久以前看到的,同行们分享的服务器宕机的经历,有些经历非常之神奇,大家就当段子看吧(为了方便,我就按照第一人称来讲述)。

我们服务的甲方是一家医院,机房就在医院的楼中,最近机房的服务器经常性的发生宕机,公司的工程师去了几次也没有发现问题;后来公司被折腾的没办法了,决定让一个工程师晚上住在机房,看看半夜机房中究竟发生了什么事儿,想着就算找不到原因,也能在服务器宕机后第一时间重启。

后来发现原因,到了凌晨三四点的时候,机房门打开了,进来一个值夜班的小护士,看了一眼说:“又没有人,开着空调不浪费电么?”然后就把机房的空调关掉了,然后气温上升
我将持续分享Java开发、架构设计、程序员职业发展等方面的见解,希望能得到你的关注。
偶发性的,可以能是你浅意识的,因为这种问题印像最深刻,可能认为比较多,通过做记录去试下。
宕机一般分5种情况:

1、程序上出了问题导致程序崩溃。

2、cpu\\Gpu 、内存占满了。

3、硬盘空间满了

4、数据库表空间满了

5、机房温度过高
以上是个人在运维过程中所遇到的问题,做的总结性回答

这里需要说明一下,服务器宕机是什么意思呢? 我们日常说的“宕机”中的“宕”其实指的是英文“down”,宕机表示当前服务器或服务无响应或者不在线状态。

服务器的宕机可分为人为控制的宕机、不可控的宕机。 这两者有什么区别呢,下面来具体说明一下:

1、人为可控的宕机行为

服务器长时间的运行可能会带来一些(非致命性)问题,又或者我们需要对服务器进行软/硬件的升级维护时,可能需要停机或者重启 *** 作。这种情况下的宕机是可控的,在我们的计划之内。

2、不可控宕机行为

这种因素就很多了,比如说 服务器突然蓝屏、服务异常崩溃、突然断电断网了 ,这时候服务(器)就无法正常提供服务,这些都是不可控因素导致的。

而 在我们的日常运维工作中,计划性的宕机维护一般都选择在半夜 来做这些事,为什么呢,原因主要有这几点:
1、 减少对用户的影响

凌晨大家基本上都休息了,用户量较白天来说小得多,所以选择在此时进行系统及硬件的维护导致的宕机对用户的影响较小,就算有影响也只是影响小部分用户。

2、 有足够的时间来处理故障

在凌晨进行维护,就算有问题,技术人员也有足够的时间(比如说:00~05点)去处理故障。如果换成在日间维护,服务(器)宕机1小时以上投诉单全都过来了,压力很大的。

服务器宕机是指服务器因为一些原因导致服务器无法正常运行,造成网络断开,无法正常使用网络。服务器宕机一般都发生在凌晨,为什么会出现这种情况呢? 像我们公司是从事 科技 互联网设备生产的,为了不影响正常生产,系统升级的时候一般都是在凌晨,而且很多的数据处理也放在这个时候,服务器在这个时候也容易出现问题,具体分析有以下几种原因:
1 系统在升级或处理大的数据时,硬盘空间被占满,如果没有人能及时清理磁盘空间,服务器就会出现卡顿的问题造成宕机。

2如果是多台设备同时在 *** 作,使用这一个数据库,会引起系统假死的现象,这个是属于抢占CPU的资源造成的,会导致服务器不堪自负,网站访问量猛增,程序中毒遭到很多的应用都在消耗服务器,最终死机无法响应。
3由于凌晨维护人员减少,会出现断电,温度过高等等环境因素的影响,使服务器死机等等,不过这种情况是很少见的,因为现在机房都有发电机备用避免停电造成的数据丢失,温度也是采用的恒温系统。

4有的企业为了节省服务器的费用,会租用较低配置的服务器来从事很多的工作,使服务器超负荷运转,结果是可以预料得到的,宕机就会经常发生。

5服务器宕机一般和内存有很大的关系,有些服务器运行了一段时间后速度就变慢了,基本上就是内存出现问题,要检查一下内存是否存在泄漏的问题。
服务器宕机会出现一系列的问题,造成的损失也是无法估量的,只有平时定期做好维护,在凌晨的时候也要注意掌握使用状况才能避免宕机,无论在任何时候,服务器的稳定运转才是最重要的。

服务器应用软件在运行过程中状态很稳定,一般不会发生问题。宕机发生在凌晨概率高的原因是:一是功能升级、硬件更换多在凌晨,导致问题发生概率高;二是批量执行多在凌晨,瞬间资源消耗很大,数据问题、硬件资源问题、甚至处理逻辑问题都容易导致宕机。另外,如果是联机交易出了问题,很容易被发现,不会让系统宕机。

原理其实很简单:这就如同我们白天忙碌着很多事物性的工作,就如同搬运工一样,不停的搬运物品入库,只有在物品都搬运完了的时候,我们才能开始整理这些物品,整理仓库,。

其二,服务器在白天的时候,其实都在实时处理数据的“搬运工”状态,只有在实时性数据处理工作(搬运工作)完成以后,才有机会或才能腾出手来去做数据的归纳和整理。所以,服务器的宕机时间,通常会发生在使用率最低的时间段。仅此。

正常跑稳的业务,一般很难因为正常业务 *** 作造成服务器宕机的。服务器资源问题大部分情况下是可预测,可控制的。

最容易造成宕机的事情,反而是开发/运维的不当 *** 作造成的。比如更换服务器硬件,升级/安转os程序包,发布新代码,批量更新数据等等,这些事一般都是半夜业务量小的时候做。

因为凌晨是最困得时候,服务器一打盹就宕机了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10772359.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-11
下一篇 2023-05-11

发表评论

登录后才能评论

评论列表(0条)

保存