集群中一个CK节点,因服务器电压不稳意外重启后,CK启动失败,一直报错:
查找官方文档中,在 Data Replication 说明这里,提到了故障恢复方法:
注意这里flage目录可以是你安装时指定的具体clickhouse根目录。然后重启CK服务,CK会从另外一个备份中恢复数据。
这里是CK自带的故障恢复机制,前提是使用复制表(Replicated开头),本质是告诉CK,强制重建数据。建议使用此方法。
如果数据完全丢失的情况,进行restore时,CK本身没有带宽限制,表很多或数据量很大的话,需要做好网络压力以及时间评估。
目录下的所有文件都是空的(0B大小),原因无从得知,只能假定是因为服务器级别的异常重启,数据仍然在缓冲区中,没有写入磁盘?于是有了上面的“ParsingException”,CK没有读取到期望的值。
得到CK的逻辑为:
启动时,检查本地文件系统中的数据集是否与预期的数据集( ZooKeeper 中信息)一致。如果存在轻微的不一致,系统会通过与副本同步数据来解决,如果系统检测到损坏的数据片段(如文件大小错误)或无法识别的片段(写入文件系统但未记录在 ZooKeeper 中的部分),则会把它们移动到 ‘detached’ 子目录(相当于逻辑删除),然后再从其他备份中去恢复这个数据片段。
但是注意这里是有一个安全机制的,即CK判断你损坏的片段大于一定的值(max_suspicious_broken_parts,对应源码图二中的逻辑),即“本地数据集与预期数据的差异太大”,CK将会拒绝帮你自动修复,并抛出异常、阻塞启动,这个时候你就必须手动执行恢复。
通过查询配置得到,max_suspicious_broken_parts参数的默认值是10:
通过此次异常处理,更加深了CK“一辆性能超强的手动跑车”的印象,如同传说中的法拉利开启了ESC-OFF死亡模式,生死完全掌握在使用者的手上,不愧是战斗名族开源出来的系统。在完善周边支撑的道路上,CK还有很长的路要走。一、在进入电脑系统之后重启系统。
点击 开始,
点击 重新启动。
从电脑主机箱附近找到重启按钮。一般红色工作指示灯为重启按钮,绿色工作指示灯为电源启动按钮。
看到自己的电脑主机,找到重启按钮。
直接点击红色按钮。分类: 电脑/网络 >> *** 作系统/系统故障
问题描述:
这是一台VOD2002点歌系统的服务器,双内存共1G,双核奔4CPU,技嘉945的主板,全新的,里面八个320G的硬盘,四个IDE和四个SATA硬盘,装有大量的VOD歌曲,有一SQL数据库,起先开机运行调用歌曲正常,而且占用的网络带宽不超过10%,1G传输速度,CPU利用率平稳也不会很高,环境温度适宜,装的是WINDOWS2003服务器版 *** 作系统,各硬件都已正常驱动但就是开过一段时间,太概有10多个小时左右吧,然后出现硬盘指示灯常亮,屏幕静止,死机状态!然后重新启动又可正常工作,请各路电脑高手分析分析会出现此类死机的原因,谢谢了!!
解析:
电脑死机原因
无法启动系统,画面“定格”无反应,鼠标、键盘无法输入,软件运行非正常中断等。尽管造成死机的原因是多方面的,但是万变不离其宗,其原因永远也脱离不了硬件与软件两方面。
由硬件原因引起的死机
散热不良 显示器、电源和CPU在工作中发热量非常大,因此保持良好的通风状况非常重要,如果显示器过热将会导致色彩、图象失真甚至缩短显示器寿命。工作时间太长也会导致电源或显示器散热不畅而造成电脑死机。CPU的散热是关系到电脑运行的稳定性的重要问题,也是散热故障发生的“重灾区”。
移动不当 在电脑移动过程中受到很大振动常常会使机器内部器件松动,从而导致接触不良,引起电脑死机,所以移动电脑时应当避免剧烈振动。
灰尘杀手 机器内灰尘过多也会引起死机故障。如软驱磁头或光驱激光头沾染过多灰尘后,会导致读写错误,严重的会引起电脑死机。
设备不匹配 如主板主频和CPU主频不匹配,老主板超频时将外频定得太高,可能就不能保证运行的稳定性,因而导致频繁死机。
软硬件不兼容 三维软件和一些特殊软件,可能在有的微机上就不能正常启动甚至安装,其中可能就有软硬件兼容方面的问题。
内存条故障 主要是内存条松动、虚焊或内存芯片本身质量所致。应根据具体情况排除内存条接触故障,如果是内存条质量存在问题,则需更换内存才能解决问题。
硬盘故障 主要是硬盘老化或由于使用不当造成坏道、坏扇区。这样机器在运行时就很容易发生死机。可以用专用工具软件来进行排障处理,如损坏严重则只能更换硬盘了。另外对于在不支持UDMA 66/100的主板,应注意CMOS中硬盘运行方式的设定。
CPU超频 超频提高了CPU的工作频率,同时,也可能使其性能变得不稳定。究其原因,CPU在内存中存取数据的速度本来就快于内存与硬盘交换数据的速度,超频使这种矛盾更加突出,加剧了在内存或虚拟内存中找不到所需数据的情况,这样就会出现“异常错误”。解决办法当然也比较简单,就是让CPU回到正常的频率上。
内存条故障 主要是内存条松动、虚焊或内存芯片本身质量所致。应根据具体情况排除内存条接触故障,如果是内存条质量存在问题,则需更换内存才能解决问题。
硬盘故障 主要是硬盘老化或由于使用不当造成坏道、坏扇区。这样机器在运行时就很容易发生死机。可以用专用工具软件来进行排障处理,如损坏严重则只能更换硬盘了。另外对于在不支持UDMA 66/100的主板,应注意CMOS中硬盘运行方式的设定。
CPU超频 超频提高了CPU的工作频率,同时,也可能使其性能变得不稳定。究其原因,CPU在内存中存取数据的速度本来就快于内存与硬盘交换数据的速度,超频使这种矛盾更加突出,加剧了在内存或虚拟内存中找不到所需数据的情况,这样就会出现“异常错误”。解决办法当然也比较简单,就是让CPU回到正常的频率上。
硬件资源冲突 是由于声卡或显示卡的设置冲突,引起异常错误。此外,其它设备的中断、DMA或端口出现冲突的话,可能导致少数驱动程序产生异常,以致死机。解决的办法是以“安全模式”启动,在“控制面板”→“系统”→“设备管理”中进行适当调整。对于在驱动程序中产生异常错误的情况,可以修改注册表。选择“运行”,键入“REGEDIT”,进入注册表编辑器,通过选单下的“查找”功能,找到并删除与驱动程序前缀字符串相关的所有“主键”和“键值”,重新启动。
内存容量不够 内存容量越大越好,应不小于硬盘容量的05~1%,如出现这方面的问题,就应该换上容量尽可能大的内存条。
劣质零部件 少数不法商人在给顾客组装兼容机时,使用质量低劣的板卡、内存,有的甚至出售冒牌主板和Remark过的CPU、内存,这样的机器在运行时很不稳定,发生死机在所难免。因此,用户购机时应该警惕,并可以用一些较新的工具软件测试电脑,长时间连续考机(如72小时),以及争取尽量长的保修时间等。
由软件原因引起的死机
病毒感染 病毒可以使计算机工作效率急剧下降,造成频繁死机。这时,我们需用杀毒软件如KV300、金山毒霸、瑞星等来进行全面查毒、杀毒,并做到定时升级杀毒软件。
CMOS设置不当 该故障现象很普遍,如硬盘参数设置、模式设置、内存参数设置不当从而导致计算机无法启动。如将无ECC功能的内存设置为具有ECC功能,这样就会因内存错误而造成死机。
系统文件的误删除 由于Windows 9x启动需要有Command、Iosys、Msdossys等文件,如果这些文件遭破坏或被误删除,即使在CMOS中各种硬件设置正确无误也无济于事。解决方法:使用同版本 *** 作系统的启动盘启动计算机,然后键入“SYS C:”,重新传送系统文件即可。
初始化文件遭破坏 由于Windows 9x启动需要读取Systemini、Winini和注册表文件,如果存在Configsys、Autoexecbat文件,这两个文件也会被读取。只要这些文件中存在错误信息都可能出现死机,特别是Systemini、Winini、Userdat、Systemdat这四个文件尤为重要。
打开主机箱,查看内存、显卡是否有连接到位。依次排查更换内存卡、显卡等硬件设备,查查看是哪个设备的安装出了问题。
查看电源键是否存在d簧失效的现象,如果按下电源键后要等很久才会复原d起。那就需要更换按钮d簧了。如果电源键没有问题,那就需要开机拔下电源键连线和重启键连线,再短接主板的电源开关,看看电脑是否可以正常启动。如果启动不了,那就说明问题出在电脑的主板和ATX电源上。
拆机并找到主板上的电池纽扣将其取下。在电池的一侧有一个小挡板,将其向外轻轻一拨,取下电池。释放电池上的静电,将电池取下后,用手将其正反两面分别接触金属进行静电的释放。多与金属接触几次即可,不用做什么特殊的工作。
电脑无法正常启动一般和内存也有关系,既然拆机了就将内存条一块儿取下来吧。找橡皮或是干净的眼镜布擦拭内存条下面的金属接触板,将上面的灰尘擦掉,防止内存条接触不良导致电脑无法正常开机。然后将他们重新安装上,试试电脑能不能开机吧。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)