机房建设运维管理系统时服务器须注意什么?

机房建设运维管理系统时服务器须注意什么?,第1张

linux 系统管理,linux 网络服务,linux 安全,数据库等等,关于编程最好会一点,这主要根据企业要求。关于网络最好也要会一点。反正做运维接触面一点要广。
目前很多企业信息化系统都有自己的监控平台和监控手段,无论是采用哪种手段去实现对系统的实时监控和故障告警,大多采用的方式也只有两种:集中式监控和分布式监控。
为了更好、更有效的保障系统上线后的稳定的运行。对于服务器的硬件资源、性能、带宽、端口、进程、服务等都必须有一个可靠和可持续的监测机制,统计分析每天的各种数据,从而能及时反映出服务器哪里存在性能瓶颈、安全隐患等。另外是要有危机意识,就是了解服务器有可能出现哪些严重的问题,出现这些问题后该如何去迅速处理。比如数据库的数据丢失,日志容量过大,被黑客入侵等等。
一、上线之前的准备工作
1、首先是备份,做好定时备份策略,备份所有你认为重要的数据,并且定期检查你的备份是否有效、全面;
2、日志轮换,无论你想用哪种轮换方式,控制日志增长避免驱动器已满是你的目的;
3、做一定的安全措施,如防火墙iptables的访问控制,用denyhosts防止黑客远程暴力破解;
4、mysql远程登录权限等等;
5、最后就是服务器、网元设备的监控。
二、监控策略
1、定义告警优先级策略
一般的监控到的结果是成功或者失败,如Ping不通、访问网页出错、连接不到Socket,发生时这些称之为故障,故障是最优先的告警。除此之外,还能监控到返回的延时、内容等,如Ping返回的延时、访问网页的时间、访问网页取到的内容等。利用返回的结果可以自定义告警条件,如Ping监控的返回延时一般是10-30ms之间,当延时大于100ms时候,表示网络或者服务器可能出现问题,引起网络响应慢,需要立即检查是否流量过大或者服务器CPU太高等问题。
2、定义告警信息内容标准
当服务器或应用发生故障时告警信息内容非常多,如告警运行业务名称、服务器IP、监控的线路、监控的服务错误级别、出错信息、发生时间等。预先定义告警内容及标准使收到的告警内容具有规范性及可读性。这点对于用短信接受告警内容特别有意义,短信内容最多是70个字符,要在70个字符完全知道故障内容比较困难,更需要预先定义内容规范。如:“视频直播服务器10021165 在2012-10-18 13:00电信线路监控第到1次失败”,清晰明了的知道故障信息。
3、通过邮件接收汇总报表
每天收到一封网站服务器监控的汇总报表邮件,花个两三分钟就大致了解网站和服务器状态。
4、 集中监控和分布式监控相结合
主动(集中)监控虽然能不需要安装代码和程序,非常安全和方便,但缺少很多细致的监控内容,如无法获取硬盘大小、CPU的使用率、网络的流量等,这些监控内容非常有用,如CPU太高表示有网站或者程序出问题,流量太高表示可能被攻击等。
被动(分布式)监控常用的是SNMP(简单网络管理协议),通过SNMP能监控到大部分你感兴趣的内容。大部分 *** 作系统支持SNMP,开通管理非常方便,也非常安全。SNMP缺点是比较占用带宽,会消耗一定的CPU和内存,在CPU太高和网络流量大情况下,无法有效进行监控。
5、定义故障告警主次
对于监控同一台服务器的服务,需要定义一个主要监控对象,当主要监控对象出现故障,只发送主要监控对象的告警,其它次要的监控对象暂停监控和告警。例如用Ping来做主要监控对象,如果Ping不通出现Timeout,表示服务器已经当机或者断网,这时只发送服务器Ping告警持续监控Ping,因为再继续监控和告警其它服务已经没有必要。这样能大大减少告警消息数量,又让监控更加合理、更加有效率。
本地监控脚本的规范化部署
6、对在本地部署的监控脚本要进行统一规范的部署并记录到KM系统。
7、实现对常见性故障业务自我修复功能
实现对常见性故障业务自我修复功能脚本进行统一部署并对修复后故障进行检查告警检查频次不多于3次。
8、对监控的业务系统进行分级
一级系统实现724小时告警,二级系统实现712小时告警,三级系统实现58小时告警。
9、 监控范围及目标
实现对负载均衡设备、网络设备、服务器、存储设备、安全设备、数据库、中间件及应用软件等IT资源的全面监控管理;同时自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的提前预警和快速定位;对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为性能优化及未来系统扩容提供科学依据。
通常情况下,我们可以将监控对象这么来分:
1服务器监控,主要监控服务器如:CPU 负载、内存使用率、磁盘使用率、登陆用户数、进程状态、网卡状态等。
2应用程序监控,主要监控该应用程序的服务状态,吞吐量和响应时间,因为不同应用需要监控的对象不同,这里不一一列举。
3数据库监控,只所以把数据库监控单独列出来,足以说明它的重要性,一般监控数据库状态,数据库表或者表空间的使用情况,是否有死锁,错误日志,性能信息等等。
4网络监控,主要监控当前的网络状况,网络流量等。
以上四条应该算是最基本的,也是保证网站正常运行必须要知道的几点内容,这样才能实现我们常说的“运筹帷幄之中,决胜千里之外”。

一般来讲,数据库管理会更难一些!
通常情况下,计算机运维一般包括计算机故障修复、 *** 作系统按照、备份,内容相对较少;而数据库管理员负责全面管理和控制数据库系统,包括数据库的安装、监控、备份、恢复等基本工作。数据库管理员的主要职责有以下几个方面:
1设计数据库设计,包括字段、表和关键字段;资源在辅助存储设备上是怎样使用的,怎样增加和删除文件及记录,以及怎样发现和补救损失。
2监视监控数据库的警告日志,定期做备份删除。监控数据库的日常会话情况。碎片、剩余表空间监控,及时了解表空间的扩展情况、以及剩余空间分布情况。监视对象的修改。定期列出所有变化的对象安装和升级数据库服务器(如Oracle、MicrosoftSQLserver),以及应用程序工具。数据库设计系统存储方案,并制定未来的存储需求计划。制定数据库备份计划,灾难出现时对数据库信息进行恢复。维护适当介质上的存档或者备份数据。备份和恢复数据库。联系数据库系统的生产厂商,跟踪技术信息。
3备份对数据库的备份监控和管理数据库的备份至关重要,对数据库的备份策略要根据实际要求进行更改,数据的日常备份情况进行监控。
4修改密码:规范数据库用户的管理定期对管理员等重要用户密码进行修改。对于每一个项目,应该建立一个用户。DBA应该和相应的项目管理人员或者是程序员沟通,确定怎样建立相应的数据库底层模型,最后由DBA统一管理,建立和维护。任何数据库对象的更改,应该由DBA根据需求来 *** 作。
5SQL语句:对SQL语句的书写规范的要求一个SQL语句,如果写得不理想,对数据库的影响是很大的。所以,每一个程序员或相应的工作人员在写相应的SQL语句时,应该严格按照《SQL书写规范》一文,最后要有DBA检查才可以正式运行。
6最终用户服务和协调:数据库管理员规定用户访问权限和为不同用户组分配资源。如果不同用户之间互相抵触,数据库管理员应该能够协调用户以最优化安排。
7数据库安全:数据库管理员能够为不同的数据库管理系统用户规定不同的访问权限,以保护数据库不被未经授权的访问和破坏。例如,允许一类用户只能检索数据,而另一类用户可能拥有更新数据和删除记录的权限。

1、Linux基础命令及脚本:shell是基本要求,最好再懂点perl或python等。如果不懂脚本,怎么把重复的劳动变得简单呢?
2、系统监控命令:目的是获取系统当前的运行状态,遇到故障等要懂得分析排查。系统调优并懂得原理,知道为什么参数要调整成某个值。
3、网络监控命令:理由和第二点一致,不过侧重于网络。同样需要理解原理及调优,不能照搬前人的经验而不知甚解。
以上可以说是基本知识。没有生产环境不是借口,知识可以学习,再加以生产环境的经验积累,就会慢慢沉淀下来了。
说说技术以外的事情:多学习、多思考、不满足当前的知识、虚心和多动手。

物理服务器(PhysicalServers)

指实实在在、存在的硬件专用独立主机或服务器设备,性能和稳定性都比较强,因此,价格也相对比较昂贵,需要用户自己根据需求进行配置、管理及运维。简单来说,物理服务器可以把它理解为一台“电脑”,实际上所有网站的程序都在这个“电脑”上运行。

云服务器(CloudServers)

指通过虚拟化技术将一台独立服务器虚拟成多个小的服务器,每个云服务器的运行和管理都完全独立,具有单独的 *** 作系统,可分配独立公网IP地址、超大磁盘、 *** 作系统Windows/Linux、内存、CPU资源等,网站运行环境和空间安全都需要用户自己去配置,对用户的技术能力有一定要求的。

云服务器是云计算服务的重要组成部分,是面向各类互联网用户提供综合业务能力的服务平台。平台整合了传统意义上的互联网应用三大核心要素:计算、存储、网络,面向用户提供公用化的互联网基础设施服务。

物理服务器VS云服务器

成本优化

物理服务器而言,无论用还是不用,设备就在那里,成本就在那里,照样算钱!

云服务器遵循按需购买,按照使用量付费的原则,具有成本低、d性伸缩、管理便捷等特点。

服务优化

物理服务器服务常规指实体服务器托管和租用两种服务类型,实体服务器托管是由用户自行购买硬件发往机房托管,期间设备的监控和管理工作均由用户单方独立完成,IDC数据中心提供IP接入、带宽接入、电力供应和网络维护等,租用是由IDC数据中心租用实体设备给客户使用,同时负责环境的稳定,用户无需购买硬件设备;

云服务器服务是指是从基础设施(Iaas)到业务基础平台(PaaS)再到应用层(SaaS)的连续的整体的全套服务,IDC数据中心将规模化的硬件服务器整合虚拟到云端,为用户提供的是服务能力和IT效能。

相较传统IDC服务模式,云计算IDC增值服务是相关于传统IDC增值服务的升级,是云计算数据中心下对传统IDC服务的升级版!云计算IDC情况下,可获得具备高扩展性和高可用的计算能力,用户也再无需担心硬件设备的性能限制等带来的问题。

资源优化

物理服务器,在硬件服务器的基础进行有限的整合,例如多台虚拟机共享一台实体服务器性能。

云服务器可通过资源集约化实现的动态资源调配,云计算可以实现横向/纵向的d性资源扩展和快速调度,传统IDC提供的资源难以承受短时间内的快速再分配,且不说企业等待的时间成本,本身而言容易造成资源闲置和浪费!

云服务器而言,通过更新的技术实现资源的快速再分配,可以在数分钟甚至几十秒内分配资源实现快速可用,可以有效地规避资源闲置的风险。此外,传统IDC远不如云计算IDC那样可以跨实体服务器,甚至实现跨数据中心的大规模有效整合。

效率优化

云计算IDC服务相较传统IDC服务,前者采取更加灵活的资源利用方式,通过技术提升和优化使用户从硬件设备的管理和运维工作中解脱出来,专注内部业务的开发和创新,由云服务商负责云平台本身的稳定,通过这种责任分担模式使整个平台的运行效率获得提升!

售后优化

首先,云服务器归于基本电信增值服务,所以其服务提供商需要获得工信部的批阅以具有相应的运营资质。云服务商对国家方针政策的了解,备案等业务流程的支持,也是确保客户可以合法合规的运营。再者,当服务器使用过程出现问题时,需要运营商的协助才可以解决,这种情况需要任何时候都可以找到主机商的售后支持,大多数云服务商而言都会提供724小时的云服务器售后支持服务,这点也可以打消用户的使用顾虑,让用户安心、放心!


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13460538.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-11
下一篇 2023-08-11

发表评论

登录后才能评论

评论列表(0条)

保存