IT智能运维必须以大数据为基础,所以企业必须具有采集IT全层级数据的能力,并能实现数据融合,结合机器学习、智能算法,对IT运维实现洞察,获得预见性。
现在推IT智能运维的服务商国内有几家,我比较认可博睿数据提出的数据为本的理念,没有数据就是无水之源,所以企业别被概念忽悠,先踏实做数据采集和融合,智能运维是水到渠成的事
提到自动化运维,很多人可能会想到数据中心自动化(DCA)、开发运营一体化(DevOps),但这些定义始终不是一个统一的答案,其实自动化运维可以理解成是:
通过运维工具或平台,实现IT基础设施及业务应用日常任务处理和运维流程的自动化,从而提高效率和降低风险,促进运维组织的成熟和各种能力的升级。
日常任务处理包括:设备发现、作业调度、补丁分析和分发、配置变更、 *** 作系统安装、脚本执行、配置检查等;
运维流程包括:应用发布流程、应用部署流程、变更流程、资源交付流程、灾备切换流程、故障处理流程等;
能力升级包括:事件应对能力、业务运营能力、风险应对能力、变化适应能力、合规遵从能力等;
自动化运维并不是孤立建设和运行的,自动化、配置管理、监控是运维管理最重要的三点,三者间相互独立也相互关联,最好的做法是共同建设、共同迭代。
如何提升IT运维工作便利性
方法/步骤1结合IT运维中的重点难点热点问题,深入推进IT运维自动化工具的开发。
2实现设备的远程监控和批量 *** 作、资源变更的自动发现等功能。
3安全整治完善批量化运维 *** 作的手段,适配更多相对复杂的场景,完善自运行、自验证的相关功能。
4建立智能分析、故障预判发现等单场景、多场景的智能运维能力。
5进一步推进口令集中管理范围,实现强制性的统一认证、密码的动态化管理。
6建立账号及口令管理的长效机制,消除弱口令。实现自动化运维能力,单场景、多场景的AI运维能力
7基础设施信息通过手机应用等方式,实现CMDB的IP、归属等信息的方便查询,方便一线日常运营维护。
对于企业来说,要特别关注两类自动化工具:一是IT运维监控和诊断优化工具;二是运维流程自动化工具。这两类工具主要应用于:
监控自动化,是指对重要的IT设备实施主动式监控,如路由器、交换机、防火墙等;
配置变更检测自动化,是指IT设备配置参数一旦发生变化,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员发现和维护配置。
维护事件提醒自动化,是指通过对IT设备和应用活动的时时监控,当发生异常事件时系统自动启动报警和响应机制,第一事件通知相关责任人。
系统健康检测自动化,是指定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控。
维护报告生成自动化,是指定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维的可用性、性能、系统资源利用状况分析报告。
Infolex作为一个成熟的IT自动化运维工具,已经在多个大型数据中心实施,其解决IT运维自动化的理念和技术都有很多可圈可点的地方。
以上就是关于如何做好IT运维管理工作全部的内容,包括:如何做好IT运维管理工作、(转)IT:从运维到运营、什么是IT智能运维等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)