随着云计算技术、互联网大数据及其AI业务流程的快速发展,对服务器和计算能力的要求大大增加,全球将加快大数据中心的基本建设,运营规模越来越大,从几万台服务器到几十万台甚至上百万台。Gartner的报告显示,2017年第四季度全球范围内服务器收入增长25.7%,服务器相关的高科技产业处于快速发展期。由于业务流程的快速发展趋势,IT基础设施建设必须具备快速部署、快速发布的能力和便捷的管理方法。大量服务器的管理方式会越来越复杂,传统的运维行业面临着许多新的挑战。
服务器部署的挑战
在大数据中心扩容、迁移、整合的场景下,一台新购买的服务器要经历从流水线、调试、分配共享资源、发放设备等全流程。现场人力资源涉及硬件配置及安装、手机软件部署及管理运维人员等。这些实际 *** 作中的大部分必须由 *** 作和维护人员在现场手动进行。根据华为集团IT部门的统计分析,这些实际 *** 作中,超过50%的常见故障是由人工服务的实际 *** 作引起的。人工服务实际 *** 作效率低,容易出错,会造成额外的人力、物力和时间支出。
能源消耗管理方法的挑战
根据气候变化新闻的报道,17年,全球大数据中心的电力工程总消耗占全球电力工程需求的3%,预计2030年这一比例将达到20%。此外,据调查,大数据中心能耗占OPEX(运营费用)的35%,OPEX的快速提升成为“世界性难题”。客户对能耗管理方式的需求主要体现在如何设计一个可靠的能耗管理模式,能够高效的节约能耗。以及如何对能耗进行合理的分析和预测,这对于大数据中心的精准项目投资尤为重要。
常见故障和诊断挑战的预警信息
在传统的运维模式中,运维人员主要是主动等待问题出现,然后解决常见故障。传统运维模式下,平均维护效率50~100台。
随着大数据中心运营规模的不断扩大,常见故障将会更加频繁地出现,常见故障之间的关系也将更加复杂,传统方法的维护效率将会进一步降低。另外,按照传统的报警上报的维护方式,需要达到严重阈值才能上报问题,业务流程结束是必然的。在这样的背景下,客户层面99.95%以上的服务水平都无法保证。
人们应该如何解决这样的挑战?
Gartner在2017年明确提出了智能运维(AIOps)的定义。2017年AIOps的部署率不到5%,但今年AIOPS的全球部署率将达到25%。智能运维发展迅速。AIOps运维服务平台具备以下11项能力:包括历史时间数据库管理、流数据库管理、系统日志数据信息获取、数据网络获取、优化算法数据信息获取、文本和NLP文本文档获取、自动化技术实体模型的检测和预测分析、异常检测、根本原因分析、按需交付和软件技术服务交付能力等。这种能力的定义显示了许多有目的的对策来处理令人困惑的问题,它是当今大数据中心的大量服务器管理方法。
▲智能运维概述【Gartner2016】
智能运维是一个长期进化的全过程。由此可见,智能运维重在基于大量设备数据信息的检查、预测和分析,从一般的攻击运维转向主动运维,这是手机软件提升的关键。但实际上,在部署、环保、节能、常见故障管理方法等行业,软硬件的配合是维持质量提升不可或缺的。
智能服务器是集成运维平台软件、BMC手机软件、智能集成ic的软硬件整体解决方案。这种软硬件整体解决方案的优势是什么?
与传统服务器和OEM服务器相比,智能服务器具有智能管理方法的功能,如单机级别的常见故障预测和分析、智能能耗管理方法等。此外,页面的实际 *** 作更加个性化和智能化,降低了运维人员的维护成本,提升了运维体验。此外,智能服务器适合维护人员根据手机的蓝牙和WiFi在近端连接服务器运维系统软件,在服务器部署和常见故障的准确定位和排查上表现出极大的便利性。
智能服务器基于部署和维护场景特征分析,显示一键WiFi网络热点按钮,维护人员到达现场后,按住WiFi网络热点按钮,使用手机App扫描服务器上的条形码连接服务器 *** 作互联网,快速维护维护服务器的框架信息内容并发布设备实际运行情况,或者根据手机App呈现的流水线具体指令和常见故障清单进行流水线作业和检修。
相比智能运维,智能服务器呈现的是适合智能管理方式的云 *** 作系统,极大丰富了智能运维场景。在很多场景下,运维人员不得不手动做出的短板点,并不是因为海量信息中隐藏了合理的信息内容,而是硬件配置本身与智能管理方式不兼容。智能服务器连接硬件和软件,从源头上处理一些运维场景下仅靠手机软件无法处理的问题。此外,由于硬件配置集成ic能力的提升,服务器本身可以共享部分智能运维能力,服务器的管理方式更加即时高效;服务器收集的硬件信息也会更加全面,可以为运维服务平台的管理决策提供更加可靠的参考。
针对能耗管理方法,智能服务器集成了动态CPU广播、散热风扇变速、开关电源休眠状态等功能。晚上业务流程负载较低时,客户将能耗物理模型设置为环保节能模式,智能服务器动态调整CPU频率限制输出功率标准值,另外部分开关电源进入睡眠模式,进一步节省能耗。当日常业务流程负载较高时,客户将能耗模式设置为高性能模式,智能服务器消除了CPU广播的限制和开关电源的休眠状态。此外,散热风扇应用性能卓越的热管散热规格,环保节能对策智能联动。单台机柜服务器预计节能环保10%以上。智能能耗管理系统还展示了服务器机柜级能耗的智能控制。根据历史输出功率,强烈推荐合适的输出功率,构建价值标准。在典型的业务场景中,单个机柜服务器的相对密度可以提高10%以上。
智能服务器继承了当前智能运维的角色,为智能运维的演进提出了新的方向。可以预期的是,根据智能服务器解决方案的实施,传统运维人员可以解决过去脚踏实地、重复劳动、使用价值低的日常事务,最大限度地将手工生产转变为智能化全自动的实际 *** 作,现场运维人力资源的高效率可以得到极大的提升。此外,智能能耗和常见故障管理方法可以尽快保证业务管理系统的承诺服务水平(SLA),为客户节省运营成本。
IDC发布天地发布日本智能服务器的数据只需要十几分钟!详情请联系在线客服!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)