网上找到的一个教程
数据中心管理软件之Intel DCM平台概述
对于数据中心的节能减耗、监控和管理,是数据中心的运维管理者们最为关心的问题。那么数据中心IT系统内部需要监管哪些内容
通常来讲,监控的目的在于保护数据中心内IT系统的正常、有效运行,在事故发生之前侦测出潜在危机。因此,数据中心监管核心应该是对IT系统运行状态的监控,而最直接有效的监控应该是直接对IT设备运行状态进行监控。
例如,服务器内风扇转速与CPU温度等是最直接、最迅速影响IT设备正常运行的因素。有时候即使数据中心内空调运转正常,整体环境参数值也在预设范围内,但某服务器却因为某种原因出现服务器内风扇的转速不正常、CPU过热,事实上,温度、状态等都是需要监管的。
我们都知道,单靠人工是不可能完成的,那么依靠IT设备自身的监管功能,也必将面临每台服务器都有自己的监控和管理界面,这对数据中心监管的最终需求--降低能耗来说,并不是什么好事情。那么,怎样帮助数据中心的CIO们解决这种难题呢
英特尔数据中心管理平台IntelDCM
英特尔在09年春季IDF上,正式发布英特尔数据中心管理平台软件技术,可以实时监控、管理和优化数据中心的功耗。作为此前刚发布的至强 5500系列处理器新产品组件之一,英特尔数据中心管理平台将充分利用其强大的平台性能,结合英特尔节点管理器技术,为用户提供最优的数据中心能耗管理方案。
这款数据中心管理平台,得到了美国服务器制造商Supermicro公司,国内服务器制造商浪潮和宝德,以及国内IT运维管理软件开发商游龙科技支持。
DCM(数据中心管理产品)应具备三大基本功能,即监测、管控和报表。英特尔数据中心管理平台 (IntelDataCenterManager)是监控、管理数据中心的机架和服务器组电、热等能耗的软件技术,IT部门利用它来实现提高机架密度、降低能耗与散热成本,从而优化机房布局并轻松获益。
监测:实时采集能源信息,包括服务器功耗和温度等能耗信息。
事实上,在以前,这些信息是无法得到的,即便是得到,也不是精确值。任何的管理第一步必定是监测,可以说,没有监测就没有管理。要控制温度,就要先测量温度;要管理功耗,要要先测量到功耗的信息。
管控:配置能源使用策略,管理服务器集群的功耗。
用户可以根据数据中心的情况,优化并使用策略。这意味着,在服务器上,用户第一次有能力对服务器功耗使用策略。并且,能源使用策略,可以对整个数据中心进行优化配置。
报表:通过对能源使用报表的分析,帮助用户梳理能源消耗的时间、地点等信息。
事实上,报表无非就是日志分析功能,其意义在于,数据中心的运维管理者们,关注的是什么时候消耗最大能源,什么地方消耗能源最集中,如果这些问题由报表自动生成,那么管理者就有据可依,可以帮助他们更好的把握和选择最合适的能源使用策略。
为了发挥最好的性能,安装英特尔数据中心管理平台的服务器至少需要:一个双核的26Ghz或更高的处理器,4GBRAM,60GB硬盘空间。
IntelDCM平台特点
英特尔数据中心管理平台支持所有具备英特尔节点管理器并能够通过基板管理控制器(BMC)发出英特尔节点管理器IPMI规范命令的原始设备制造商(OEM)平台。该技术专门提供在不影响工作性能的同时进行的服务器组能源管理。为了达到这一目标,英特尔数据中心管理平台为每一台独立的服务器动态调整能耗标准以适应该服务器工作量的变化、使用率和由此改变的能源需求量。我们现在正在大型企业和主要网络数据中心中进行广泛测试。
IntelDCM平台应用场景
英特尔数据中心管理平台能使您的机架在当前功耗和温度范围内,存放更多设备,最大程度优化机架密度。
结合英特尔节点管理器(IntelNodeManager)技术,不受 *** 作系统限制,便捷管理数据中心。
IntelDCM调整数据中心能耗
根据服务器的优先级别动态分配电源,使用实际的和观察到的数据,重新估计和设计数据中心的制冷系统和电源供给。通过分析供电和负载,诊断机架空间的使用效率,观察数据中心供电系统和高温异常等情况,并及时提醒用户。
IntelDCM带来的实际价值
首先是节约能源,节约功耗。显而易见,通过监控、管理和报表功能,可以很好地帮助管理者们找到能耗的热点,并对热点能耗进行有效的管控。据张泽军介绍,可以节约15-20%的能源消耗。
举例来说,如果没有对CPU温度、频率等信息进行监管,可能当下班时,服务器使用率就降低,可CPU的28G主频还在运行,这时就有必要动态的给CPU降低频率,而功耗也就大幅降低。
其次,可以增加机房和机架密度,节约空间。事实上,更多的情况不是空间受限制,而是能耗受限制。比如42U服务器,放不满机架,因为提供机架的能源、电源不够。而通过数据中心管理平台,可以增加每个机架的密度,能源动态分配,充分利用机架空间,增加机房和机架的密度。这也达到了节约能耗的目的。
在数据中心管理中,还有一个不能忽视的趋势。由于虚拟化的普及和应用,包括数据中心在内的管理软件市场,必将涉及虚拟机的管控。显然,虚拟机消耗的资源,消耗的CPU、能源、内存等,也是未来数据中心管理中的一个难题。
英特尔数据中心管理平台功能一览表
配置数据中心层级 从配置管理器(CMDB)或者其他资产数据库中通过XML模型便捷地导入资产信息
数据中心合计和趋势 实时监控节点能耗和入口温度数据,汇总所有能耗和温度数据并提供给用户或既定团队,为优化管理策略储存相应的历史数据信息
制定警报 在制定能耗和热能事件的基础上接收警报。通过自定义各种策略改变能耗上限来自动处理事件
智能控制能耗上限 根据基于可用资源的工作量的变化动态地管理能耗预算,同时支持多个有效策略,自动管理机架和服务机组能耗,并提供应对紧急情况的防护
策略可配置性 根据时间规划调整能耗上限策略和数据中心的切实环境。
无需代理软件管理 Intel DCM不需要在能耗管理节点上安装任何代理软件。
易集成 易共存 Intel DCM可以存在于一个独立的服务器,也可以与其他管理软件共存于同一台服务器
高扩展性支持 管理服务器可以管理多达5000个节点
名词解释:什么是英特尔节点管理器
英特尔节点管理器位于IntelNextGenerationServerChipsetplatforms(英特尔下一代服务器芯片 Nehalem-EP平台)。它为独立的服务器提供能耗温度监控和基于各种策略的能源管理。它可以通过基于规范IPMI协议的接口、由支持的基板管理控制器(BMC)使用。它需要一个类似PMBusTM的仪器供电源。
LT16064是完全集成的4通道数字电源控制和监控IC,可连接至四路电源提供完整的数字编程。LT16064可以连接到电源基准输入、反馈节点以及输出使能,提供电源跟踪、软启动、排序、裕量调节以及动态控制输出电压等功能。
电源排序功能可自主运行或通过PMBus™接口控制。断电和上电过程提供受控的电源排序。多个LT16064可组合使用,以便为更多电源提供自主排序。电源顺序要求可以存储到外部配置的EEPROM,无需改变PCB布局即可重新更改排序。
LT16064具有内部温度传感器,提供更高级别的系统监测。其它特性包括:复位输出和SMBus™报警输出。
LT16064的每个通道具有一路高精度、12位模/数转换器(ADC)输入和一个差分放大器,用于精确监测、报告负载电压,不受地电位差的影响。内部集成12位数/模转换器(DAC)用于电源裕量调节,并可通过闭环控制系统动态调节输出电压,输出电压精度为±03%。
用户可编程寄存器提供灵活、精确的与时间相关的事件控制,例如:延迟时间和过渡时间,监测过压、欠压、过热故障,并可相应处理报警。可对闭环工作状态进行编程,确保LT16064与任何现有电源能够协同工作,提供精确电压控制和裕量调节。
MAX16064采用PMBus兼容通信协议。可以按照该协议或从Maxim网站下载免费的图形用户界面(GUI)对器件进行编程,加快开发进程。
LT16064采用节省空间的36引脚、6mm x 6mm、TQFN无铅封装,工作在-40°C至+85°C温度范围。
关键特性
精确的电压输出控制(AVOC)能够以±03%的精度控制输出电压
PMBus接口用于电源编程、监控、上电和断电排序以及裕量调节
提供输出电压和温度监测,可调节监控频率
可编程软启动和软停止斜率
可使用REFIN或FB端实现电源控制
主从时钟选项可为多个器件提供精确定时参考
外部EEPROM接口用于上电时自动设置
30V至36V工作电压范围
6mm x 6mm、36引脚TQFN封装
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)