一、建设背景
l 《重点用能单位能耗在线监测系统推广建设工作方案》(发改环资〔2017〕1711 号)
l 《关于加快推进重点用能单位能耗在线监测系统建设的通知》(发改办环资〔2019〕424 号)
行有嘉重点用能单位能耗在线系统建设方案是面向企业用户的能源管理平台需求提供系统解决方案。搭建能源管理系统平台,旨在与提升能源管理的自动化程度,实现企业能源信息的长期监测,为节能降耗提供直观科学的依据,为企业查找能源利用弱点,促进能源管理水平的进一步提高以及运营成行有嘉的进一步降低,保障能源运营的正常进行。
行有嘉重点用能单位能耗在线系统建设方案中,在功能分析中引用的图形界面仅供参考,根据不同的实际项目真实需求,行有嘉方案书中的能源管理系统界面并不是最终的用户界面。
行有嘉重点用能单位能耗在线系统建设方案结合常州行有嘉科技有限公司长期在能源管理行业的经验,以及在设计、应用、编程、调试等方面的优势,提供能源管理系统平台。该系统将结合行有嘉项目的具体需求进行信息集成整合,完成能源数据分析需用的在线、离线数据采集、监测、分析和展现,构建完整的能源管理系统。
二、建设内容
建设一套行有嘉重点用能单位能耗在线监测系统
能耗在线监测系统,是对企业能源转换、输配、利用和回收实施动态监测和管理的信息系统, 一般由能耗在线监测端设备、计量器具、工业控制系统、生产监控管理系统、管理信息系统、通信网络及相应的管理软件等组成, 通过能耗在线监测端设备实现数据采集、分析、汇总、上传等功能。
国家级平台与省级平台通过电子政务外网实现互通,各用能单位能耗采集端设备采集到的能耗数据通过互联网上传至国家级平台和省级平台,并通过互联网在其权限内访问省级平台。部级用户通过政务外网访问国家级平台,省、市级用户通过政务外网或互联网访问归属省级平台。如图所示:
行有嘉重点用能单位能耗在线监测
行有嘉系统总体上采用分层分布式体系结构,根据《重点用能单位能耗在线监测系统技术规范第1部分 总体架构规范(试行)》 “国家平台+省级平台+重点用能单位端系统”的架构搭建,在企业级系统中,按照纵向分为主站管理层、网络通讯层和现场测控层三大部分,如下图所示:
行有嘉能耗监测网络架构
行有嘉能耗监测系统功能架构
l 支持从现场的仪表通过Modbus(GB/T19582)、DL/T645、CJ/T188等协议采集需要的能耗实时数据,并进行汇总生成上报的能耗数据;
l 支持从能源网关、DTU、SCADA通过Modbus TCP(GB/T19582)、能耗协议等上传的能耗实时数据,并进行汇总生成上报的能耗数据;
l 支持从自动化信息系统通过OPC协议采集需要的能耗实时数据,并进行汇总生成上报的能耗数据;
l 支持手工填报数据:对于不具备在线采集条件的数据,提供手工填报数据上传;
l具有基础数据处理、行有嘉地存储功能,行有嘉历史数据可存储3年以上;
l 可根据项目情况录入企业基行有嘉信息、企业生产层级结构、计量器具档案信息、端设备信息、数据采集项信息等各类基行有嘉信息;
l 按照《NHJC-04-2018 重点用能单位能耗在线监测系统技术规范-端设备接口协议规范》的要求往国家或省级平台上传数据;
l 支持断线缓存,保证数据的连续性;
l 端设备平台方便用户使用、配置;
l 支持人工补录、远程升级;
l 用能数据集抄;
l 数据上传日志。
三、系统功能简介
能源管理平台是一个开放的、灵活的、功能强大的远程能源管理系统,通过动态WEB网页窗口管理和分析能源消耗。平台提供直观且支持多语言的显示界面,可以在最短的时间内不用过多培训便可以完全掌握利用该系统。系统主要针对厂区内部表计及其他智能化设备的监测管理,收集设备的数据信息,以提升厂区现有运营策略和管理为目的。
通过平台的建立,即通过设备运行参数进行收集、存储、分类、分析、计算、显示、报警等,供运行人员在设备运行时,实现适当的维护维修措施,保证设备优化运行,保证电表的可维护性与可用性。
平台采集设备的运行和能耗数据,采用多角度的分析方法与直观的展现方式,使客户对设备的能耗使用情况具有清晰而客观的了解,从而制定有针对性的节能策略与方案,最终达到提高能源使用效率,提升运行管理水平,减少运营成本的目的。
M6系列服务器是浪潮信息针对智慧时代的需求设计的,其精益的设计可以显著降低能源损耗,减低运维成本。具体来讲,M6系列服务器通过部件设计优化、PID算法智能温度调控技术等,有效提高散热效率,使高性能与低功耗兼得。其中的四路服务器NF8260M6采用更精细的系统化散热设计,大大提升了散热效率。据了解,单台服务器采用智能调控技术一年可节约近千度电,基于最新智能调控技术的百万台量级数据中心,一年可节约近10亿度电。针对问题:CPU利用率可以建模平均能耗,但是对于预测峰值粒度过粗。提出模型:表征服务器利用率和电源行为之间的关系,对实际峰值功耗建模。引入新的 *** 作系统指标,捕获所需信息,以较低的开销设计峰值功率。
如今,数据中心运营商普遍以几十分钟到几小时的采样间隔收集实用跟踪信息。 由于存储和处理的开销,对成千上万的服务器禁止更细粒度的采样。 例如,对于1000个节点的群集,以OS调度程序的粒度(100Hz)采样将每周产生225 GB数据。
要确定服务器的峰值功率,就要了解服务器 开关模式电源单元(SMPSU插座式电源) 的行为。这些设备效率很高,但是依赖于开关和电荷存储机制,从而将 RC(电阻-电容)行为 引入了功耗。我们的贡献是将服务器的 *** 作系统视图与电源能耗峰值相连接。
介绍一个易于采集的 *** 作系统级别的度量(30ms),该度量可确定一段时间内的峰值功耗。通过模型合并SMPSU的RC行为,并以较低的开销跟踪峰值功率。这种机制可以记录随时间变化的峰值功率,并有助于大规模数据中心能耗供应研究。
贡献:
说明了以细粒度采集利用率所面临的挑战,以及峰值和平均度量之间的重要差异。
服务器开关电源单元的特性及其能耗与服务器利用率之间关系的解析信号处理模型。
一种新的 *** 作系统级度量标准,可捕获峰值功率信息以用于服务器检测。
通常PDU会被过度配置,预配置容量远高于平均负载。
功率上限power capping是一种数据中心级别的技术,可以对服务器的峰值功耗(例如,使用控制回路)进行硬限制。节流服务器电源DVFS(通过频率/电压缩放)用作安全机制,以确保不超过最大功率水平并且断路器不跳闸。使得PDU和其他电源供应基础架构就可以得到超额订购,从而降低了有效的资本成本。由于负载/功率峰值很少,因此节流性能几乎没有损失。通过使用电源路由可以进一步降低资本成本,这可以在负载不平衡时在PDU之间转移负载。
所有这些技术都需要软件机制来跟踪和预测峰值功率,以管理每个服务器,电路和PDU的功率预算,同时最大程度地降低性能节流。尽管可以通过显式计量和记录来跟踪峰值功率,但是直接从 *** 作系统级别的指标评估峰值功率可以大大降低成本。要从 *** 作系统级别的指标推断和记录峰值功率,我们必须了解服务器电源的 *** 作及其与利用率的关系。
服务器中SMPSU设备的行为以及其与OS观察到的利用率的关系。
研究对象: 两种不同的系统:具有便宜商品PSU(“商品”)的小型系统和具有企业级PSU(“服务器”)的大型系统。 由于SMPSU的设计不同,这些系统在行为上存在一些差异。 但是,与预测峰值能耗方面相似。
商品PSU的峰值传输电流比服务器更明显。 这种差异是由于在高端设备中常见的第一级额外开关调节,用于产生更连续的电流。
使用工作负载SQUARE观察 利用率 变化 频率 的影响。使内核在 矩阵乘法 与处理器 空闲模式 之间切换,使系统利用率产生方波。工作负载的 占空比(占空比是指在一个脉冲循环内,通电时间相对于总时间所占的比例) 固定为50%,平均利用率为50%。改变方波的频率,并观察PSU的响应。
使用工作负载STEP表征 利用率变化和PSU响应之间的延迟 。使系统处于空闲状态,等待直到PSU行为达到稳定状态。然后在所有内核上进行矩阵乘法。由于无法直接从外部观察CPU利用率,因此在过渡到在示波器上开始计时之前立即发送了一个信号(使用比预期的SMPSU响应快得多的通用I / O)。
图5表明:调制频率对观察到的功率波形有很大影响。 只要对CPU的利用率进行缓慢调制,功耗的包络就大致类似于方波,与CPU的行为相匹配。 然而,随着频率增加,功率消耗变得更加均匀。
对SMPSU峰值进行建模,以细粒度(在许多系统的内核调度间隔附近)监控利用率。
使用STEP工作负载研究SMPSU电源负载的相位延迟。 瞬时功率响应存在一个延迟,该延迟随着RC滤波的阶跃函数的期望而增加。 图示利用率转换的I / O信号(“trigger”)以及隐含的利用率波形(“ Utilization”)。 最后,我们显示了一个已过滤(“filter”)的阶跃函数,该函数适合观察到的上升波形。 该信号由具有界限频率30 Hz的一阶RC滤波器产生。
低于20HZ的更细微的变化会被电源的RC行为过滤掉,因此不考虑。 通过对SMPSU的运行及其与服务器利用率的关系的新了解,我们构建了一种开销低的方法,可以从 *** 作系统内核的利用率中推断出峰值功率。 然后,我们使用真实的机器验证我们的模型,并表明我们可以预测峰值功率曲线,且误差低于20%。
实验设置:两种服务器配置验证能耗模型。
在系统执行Linux内核的并行编译时收集能耗,该工作负载产生了混乱的突发使用模式。
瞬时能耗(“实测”)。预测能耗(“ Predicted”)很好地跟踪能耗峰值,但有时能耗仍然超出预测值。 幸运的是,该模型趋于保守,并且高估的能耗多于低估的能耗。 因此,它将在例如功率预算/封顶研究中提供保守估计。 商品计算机和服务器计算机的标准化均方根偏差(NRMSD)分别为14%和19%。
总结
1使用CPU利用率对服务器的峰值功耗建模。
2描述了OS级利用率与现代服务器中SMPSU行为之间以前被忽略的关系。
3通过测量真实的服务器PSU,证明必须以 33 ms或更低的粒度监视利用率以预测峰值功率 。 我们基于轻量级PSU的RC行为的信号处理启发模型,介绍了OS级解决方案,并演示了峰值功率可以近似在20%的NRMSD之内。能看到。
通过前面板的液晶交互式面板可以看到服务器的实时功耗,也可以通过iDRAC卡进行监控。
Dell对服务器(DELL PowerEdge)的管理主要提供了三种管理工具,分别是Dell Remote Access Controller(IDRAC)、OpenManage Server Administrator(OMSA)和OpenManage Essentials(OME),这些管理工具都依赖于集成戴尔远程访问控制卡(iDRAC)。
远程管理卡是安装在服务器上的硬件设备,提供一个以太网接口,使它可以连接到局域网内,提供远程访问。这种远程管理基于BMC(底板管理控制器),由集成在管理卡上的系统微处理器负责监测和管理 *** 作系统之外的服务器环境和状态。它既不会占用服务器系统的资源,也不会影响服务器系统的运行。iDRAC又称为Integrated Dell Remote Access Controller,也就是集成戴尔远程控制卡,这是戴尔服务器的独有功能,iDRAC卡相当于是附加在服务器上的一台小型计算机,可以实现一对一的服务器远程管理与监控,通过与服务器主板上的管理芯片BMC进行通信,监控与管理服务器的硬件状态信息。它拥有自己的系统和IP地址,与服务器上的OS无关,是管理员进行远程访问和管理的利器,戴尔服务器集成了iDRAC控制卡,我们就可以扔掉价格昂贵的KVM设备了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)