现代生活,时间已经被拆分成“秒”来计算,我们提高效率用以压缩成本,快速的走路,快速的阅读,快速的搜索。科技的发展导致信息爆炸,同时也延伸出另外的技术,比如搜索功能的发明,储存硬盘的应用,良性的需求引发革新和创举,人类得此发展。现如今,企业如何在纷杂的信息和技术中选择最高效最性价比的解决方案呢我们不妨把目光投向新致公司推出的新致开发云。
新致是上海市的明星软件企业,是领先的信息技术服务供应商,自94年创立至今已经走过21个春秋,可以说是随着IT服务行业成长起来的,对于当前的信息技术行业形势,新致强调了云计算的重要性,相较于传统的服务行业,新致对于“云”的应用更加彻底:对于B端客户来说,信息时代要解决的是如何从传统构架转移云计算互联网构架,同时面临着应用重构、架构重构、基础设施重构等问题。相对于D端客户来说,需要颠覆传统的交付过程转化为以敏捷为核心的互联网交付。新致通过行业云解决B端行业客户的问题:提供全面的咨询、实施、运维服务;在IT基础设施方面提供可靠、安全、高效的IaaS服务;在行业应用市场中打造针对行业的应用圈。开发云则可以做到为D端客户提供免费的开发测试环境,企业通过行业云提供的行业paas能快速的搭建行业应用。
Saas和Paas在不同程度上变革了传统的软件开发功能,PaaS作为一服务,以Saas的模式提交给用户,降低了客户使用软件的门槛。行业云打造行业云应用生态圈,营造了行业云应用市场,其中囊括了最优秀的行业应用。同时提供了免费的云开发环境,在此基础上,凭借着自身安全可靠的云资源、高效的增值服务以及专业IT运维团队,大大降低了企业的运作成本。
谁说节约就不是一种收益呢同样的物产价值在相对高效或者便捷的平台下获得,对于与时间赛跑的企业或者日益激烈的市场竞争来说,无疑是可待开发的金库。
新致提供了免费的云开发环境,在此基础下,通过以业务驱动为核心的全栈式服务,帮助客户快速上云,此时良性的云应用生态圈帮助客户提供整体的解决方案,大大减低了时间成本。行业云使开发者从无门槛、低成本切换到高起点的互联网模式,不仅缩短了交付周期,同时提高了开发效率。新致云依托的云计算带来的好处显而易见,SAAS(软件即服务)通过浏览器把信息传输出去,进而省去了在软件授权和服务器上的开支,以达到减少成本的作用。
云计算作为一种能够提升IT灵活性和减少企业成本的有效径,大大的增加企业的竞争力,同时节约运作成本,受到了各方人士的重视。“云”自动化集中管理处理了大量现今企业无法担负的数据中心管理成本,同时资源的利用率也较之传统大大提高,新致还有开放的应用平台以及高效的运作团队,更多的选择造就了更多的商业机会。
无论如何,云计算时代带来的改变已经产生,信息技术正在用飞一般的速度发展,是依然谨小慎微的按着传统的方法前进还是大刀阔斧的利用“云”来进行掘金,并不是一个难以决断的问题。
提高静态稳定性的措施也可以提高暂态稳定性,不过提高暂态稳定性的措施比提高静态稳定性的措施更多。提高暂态稳定性的措施可分成三大类:一是缩短电气距离,使系统在电气结构上更加紧密;二是减小机械与电磁、负荷与电源的功率或能量的差额并使之达到新的平衡;三是稳定破坏时,为了限制事故进一步扩大而必须采取的措施,如系统解列。提高暂态稳定的具体措施有: (1)、继电保护实现快速切除故障; (2)、线路采用自动重合闸; (3)、采用快速励磁系统; (4)、发电机增加强励倍数; (5)、汽轮机快速关闭汽门; (6)、发电机电气制动; (7)、变压器中性点经小电阻接地; (8)、长线路中间设置开关站; (9)、线路采用强行串联电容器补偿; (10)、采用发电机-线路单元结线方式; (11)、实现连锁切机; (12)、采用静止无功补偿装置; (13)、系统设置解列点; (14)、系统稳定破坏后,必要且条件许可时,可以让发电机短期异步运行,尽快投入系统备用电源,然后增加励磁,实现机组再同步。
我们面对新的观点、新的思想,作为职业人士,更多的需要学习、理解并加以灵活运用,这也体现对企业文化的融合和认同。
但是,切不可盲从,盲从就会活在他人的世界里,失去对事物的预判能力;相反,要养成独立思考的习惯,进行深度思考,探索背后的本质,这样的目的不是为了驳斥与反对,而是先人一步,洞见未来。
我们曾总结过,IT系统的主要价值包括精确地呈现数据、固化流程、防呆提效等;反过来,如何提练出IT价值的评估要素,以之为牵引,倒逼业务改善呢?
例如:IT评估要素主要可以包括业务IT覆盖率、方法工具沉淀占比、指标报表导出率、异常移动提示率等维度。其中:
指标报表导出率、异常移动提示率可以理解为数据(报表、指标)的提取和应用,这符合数字化企业建设和经营的思想,利用IT具实现数据可视、简单高效,形成数据文化,数据驱动决策和战略;
但是,数据是来源于业务流,来源于业务底层,确保数据的及时性、客观性是数据应用的基础;同时,如果指标、报表设计不合理,偏离客户导向,会促使管理层为了数据而数据,甚至弄虚作假,背离初衷。
方法工具沉淀占比是比较好的导向,鼓励发明方法工具、全员创新,形成规范体系,并通过IT固化,将好的经验进行传承。
而业务IT覆盖率是比较重要的一个指标,它体现了企业经营活动IT的支撑程度,业界也形成了一些标准的方法论,如流程梳理五步法,然后,在此基础上来进行IT覆盖的判定,决定IT项目的投入。
但这里要特别注意的是,如果基于现状流程审视IT的投入和价值,会是一个根本性的错误。无数经验表明,流程变革(再造)才是产生价值的核心,业务IT覆盖要基于变革后的流程,而非现状。
当然,我们既不能为了流程而流程,也不能为了IT而IT,支持经营目标,打造组织能力才是核心。
阿里妹导读:测试环境是研发/测试同学最常用的功能,稳定性直接影响到研发效率,那如何提升测试环境的稳定性?阿里巴巴应用与基础运维平台高级开发工程师张劲,通过阿里内部实践,总结了一套测试环境稳定性提升方法,供大家参考。
痛点每一次容器申请失败直接造成研发测试停滞,同时带来答疑及问题排查(程序猿最怕的就是在代码写得正嗨的时候被人给打断,所以一般我都带耳机),涉及到测试链路上各个系统。随着集团pouch化的全面推进,半年来测试环境日容器申请量暴增10倍以上,低成功率导致研发低效的问题越来越凸显,每天累计造成集团上百小时的研发测试停滞,损失不可接受,也渐渐成为了pouch化推进过程中的一个阻力。因此,测试环境稳定性亟待大幅提升。经过答疑汇总和错误分析,主要集中在两个方面:已成功申请的资源不可用测试环境宿主机较差(过保机器),且虚拟比高,容易发生故障。宿主机故障时,其上的容器不会被自动迁移,很可能导致再次部署重启时失败。调度系统巡检会将故障宿主机置为不可调度,由于其上仍有容器,不能下线修复后重用,造成机器资源越来越少。新申请资源时成功率低测试环境机器被分为优先级不同的资源池,资源池间机器资源不共享。测试环境机器的容量/余量不透明,没有告警,造成因资源不足的调度失败。因为测试环境与线上环境有很大不同,资源调度系统之前没有针对测试场景优化,成功率不高。目标容器申请成功率:999%方案
指标数据从一开始我们就觉的数据非常重要,没有相关的稳定性数据,那我们就无的放矢,根据数据我们就能找到需要优化的点以及持续优化的动力。所以项目开始阶段就做了挺长时间的数据收集工作。测试环境链路数据收集:从上至下包括Normandy(基础应用运维平台),黄蜂(资源申请平台),Zeus(二层调度),Sigma(集团资源调度系统);其中我们最关心的就是最终容器交付的成功率,以及失败case。失败case可以帮助我们分析整个系统中到底哪些地方存在问题,成功率趋势则帮助我们检验新的修复优化是否真的有效且稳定,也是最终成果的衡量指标。测试环境链路稳定性数据展示平台:其实上下游的每个系统都有自己的数据,但是没有整合,有的用阿里表哥,有的是发邮件,有的则没有展示出来,所以做这样一个小东西的目的就是将上下游系统的数据统一整合在一个页面上,更便于查看分析问题。每日/周/月错误分析:收集每天的错误数量及样例,便于分析问题。已申请容器不可用容器自动置换容器自动置换是为了解决已申请的容器不可用问题,简单来说就是在另一台好的宿主机上扩一个新容器,然后将原来在故障宿主机上的旧容器下线。整个流程如下:Sigma(资源调度系统)自动巡检出故障宿主机(比如磁盘满/硬件故障等),通知Atom(故障机替换)置换该故障宿主机上容器,Atom向Normandy(基础应用运维平台)发起机器置换流程。通过自动置换将故障机腾空,然后下线修复。新申请容器失败合理化资源池分配
屏蔽底层系统失败因为测试环境与线上环境差异很大,一般测试环境使用的机器都是线上淘汰机,同时为了节省预算,每台宿主机的虚拟比都很高,导致在创建和使用容器时都特别容易失败,所以有必要做一个容器buffer池屏蔽掉底层失败对用户的影响。buffer池的整个逻辑非常简单清晰:在测试环境容器生产链路靠近用户的一端嵌入buffer池,预生产一批容器,在用户需要的时候分配给他。即使申请buffer容器失败,依然可以按原生产链路继续生产容器。每次从buffer池申请一个容器后,buffer池会自动异步补充一个相同规格的容器进来,以维持buffer池的容量。如何确定buffer哪些规格的容器及池子的容量是另一个关键点:需要统计每种规格-镜像-资源池的历史申请量,按比例分配每种buffer的容量。同时为了保证即使在底层系统中断服务时,整个系统依然对用户可用,还需要确定高峰期的容器申请量,可允许中断时长以及测试环境机器资源,用来确定整个buffer池子的容量。还需要考虑的一点是,用户也分为普通用户(研发测试人员),系统用户(比如自动化测试系统等),他们的优先级也不同,需要优先保证普通用户可用。同时为了最大程度的降低引入buffer池后可能对用户造成的影响,buffer池内加了许多动态开关,用于及时屏蔽某些功能。比如可针对具体应用设置是否需要修改容器主机名,此 *** 作非常耗时,如果不改主机名,则平均不到1秒内会申请成功;如果某个应用不想使用buffer,也可立即屏蔽;如果buffer池本身出现问题,可以快速降级,在整个链路中去掉buffer功能。另外buffer池在交付buffer容器前会额外做一次检查,判断容器是否可用,避免容器交付后,因为容器不可用而导致的服务部署失败,用户使用不了等问题。buffer池内部也会定期清理脏容器(不可用,数据不一致等)和补充新的buffer容器。总结
上图展示测试环境最近2个月的容器申请成功率趋势,包括buffer池全量前后一个月。从图中可以看到,11月末12月初的两天成功率极低,均是因为调度失败,之后根据资源池余量预测及报警及时调整了各个资源池的容量,提前消除了调度失败的可能,在此之后,成功率波幅都减少很多。另一点,从buffer全量后,成功率波幅明显比buffer全量前大幅减小,波动次数明显减少,成功率趋于稳定。buffer池全量后的一周内,由于buffer池内部的bug以及buffer命中率较低,成功率浮动较大,在bug修复以及提高buffer池命中率后,成功率基本稳定。
上图展示近两个月的每日成功率趋势图,纵向对比了用户视角(有buffer)与底层系统视角(无buffer)。从图中可以看出,buffer池确实屏蔽了许多底层系统失败,除了其中一天buffer池被穿透导致成功率大跌。展望虽然经过一系列改造优化后,成功率有了明显的提升,但是依然有很多地方需要完善:资源池容量自动调配:目前算法简单,有些情况无法解决,比如大规模的新增或删除容器造成对余量趋势的误判。另外也要避免引入自动调配后造成宿主机标签的混乱。buffer池模版动态的增减以及每种buffer的数量动态变化。当前buffer池一个难题就是如何覆盖到低频的应用镜像,这种镜像虽然低频但是容易申请失败,一旦这种容器大量申请,容易穿透buffer池,造成大量失败。扩大buffer池的容量,需要根据机器资源伸缩。除了对以前工作的完善,测试环境依然有许多要做的事情:比如如何提高整个测试环境资源的利用率,如何减少容器交付耗时(从用户申请到用户可用),如何推动应用的可调度化等等,希望能够和大家一起探讨。
以上就是关于新致云如何更好的在云计算时代提高服务的可用性和稳定性全部的内容,包括:新致云如何更好的在云计算时代提高服务的可用性和稳定性、哪种措施对提高系统稳定性没有效果、破界突围之路:如何提升IT系统的价值(一)等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)