新版本发布如何不影响线上呢?灰色发布,蓝绿发布

新版本发布如何不影响线上呢?灰色发布,蓝绿发布,第1张

很多企业升级服务器端应用,需要将源码或程序包上传到服务器,然后停掉老版本,再启动新版本。但是这种发布方式存在两个问题,一方面,在新版本升级过程中,线上的服务是中断的无法访问和使用的,另一方面,如果新版本有BUG或更新后发现有问题,升级失败,回滚起来也非常麻烦,容易造成更长时间的服务不可用。

以下内容转自网络,仅供本人自弊银己学习用,侵删,原文链接: https://blog.51cto.com/13886290/2162766 ,

为了解决这些问题,人们研究出了多种发布策略,下面我们一一介绍。

蓝绿部署

所谓蓝绿部署,是指同时运行两个版本的应用,如上图所示,蓝绿部署的时候,并不停止掉老版本,而是直接部署一套新版本,等新版本运行起来后,再将流量切换到新版本上。但是蓝绿部署要求在升级过程中,同时运行两套程序,对硬件的要求就是日常所需的二倍,比如日常运行时,需要10台服务器支撑业务,那么使用蓝绿部署,你就需要购置二十台服务器。

滚动发布

滚动发布能够解决掉蓝绿部署时对硬件要求增倍的问题。

所谓滚动升级,就是在升级过程中,并不一下子启动所有新版本,是先启动一台新版本,再停止一台老版本,然后再启动一台新版本,再停止一台老版本,直到升级完成,这样的话,如果日常需要10台服务器,那么升级过程中也就只需要11台就行了。

但是滚动升级有一个问题,在开始滚动升级后,流量会直接流向已经启动起来的新版本,但是这个时候,新版本是不一定可用的,比如需要进一步的测试才能确认。那么在滚动升级期间,整个系统就处于非常不稳定的状态,如果发现了问题,也比较难以确定是新版本还是老版本造成的问题。

为了解决这个问题,我们需要为滚动升级实现流量控制能力。

灰度发布

灰度发布也叫金丝雀发布,起源是,矿井工人发现,金丝雀对瓦斯气体很敏感,矿工会在下井之前,先放一只金丝雀到井中,如果金丝雀不叫了,就租液宴代表瓦斯浓度高。

在灰度发布开始后,先启动一个新版本应用,但是并不直接将流量切过来,而是测试人员对新版本进行线上测试,启动的这个新版本应用,就是我们的金丝雀。如果没有问题,那么可以将少量的用户流量导入到新版本上,然后再对新版本做运行状态观察,收集各种运行时数据,如果此时对新旧版本做各种数据对比,就是所谓的A/B测试。

当确认新版本运行良好后,再逐步将更多的流量导入到新版本上,在此期间,还可以不断地调整新旧两个版本的运行的服务器副本数量,以使得新版本能够承受越来越大的流量压埋漏力。直到将100%的流量都切换到新版本上,最后关闭剩下的老版本服务,完成灰度发布。

如果在灰度发布过程中(灰度期)发现了新版本有问题,就应该立即将流量切回老版本上,这样,就会将负面影响控制在最小范围内。

关于负载均衡的另一篇文章: https://www.jianshu.com/p/836a87355ea7

所谓灰度发布就是将软件新功能版本先发布到灰度区进行可控范围的验证,如果验证结果良好,再进行正式发布,否则回滚灰度区取消发布的一种可靠、可持续的软件发布方法。

灰度发布的核心思想是在不影响软件系统当前版本可用的情况下,对新版本功能进行验证后发布。

所谓灰度区,就是一个在生产环境创建出来的返游谨和生产环境版本相同的用于部署待验证新版本的环境。

对于前端客户端程序,推送并安装了待验证新版本客户端程序的客户群构成灰度区。

创建灰度区——> 流量控制——> 灰度区验证——> 正式发布/回滚

灰度区用来对新版本的部署及功能进行验证,灰度发布关键是需要将新版本部署到生产环境,经过验证后进行正式发布。那么在正式发布前,如何进行新版本的部署和验证?这其实是灰度区的创建的问题,那么如何创建灰度区呢?

典型的做法就是先将生产环境部分正在运行的集群节点退役,然后部署新版本,从而创建灰度区。在开始验证前禁止生产流量路由到灰度区。

可能的集群退役节点的选择方法有:

1)如果只有一个集群,那么可以选择集群里的小部分应用服务节点(如金丝雀发布选择金丝雀节点一样)。

2)如果有多个集群(如跨IDC多活系统),可以选择其中一个集群退役。

在同一个生产环境中,部署一套完全冗余的集群节点,用于部署新版本构建灰度区(类似蓝绿发布)。取决于冗余集群供给方法,从物理机、虚拟机到容器,其成本逐渐降低、灵活性逐渐提高。

灰度发布主要的验证方式是导入真实流量,那么如何将真实流量可控地引流到创建好的灰度区呢?

取决于采用的路由/负载均衡器(Router/Load Balancer)的类型不同,可以采用的引流方法不同:

使用灰度专用域名,将灰度域名配置指向灰度区。这种域名引流的方法要求使用灰度域名访问,增加了域名资源,对外部用户不一定适用。

可能的添加灰度信息到HTTP请求的方式有:

1)使用不同的URL Path, 如hello.com.cn/ canary /.....,这种方法的缺点是占用了URL path资源。

2)在HTTP Headers或者URL Querystring中增加灰度字段存储灰度信息。

3)基于原始HTTP请求的信息结合一定的路由策略进行灰度引流。如基于cookie里的用户信息,可实现如基于用户白名单、用户区域,或其他用户属性方式的引流策略。

根据上述方法添加的灰度信息,同时在负责七层路由的负载均衡器上基于灰度信息配置响应的引流策略实现引流。

一般的灰度需要进行:环境适应性验证、功能验证、性能验证及用户验证。

部署的程序能否正常启动,运行状态是否稳定;对基础架构资源(CPU,内存,IO,网络等)的使用是否正常;虚拟运行环境(如JVM等)运行是否正常等。

通过基础架构资源指标监控工具如promethues等对响应的指标进漏基行监控

通过集成APM工具如CAT,Zipkin,Pinpoint,Skywalking等进行应用程序状态进行监控验证。

通过冒烟测试验证程序基本功能;对新增功能和缺陷修复进行UAT;通过导入真实流量,对程序功能进行验证。

对应用/服务公开接口的RT,TPS进行监控验证。

导入真实流量,进行用户行为数据收集,对用户行为进行分析;对真实用户流量访问产生的业务指标进行监控等;舆论监控等。

当验证结束,需要正式发布,正式发布的方式取决于灰度区是如何创建的。

如果是金丝雀发磨薯布的部署方式,首先,对灰度区恢复正式生产环境流量策略,然后滚动无损更新老版本节点。

如果是蓝绿冗余方式构建灰度区,修改路由配置直接将全量生产流量路由到灰度区,将灰度区转为处理生产流量的生产环境集群。

当灰度验证后决定取消发布,灰度区需要回滚。

金丝雀式部署方式需要对灰度区节点回滚,并恢复正式流量路由策略。

如果是蓝绿冗余方式构建灰度区,仅需要关闭灰度区生产流量引流。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8284630.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-15
下一篇 2023-04-15

发表评论

登录后才能评论

评论列表(0条)

保存