京东活动系统--亿级流量架构应对之术_框架

京东活动系统是一个可在线编辑、实时编辑更新和发布新活动，并对外提供页面访问服务的系统。其高时效性、灵活性等特征，极受青睐，已发展成京东几个重要流量入口之一。近几次大促，系统所承载的pv已经达到数亿级。随着京东业务的高速发展，京东活动系统的压力会越来越大。急需要一个更高效，稳定的系统架构，来支持业务的高速发展。本文主要对活动页面浏览方面的性能，进行探讨。

活动页面浏览性能提升的难点：

1 活动与活动之间差异很大，不像商品页有固定的模式。每个页面能抽取的公共部分有限，可复用性差。

2 活动页面内容多样，业务繁多。依赖大量外部业务接口，数据很难做到闭环。外部接口的性能，以及稳定性，严重制约了活动页的渲染速度、稳定性。

经过多年在该系统下的开发实践，提出“页面渲染、浏览异步化”的思想，并以此为指导，对该系统进行架构升级改造。通过近几个月的运行，各方面性能都有显著提升。在分享"新架构"之前，先看看我们现有web系统的架构现状。

以京东活动系统架构的演变为例，这里没有画出具体的业务逻辑，只是简单的描述下架构：

2第二步，一般是在消耗性能的地方加缓存，这里对部分查库 *** 作加redis缓存

3对页面进行整页redis缓存：由于活动页面内容繁多，渲染一次页面的成本是很高。这里可以考虑把渲染好的活动内容整页缓存起来，下次请求到来时，如果缓存中有值，直接获取缓存返回。

以上是系统应用服务层面架构演进的，简单示意。为了减少应用服务器的压力，可以在应用服务器前面，加cdn和nginx的proxy_caxhe，降低回源率。

4整体架构（老）

除了前3步讲的“浏览服务”，老架构还做了其他两个大的优化：“接口服务”、静态服务

1访问请求，首先到达浏览服务，把整个页面框架返回给浏览器（有cdn、nginx、redis等各级缓存）。

2对于实时数据（如秒杀）、个性化数据（如登陆、个人坐标），采用前端实时接口调用，前端接口服务。

3静态服务：静态资源分离，所有静态js、css访问静态服务。

要点：浏览服务、接口服务分离。页面固定不变部分走浏览服务，实时变化、个性化采用前端接口服务实现。

接口服务：分两类，直接读redis缓存、调用外部接口。这里可以对直接读redis的接口采用nginx+lua进行优化（ openresty ），不做详细讲解。本次分享主要对“浏览服务”架构

在讲新架构之前先看看新老架构下的新能对比

击穿cdn缓存、nginx缓存，回源到应用服务器的流量大约为20%-40%之间，这里的性能对比，只针对回源到应用服务器的部分。

2015双十一，浏览方法tp99如下：（物理机）

Tp99 1000ms左右，且抖动幅度很大，内存使用近70%，cpu 45%左右。

1000ms内没有缓存，有阻塞甚至挂掉的风险。

2新架构浏览服务新能

本次2016 618采用新架构支持，浏览tp99如下（分app端活动和pc端活动）：

移动活动浏览tp99稳定在8ms, pc活动浏览tp99 稳定在15ms左右。全天几乎一条直线，没有性能抖动。

新架构支持，服务器（docker）cpu性能如下

cpu消耗一直平稳在1%，几乎没有抖动。

对比结果：新架构tp99从1000ms降低到 15ms，cpu消耗从45%降低到1%，新架构性能得到质的提升。

why!!!

下面我们就来揭开新架构的面纱。

1 页面浏览，页面渲染异步化

再来看之前的浏览服务架构，20%-40%的页面请求会重新渲染页面，渲染需要重新计算、查询、创建对象等导致 cpu、内存消耗增加，tp99性能下降。

如果能保证每次请求都能获取到redis整页缓存，这些性能问题就都不存在了。

即：页面浏览，与页面渲染异步。

理想情况下，如果页面数据变动可以通过手动触发渲染（页面发布新内容）、外部数据变化通过监听mq 自动触发渲染。

但是有些外部接口不支持mq、或者无法使用mq，比如活动页面置入的某个商品，这个商品名称变化。

为了解决这个问题，view工程每隔指定时间，向engine发起重新渲染请求-最新内容放入redis。下一次请求到来时即可获取到新内容。由于活动很多，也不能确定哪些活动在被访问，所以不建议使用timer。通过加一个缓存key来实现，处理逻辑如下：

好处就是，只对有访问的活动定时重新发起渲染。

整理架构（不包含业务）：

view工程职责：

a直接从缓存或者硬盘中获取静态html返回，如果没有返回错误页面。（文件系统的存取性能比较低，超过 100ms级别，这里没有使用）

b根据缓存key2是否过期，判断是否向engine重新发起渲染。（如果，你的项目外面接口都支持mq，这个功能就不需要了）

engine工程职责：渲染活动页面，把结果放到硬盘、redis。

publish工程、mq 职责：页面发生变化，向engine重新发起渲染。具体的页面逻辑，这里不做讲解

Engine工程的工作就是当页面内容发生变化时，重新渲染页面，并将整页内容放到redis，或者推送到硬盘。

View工程的工作，就是根据链接从redis中获取页面内容返回。

3view 工程架构 ( 硬盘版)

两个版本对比

aRedis版

优点：接入简单、性能好，尤其是在大量页面情况下，没有性能抖动。单个docker tps达到 700。

缺点：严重依赖京东redis服务，如果redis服务出现问题，所有页面都无法访问。

b硬盘版

优点：不依赖任何其他外部服务，只要应用服务不挂、网络正常就可以对外稳定服务。

在页面数量不大的情况下，性能优越。单个docker tps达到 2000。

缺点：在页面数据量大的情况下（系统的所有活动页有xx个G左右），磁盘io消耗增加（这里采用的java io，如果采用nginx+lua，io消耗应该会控制在10%以内）。

解决方案：

a 对所有页面访问和存储采用url hash方式，所有页面均匀分配到各个应用服务器上。

b 采用nginx+lua 利用nginx的异步io，代替java io。

现在通过nginx+lua做应用服务，所具有的高并发处理能力、高性能、高稳定性已经越来越受青睐。通过上述讲解，view工程没有任何业务逻辑。可以很轻易的就可以用lua实现，从redis或者硬盘获取页面，实现更高效的web服务。如果想学习Java工程化、高性能及分布式、深入浅出。微服务、Spring，MyBatis，Netty源码分析的朋友可以加我的Java进阶qun：694549689，里面有阿里大牛直播讲解技术，以及Java大型互联网技术的视频免费分享给大家。

1具有1-5工作经验的，面对目前流行的技术不知从何下手，需要突破技术瓶颈的可以加。

2在公司待久了，过得很安逸，但跳槽时面试碰壁。需要在短时间内进修、跳槽拿高薪的可以加。

3如果没有工作经验，但基础非常扎实，对java工作机制，常用设计思想，常用java开发框架掌握熟练的可以加。

通过测试对比，view工程读本地硬盘的速度，比读redis还要快（同一个页面，读redis是15ms，硬盘是8ms）。所以终极版架构我选择用硬盘，redis做备份，硬盘读不到时在读redis。

这里前置机的url hash是自己实现的逻辑，engine工程采用同样的规则推送到view服务器硬盘即可，具体逻辑这里不细讲。后面有时间再单独做一次分享。

优点：具备硬盘版的全部优点，同时去掉tomcat，直接利用nginx高并发能力，以及io处理能力。各项性能、以及稳定性达到最优。

缺点：1、硬盘坏掉，影响访问。2方法监控，以及日志打印，需使用lua脚本重写。

无论是redis版、硬盘版、openresty+硬盘版，基础都是页面浏览与页面渲染异步化。

优势：

1、所有业务逻辑都剥离到engine工程，新view工程理论上永远无需上线。

2、灾备多样化（redis、硬盘、文件系统），且更加简单，外部接口或者服务出现问题后，切断engine工程渲染，不再更新redis和硬盘即可。

3、新view工程，与业务逻辑完全隔离，不依赖外部接口和服务，大促期间，即便外部接口出现新能问题，或者有外部服务挂掉，丝毫不影响view工程正常访问。

4、性能提升上百倍，从1000ms提升到10ms左右。详见前面的性能截图。

5、稳定性：只要view服务器的网络还正常，可以做到理论上用不挂机。

6、大幅度节省服务器资源，按此架构，4+20+30=54个docker足以支持10亿级pv。（4个nginx proxy_cache、20个view，30个engine）

从事开发已有近10载，一直就像寄生虫一样吸取着网络上的资源。前段时间受“张开涛”大神所托，对活动系统新架构做了一次简单整理分享给大家，希望能给大家带来一丝帮助。第一次在网上做分享，难免有些没有考虑周全的地方，以后会慢慢的多分享一些自己的心得，大家一起成长。最后再来点心灵鸡汤。。。

SpringBoot的cache缓存，是针对返回值的一种 *** 作

springboot使用redis做缓存时，默认只需要导入redis依赖，即可实现使用redis做缓存

不需要导入cache依赖

在启动类上加上 @EnableCaching 即可开启缓存功能

关于各个注解的使用，这里不再细说，网上详细的教程很多，这里主要讲一下如何指定过期时间

默认是永不过期，如果需要指定过期时间，则需要增加配置类

11 通过applicationyml配置redis的连接信息，springboot默认redis用的lecttuce客户端，如果想用jedis的话，只需要在pomxml中引入redis的时候排除在lecttuce，然后再导入jedis的jar包就好了，

12 打开mybatis plus的二级缓存，为true的时候是开启的，false是关闭二级缓存

13 编写缓存类继承Cache类，实现Cache中的方法

14 早xml中加上<cache>标签，type写你所编写二级缓存类的路径

0什么是Redis

Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API

---维基百科

1与其他用户状态保存方案比较

一般开发中用户状态使用session或者cookie，两种方式各种利弊。

Session:在InProc模式下容易丢失，并且引起并发问题。如果使用SQLServer或者SQLServer模式又消耗了性能

Cookie则容易将一些用户信息暴露，加解密同样也消耗了性能。

Redis采用这样的方案解决了几个问题，

1Redis存取速度快。

2用户数据不容易丢失。

3用户多的情况下容易支持集群。

4能够查看在线用户。

5能够实现用户一处登录。（通过代码实现，后续介绍）

6支持持久化。（当然可能没什么用）

2实现思路

1我们知道session其实是在cookie中保存了一个sessionid，用户每次访问都将sessionid发给服务器，服务器通过ID查找用户对应的状态数据。

在这里我的处理方式也是在cookie中定义一个sessionid，程序需要取得用户状态时将sessionid做为key在Redis中查找。

2同时session支持用户在一定时间不访问将session回收。

借用Redis中Keys支持过期时间的特性支持这个功能，但是在续期方面需要程序自行拦截请求调用这个方法（demo有例子）

下面开始代码说明

3Redis调用接口

首先引用ServiceStack相关DLL。

在webconfig添加配置，这个配置用来设置Redis调用地址每台服务用，隔开。主机写在第一位

1 <appSettings>

3

4 <add key="SessionRedis" value="127001:6384,127001:6384"/>

6 </appSettings>

初始化配置

static Managers()

{

string sessionRedis= ConfigurationManagerAppSettings["SessionRedis"];

string timeOut = ConfigurationManagerAppSettings["SessionRedisTimeOut"];

if (stringIsNullOrEmpty(sessionRedis))

{

throw new Exception("webconfig 缺少配置SessionRedis,每台Redis之间用,分割第一个必须为主机");

}

if (stringIsNullOrEmpty(timeOut)==false)

{

TimeOut = ConvertToInt32(timeOut);

}

var host = sessionRedisSplit(charParse(","));

var writeHost = new string[] { host[0] };

var readHosts = hostSkip(1)ToArray();

ClientManagers = new PooledRedisClientManager(writeHost, readHosts, new RedisClientManagerConfig

{

MaxWritePoolSize = writeReadCount,//逗写地链接池链接数

MaxReadPoolSize = writeReadCount,//逗读地链接池链接数

AutoStart = true

});

}

为了控制方便写了一个委托

/// <summary>

/// 写入

/// </summary>

/// <typeparam name="F"></typeparam>

/// <param name="doWrite"></param>

/// <returns></returns>

public F TryRedisWrite<F>(Func<IRedisClient, F> doWrite)

{

PooledRedisClientManager prcm = new Managers()GetClientManagers();

IRedisClient client = null;

try

{

using (client = prcmGetClient())

{

return doWrite(client);

}

catch (RedisException)

{

throw new Exception("Redis写入异常Host:" + clientHost + ",Port:" + clientPort);

}

finally

{

if (client != null)

{

clientDispose();

}

一个调用的例子其他的具体看源码

/// <summary>

/// 以Key/Value的形式存储对象到缓存中

/// </summary>

/// <typeparam name="T">对象类别</typeparam>

/// <param name="value">要写入的集合</param>

public void KSet(Dictionary<string, T> value)

{

Func<IRedisClient, bool> fun = (IRedisClient client) =>

{

clientSetAll<T>(value);

return true;

};

TryRedisWrite(fun);

}

4实现Session

按上面说的给cookie写一个sessionid

/// <summary>

/// 用户状态管理

/// </summary>

public class Session

{

/// <summary>

/// 初始化

/// </summary>

/// <param name="_context"></param>

public Session(>

redis做缓存的时候，怎么取出全部相同前缀的key，百度到很多都是keys,scan

获取当前库下的所有key

可以使用 keys 命令，keys支持模糊匹配，但是cpu使用率有点高。还有一种就是scan命令

设置一个set，在缓存的时候把数据的key存到这个set里面

代码如下，思路也清晰。读写部分if(redis){读取redis数据}else{数据库读取，存redis+设置超时时间}更新部分if(数据库update){更新redis+设置超时时间}

以上就是关于京东活动系统--亿级流量架构应对之术全部的内容，包括:京东活动系统--亿级流量架构应对之术、2022-03-12 SpringBoot 使用redis做缓存，设置失效时间以及序列化、Spring boot + Mybatis plus + Redis实现二级缓存等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/web/9290140.html

京东活动系统--亿级流量架构应对之术

发表评论

评论列表（0条）