Java开发服务器的线程处理方式_服务器

在进行服务器处理的过程中，需要保证数据的正确处理，那么最重要的就是使用不同的数据处理模式进行运算。在整个过程中，可能很多人对服务器的知识并不了解，那么应该如何进行Java开发服务器的线程处理呢，关于线程处理有哪些知识？下面昌平北大青鸟为大家介绍关键服务器线程处理的简单知识。

1、BIO线程模型

在JDK14中引入JavaNIO之前，所有基于Java的Socket通信都使用了同步阻塞模式（BIO）。这种请求-响应通信模型简化了上层的应用程序开发上，但在具有性能和可靠性的情况下，存在一个巨大的瓶颈。在一段时间里面，大型应用程序服务器主要是用C或C++开发的，因为它们可以直接使用 *** 作系统提供的异步I/O或AIO功能。

当流量增加且响应时间延迟增加时，JavaBIO开发的服务器软件只能通过硬件的不断扩展来满足并发性和低延迟的情况，这极大地增加了企业的成本和群集大小。系统的不断扩展，系统的可维护性也面临着巨大的挑战，只能通过购买性能更高的硬件服务器来解决问题，这将导致恶性循环的产生。

2、异步非阻塞线程模型

从JDK10到JDK13，Java的I/O类库非常原始。UNIX网络编程中的许多概念或接口未反映在I/O类库中，例如Pipe、Channel、Buffer和Selector等。在发布JDK14的时候，NIO正式发布JDK作为JSR-51。并且它还添加了一个javanio包，为异步I/O开发提供了许多API和库。

3、RPC性能三原则

影响RPC的性能主要有三大元素，其中主要为I/O模型、协议及线程。

I/O模型：使用什么样的通道传递给另一方，BIO，NIO或AIO发送数据，IO模型在很大程度上能够决定框架的性能。

协议：应该使用什么样的通信协议，Rest+JSON或基于TCP的专用二进制协议。参加电脑培训的过程中发现，协议的选择不同，性能模型也不同。内部专用二进制协议的性能通常可以比公共协议更好地设计。

线程：如何读取数据报？在执行读取后的编解码器的哪个线程中，如何分发编码消息，通信线程模型是不同的，并且对性能的影响也非常大。

本文主要包括tomcat服务器的目录结构、工作模式、整体架构、I/O模型以及NIO、NIO2、APR三者的对比介绍。

我们先来看一下tomcat85和tomcat9中的home目录中的文件：

可以看到除掉一些说明文件之后，还有7个目录：

实际上除了主目录里有lib目录，在webapps目录下的web应用中的WEB-INF目录下也存在一个lib目录：

两者的区别在于：

●　Tomcat主目录下的lib目录：存放的JAR文件 不仅能被Tomcat访问，还能被所有在Tomcat中发布的Java Web应用访问
●　webapps目录下的Java Web应用的lib目录：存放的JAR文件 只能被当前Java Web应用访问

既然有多个lib目录，那么肯定就有使用的优先顺序，Tomcat类加载器的目录加载优先顺序如下：

Tomcat的类加载器负责为Tomcat本身以及Java Web应用加载相关的类。假如Tomcat的类加载器要为一个Java Web应用加载一个类，类加载器会按照以下优先顺序到各个目录中去查找该类的class文件，直到找到为止，如果所有目录中都不存在该类的class文件，则会抛出异常：

Tomcat不仅可以单独运行，还可以与其他的Web服务器集成，作为其他Web服务器的进程内或进程外的servlet容器。集成的意义在于：对于不支持运行Java Servlet的其他Web服务器，可通过集成Tomcat来提供运行Servlet的功能。

Tomcat有三种工作模式：

我们先从tomcat的源码目录来分析一下tomcat的整体架构，前面我们配置jsvc运行tomcat的时候，我们知道tomcat中启动运行的最主要的类是 orgapachecatalinastartupBootstrap ，那么我们在tomcat的源码中的java目录下的org目录的apache目录可以找到主要的源码的相对应的类。

图中的目录如果画成架构图，可以这样表示：

Tomcat 本质上就是一款Servlet 容器，因此 catalina 才是Tomcat的核心，其他模块都是为 catalina 提供支撑的。

单线程阻塞I/O模型是最简单的一种服务器I/O模型，单线程即同时只能处理一个客户端的请求，阻塞即该线程会一直等待，直到处理完成为止。对于多个客户端访问，必须要等到前一个客户端访问结束才能进行下一个访问的处理，请求一个一个排队，只提供一问一答服务。

如上图所示：这是一个同步阻塞服务器响应客户端访问的时间节点图。

这种模型的特点在于单线程和阻塞I/O。 单线程即服务器端只有一个线程处理客户端的所有请求，客户端连接与服务器端的处理线程比是 n:1 ，它无法同时处理多个连接，只能串行处理连接。而阻塞I/O是指服务器在读写数据时是阻塞的，读取客户端数据时要等待客户端发送数据并且把 *** 作系统内核复制到用户进程中，这时才解除阻塞状态。写数据回客户端时要等待用户进程将数据写入内核并发送到客户端后才解除阻塞状态。 这种阻塞带来了一个问题，服务器必须要等到客户端成功接收才能继续往下处理另外一个客户端的请求，在此期间线程将无法响应任何客户端请求。

该模型的特点：它是最简单的服务器模型，整个运行过程都只有一个线程，只能支持同时处理一个客户端的请求(如果有多个客户端访问，就必须排队等待)， 服务器系统资源消耗较小，但并发能力低，容错能力差。

多线程阻塞I/O模型在单线程阻塞I/O模型的基础上对其进行改进，加入多线程，提高并发能力，使其能够同时对多个客户端进行响应，多线程的核心就是利用多线程机制为每个客户端分配一个线程。

如上图所示，服务器端开始监听客户端的访问，假如有两个客户端同时发送请求过来，服务器端在接收到客户端请求后分别创建两个线程对它们进行处理，每条线程负责一个客户端连接，直到响应完成。 期间两个线程并发地为各自对应的客户端处理请求 ，包括读取客户端数据、处理客户端数据、写数据回客户端等 *** 作。

这种模型的I/O *** 作也是阻塞的 ，因为每个线程执行到读取或写入 *** 作时都将进入阻塞状态，直到读取到客户端的数据或数据成功写入客户端后才解除阻塞状态。尽管I/O *** 作阻塞，但这种模式比单线程处理的性能明显高了，它不用等到第一个请求处理完才处理第二个，而是并发地处理客户端请求，客户端连接与服务器端处理线程的比例是 1:1 。

多线程阻塞I/O模型的特点：支持对多个客户端并发响应，处理能力得到大幅提高，有较大的并发量，但服务器系统资源消耗量较大，而且如果线程数过多，多线程之间会产生较大的线程切换成本，同时拥有较复杂的结构。

在探讨单线程非阻塞I/O模型前必须要先了解非阻塞情况下套接字事件的检测机制，因为对于单线程非阻塞模型最重要的事情是检测哪些连接有感兴趣的事件发生。一般会有如下三种检测方式。

当多个客户端向服务器请求时，服务器端会保存一个套接字连接列表中，应用层线程对套接字列表轮询尝试读取或写入。如果成功则进行处理，如果失败则下次继续。这样不管有多少个套接字连接，它们都可以被一个线程管理，这很好地利用了阻塞的时间，处理能力得到提升。

但这种模型需要在应用程序中遍历所有的套接字列表，同时需要处理数据的拼接，连接空闲时可能也会占用较多CPU资源，不适合实际使用。

这种方式将套接字的遍历工作交给了 *** 作系统内核，把对套接字遍历的结果组织成一系列的事件列表并返回应用层处理。对于应用层，它们需要处理的对象就是这些事件，这是一种事件驱动的非阻塞方式。

服务器端有多个客户端连接，应用层向内核请求读写事件列表。内核遍历所有套接字并生成对应的可读列表readList和可写列表writeList。readList和writeList则标明了每个套接字是否可读/可写。应用层遍历读写事件列表readList和writeList，做相应的读写 *** 作。

内核遍历套接字时已经不用在应用层对所有套接字进行遍历，将遍历工作下移到内核层，这种方式有助于提高检测效率。 然而，它需要将所有连接的可读事件列表和可写事件列表传到应用层，假如套接字连接数量变大，列表从内核复制到应用层也是不小的开销。 另外，当活跃连接较少时， 内核与应用层之间存在很多无效的数据副本 ，因为它将活跃和不活跃的连接状态都复制到应用层中。

通过遍历的方式检测套接字是否可读可写是一种效率比较低的方式，不管是在应用层中遍历还是在内核中遍历。所以需要另外一种机制来优化遍历的方式，那就是 回调函数 。内核中的套接字都对应一个回调函数，当客户端往套接字发送数据时，内核从网卡接收数据后就会调用回调函数，在回调函数中维护事件列表，应用层获取此事件列表即可得到所有感兴趣的事件。

内核基于回调的事件检测方式有两种

第一种是用可读列表readList 和可写列表writeList 标记读写事件， 套接字的数量与 readList 和 writeList 两个列表的长度一样 。

上面两种方式由 *** 作系统内核维护客户端的所有连接并通过回调函数不断更新事件列表，而应用层线程只要遍历这些事件列表即可知道可读取或可写入的连接，进而对这些连接进行读写 *** 作，极大提高了检测效率，自然处理能力也更强。

单线程非阻塞I/O模型最重要的一个特点是，在调用读取或写入接口后立即返回，而不会进入阻塞状态。虽然只有一个线程，但是它通过把非阻塞读写 *** 作与上面几种检测机制配合就可以实现对多个连接的及时处理，而不会因为某个连接的阻塞 *** 作导致其他连接无法处理。在客户端连接大多数都保持活跃的情况下，这个线程会一直循环处理这些连接，它很好地利用了阻塞的时间，大大提高了这个线程的执行效率。

单线程非阻塞I/O模型的主要优势体现在对多个连接的管理，一般在同时需要处理多个连接的发场景中会使用非阻塞NIO模式，此模型下只通过一个线程去维护和处理连接，这样大大提高了机器的效率。一般服务器端才会使用NIO模式，而对于客户端，出于方便及习惯，可使用阻塞模式的套接字进行通信。

在多核的机器上可以通过多线程继续提高机器效率。最朴实、最自然的做法就是将客户端连接按组分配给若干线程，每个线程负责处理对应组内的连接。比如有4个客户端访问服务器，服务器将套接字1和套接字2交由线程1管理，而线程2则管理套接字3和套接字4，通过事件检测及非阻塞读写就可以让每个线程都能高效处理。

多线程非阻塞I/O模式让服务器端处理能力得到很大提高，它充分利用机器的CPU，适合用于处理高并发的场景，但它也让程序更复杂，更容易出现问题（死锁、数据不一致等经典并发问题）。

最经典的多线程非阻塞I/O模型方式是Reactor模式。首先看单线程下的Reactor，Reactor将服务器端的整个处理过程分成若干个事件，例如分为接收事件、读事件、写事件、执行事件等。Reactor通过事件检测机制将这些事件分发给不同处理器去处理。在整个过程中只要有待处理的事件存在，即可以让Reactor线程不断往下执行，而不会阻塞在某处，所以处理效率很高。

基于单线程Reactor模型，根据实际使用场景，把它改进成多线程模式。常见的有两种方式：一种是在耗时的process处理器中引入多线程，如使用线程池；另一种是直接使用多个Reactor实例，每个Reactor实例对应一个线程。

Reactor模式的一种改进方式如下图所示。其整体结构基本上与单线程的Reactor类似，只是引入了一个线程池。由于对连接的接收、对数据的读取和对数据的写入等 *** 作基本上都耗时较少，因此把它们都放到Reactor线程中处理。然而，对于逻辑处理可能比较耗时的工作，可以在process处理器中引入线程池，process处理器自己不执行任务，而是交给线程池，从而在Reactor线程中避免了耗时的 *** 作。将耗时的 *** 作转移到线程池中后，尽管Reactor只有一个线程，它也能保证Reactor的高效。

Reactor模式的另一种改进方式如下图所示。其中有多个Reactor实例，每个Reactor实例对应一个线程。因为接收事件是相对于服务器端而言的，所以客户端的连接接收工作统一由一个accept处理器负责，accept处理器会将接收的客户端连接均匀分配给所有Reactor实例，每个Reactor实例负责处理分配到该Reactor上的客户端连接，包括连接的读数据、写数据和逻辑处理。这就是多Reactor实例的原理。

Tomcat支持的I/O模型如下表（自85/90 版本起，Tomcat移除了对BIO的支持），在 80 之前， Tomcat 默认采用的I/O方式为 BIO ，之后改为 NIO。无论 NIO、NIO2 还是 APR，在性能方面均优于以往的BIO。

Tomcat中的NIO模型是使用的JAVA的NIO类库，其内部的IO实现是同步的（也就是在用户态和内核态之间的数据交换上是同步机制），采用基于selector实现的异步事件驱动机制（这里的异步指的是selector这个实现模型是使用的异步机制）。而对于Java来说，非阻塞I/O的实现完全是基于 *** 作系统内核的非阻塞I/O，它将 *** 作系统的非阻塞I/O的差异屏蔽并提供统一的API，让我们不必关心 *** 作系统。JDK会帮我们选择非阻塞I/O的实现方式。

NIO2和前者相比的最大不同就在于引入了异步通道来实现异步IO *** 作，因此也叫AIO（Asynchronous I/O）。NIO2 的异步通道 APIs 提供方便的、平台独立的执行异步 *** 作的标准方法。这使得应用程序开发人员能够以更清晰的方式来编写程序，而不必定义自己的 Java 线程，此外，还可通过使用底层 OS 所支持的异步功能来提高性能。如同其他 Java API 一样，API 可利用的 OS 自有异步功能的数量取决于其对该平台的支持程度。

异步通道提供支持连接、读取、以及写入之类非锁定 *** 作的连接，并提供对已启动 *** 作的控制机制。Java 7 中用于 Java Platform（NIO2）的 More New I/O APIs，通过在 javaniochannels 包中增加四个异步通道类，从而增强了 Java 14 中的 New I/O APIs（NIO），这些类在风格上与 NIO 通道 API 很相似。他们共享相同的方法与参数结构体，并且大多数对于 NIO 通道类可用的参数，对于新的异步版本仍然可用。主要区别在于新通道可使一些 *** 作异步执行。

异步通道 API 提供两种对已启动异步 *** 作的监测与控制机制。第一种是通过返回一个 javautilconcurrentFuture 对象来实现，它将会建模一个挂起 *** 作，并可用于查询其状态以及获取结果。第二种是通过传递给 *** 作一个新类的对象， javaniochannelsCompletionHandler ，来完成，它会定义在 *** 作完毕后所执行的处理程序方法。每个异步通道类为每个 *** 作定义 API 副本，这样可采用任一机制。

Apache可移植运行时（Apache Portable Runtime，APR） 是Apache >一是生产现场层，包括仪表、机械设备、在线感知传感器和执行器，以及电机、机器人/手臂等生产设备和检测设备，分布在现场生产线上的各个工位；
其次为产线控制层，利用可编程控制器(PLC/MC)对现场各设备/机器、执行机构等进行数据采集和控制 *** 作，对生产线生产的自动化运行起到过程控制作用；
第3层是数据采集和 *** 作层，利用SCADA系统对设备专机、工具机、工具机、现场监控视频等生产设备或生产线进行全面的生产数据采集和监控数据采集与集成工作，提供HMI可视化界面，实现人机交互和监控，同时，向生产线控制系统下达生产指令；
第4层，是车间管理信息系统，包括MES系统和WMS系统，车间执行系统管理自动化、WMS系统完成物料的综合管理；
五是是企业资源计划ERP系统和产品数据管理系统，实现了对整个企业产、供、销、人、财、物及产品数据的综合管理。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/10480968.html

Java开发服务器的线程处理方式

发表评论

评论列表（0条）