IO的read方法返回-1和阻塞的区别

IO的read方法返回-1和阻塞的区别,第1张

之前一直在疑惑,什么叫阻塞,什么叫结束。潜意识以为这两个都是服务器读到最后 了
一定程度上来讲是的,都是当前内容读到了最后。但是返回-1是当前流到了最后,而阻塞是因为当前流读到了最后没内容了,但是客户端还没有关闭流。
当客户端关闭了输出流的时候,服务器会知道。返回-1。否则等待接下来的数据或者等待关闭例子如下
服务端

<br />

客户端

flush()是什么用的?交由下一章节

Q1: 阻塞是什么意思或者这个上下文环境是什么

A:  阻塞是进程5状态或者7状态 其中一个状态,线程也有阻塞态

Q2: 什么情况下会使得运行中的进程进入阻塞态

A: 因为阻塞态 是等待IO时间完成的过程 ,所以正常情况下IO *** 作都会进入导致进程(线程)进入阻塞态

Q3:  那非阻塞IO是什么意思

A:非阻塞IO 就是通过轮询方式 不让线程或者进程 进入阻塞 一直持有CPU资源 的IO *** 作

同步:指的是被调用方做完事情之后再返回;

异步:指的是被调用方先返回,然后再做事情,做完之后再想办法通知调用方。

Q:非阻塞IO与IO多路复用为什么是同步的

A:  非阻塞IO 虽然能够立即返回但是 他需要一直while轮询 这是一个阻塞过程

     IO多路复用 select 过程也是一个轮询过程 

同步 在这里是指 发起调用 到 从内核态数据拷贝到用户态数据结束过程  是不是需要等待

Q:为什么数据需要从内核态拷贝到用户态

A: *** 作系统把运行中内的内存  分为系统空间和用户空间

  *** 作系统 主要是  进程管理 [创建进程,撤销进程等] 存储管理[分配内存,内存置换] 设备管理   文件管理  这些都是管理的 *** 作都运行在系统空间[内核态]

网络IO 属于设备管理 中需要的 内核程序进行网络通信

首先要明白什么是“阻塞”?
阻塞实际是针对“当前”线程的一个概念,当前线程可以往下走,就是没有阻塞,否则就可以说当前线程被阻塞了。
明白了概念就好处理了:
非阻塞:new Thread(){ public void run(){ / 我的IO处理/ } }start()
阻塞:aInputStreamread()这样就可以了。最简单的验证:在main方法中加入这句“Systeminread();”看看你的程序是不是停在这句了?除非你在控制台输入东西,否则你的程序就“阻塞”在这里了。

阻塞 *** 作是指在执行设备 *** 作时,若不能获得资源,则挂起进程直到满足可 *** 作的条件后再进行 *** 作。被挂起的进程进入睡眠状态,被从调度器的运行队列移走,直到等待的条件被满足。而非阻塞 *** 作的进程在不能进行设备 *** 作时,并不挂起,它要么放弃,要么不停地查询,直至可以进行 *** 作为止。
驱动程序通常需要提供这样的能力:当应用程序进行read()、write()等系统调用时,若设备的资源不能获取,而用户又希望以阻塞的方式访问设备,驱动程序应在设备驱动的xxx_read()、xxx_write()等 *** 作中将进程阻塞直到资源可以获取,此后,应用程序的read()、write()等调用才返回,整个过程仍然进行了正确的设备访问,用户并没有感知到;若用户以非阻塞的方式访问设备文件,则当设备资源不可获取时,设备驱动的xxx_read()、xxx_write()等 *** 作应立即返回,read()、write()等系统调用也随即被返回,应用程序收到-EAGAIN返回值。
在阻塞访问时,不能获取资源的进程将进入休眠,它将CPU资源“礼让”给其他进程。因为阻塞的进程会进入休眠状态,所以必须确保有一个地方能够唤醒休眠的进程,否则,进程就真的“寿终正寝”了。唤醒进程的地方最大可能发生在中断里面,因为在硬件资源获得的同时往往伴随着一个中
断。而非阻塞的进程则不断尝试,直到可以进行I/O。

1 import javaioFile;
2 import javaioFileOutputStream;
3 import javaioIOException;
4 import javaioOutputStream;
5
6 public class Test11 {
7     public static void main(String[] args) throws IOException {
8         File f = new File("d:" + Fileseparator+"testtxt");
9         OutputStream out=new FileOutputStream(f);//如果文件不存在会自动创建
10         String str="Hello World";
11         byte[] b=strgetBytes();
12         outwrite(b);//因为是字节流,所以要转化成字节数组进行输出
13         outclose();
14     }
15 }

具体如下。
阻塞IO,指的是需要内核IO *** 作彻底完成后,才返回到用户空间执行用户的 *** 作。阻塞指的是用户空间程序的执行状态。传统的IO模型都是同步阻塞IO。再Java中,默认创建的socket都是阻塞的。非阻塞IO,指的是用户空间的程序不需要等待内核IO *** 作彻底完成,可以立即返回用户空间执行用户 *** 作,即处于非阻塞的状态,与此同时内核会立即返回简单来说:阻塞是指用户空间(调用线程)一直在等待,而不能干别的事情;非阻塞是指用户空间(调用线程)拿到内核返回的状态值就返回自己的空间。
解释:有障碍而无法畅通。《福惠全书.卷八.钱谷部.漕项收兑》:催_远离口岸,不得阻塞河路。相关词语:保塞优婆塞充塞允塞出塞伊蒲。

关于IO会涉及到阻塞、非阻塞、多路复用、同步、异步、BIO、NIO、AIO等几个知识点。知识点虽然不难但平常经常容易搞混,特此Mark下,与君共勉。

阻塞IO情况下,当用户调用 read 后,用户线程会被阻塞,等内核数据准备好并且数据从内核缓冲区拷贝到用户态缓存区后 read 才会返回。可以看到是阻塞的两个部分。

非阻塞IO发出read请求后发现数据没准备好,会继续往下执行,此时应用程序会不断轮询polling内核询问数据是否准备好,当数据没有准备好时,内核立即返回EWOULDBLOCK错误。直到数据被拷贝到应用程序缓冲区,read请求才获取到结果。并且你要注意!这里最后一次 read 调用获取数据的过程,是一个同步的过程,是需要等待的过程。这里的同步指的是 内核态的数据拷贝到用户程序的缓存区这个过程

非阻塞情况下无可用数据时,应用程序每次轮询内核看数据是否准备好了也耗费CPU,能否不让它轮询,当内核缓冲区数据准备好了,以事件通知当机制告知应用进程数据准备好了呢?应用进程在没有收到数据准备好的事件通知信号时可以忙写其他的工作。此时 IO多路复用 就派上用场了。

IO多路复用中文比较让人头大,IO多路复用的原文叫 I/O multiplexing,这里的 multiplexing 指的其实是在单个线程通过记录跟踪每一个Sock(I/O流)的状态来同时管理多个I/O流 发明它的目的是尽量多的提高服务器的吞吐能力。实现一个线程监控多个IO请求,哪个IO有请求就把数据从内核拷贝到进程缓冲区,拷贝期间是阻塞的!现在已经可以通过采用mmap地址映射的方法,达到内存共享效果,避免真复制,提高效率。

select、poll、epoll 都是I/O多路复用的具体的实现。

select是第一版IO复用,提出后暴漏了很多问题。

poll 修复了 select 的很多问题。

但是poll仍然不是线程安全的, 这就意味着不管服务器有多强悍,你也只能在一个线程里面处理一组 I/O 流。你当然可以拿多进程来配合了,不过然后你就有了多进程的各种问题。

epoll 可以说是 I/O 多路复用最新的一个实现,epoll 修复了poll 和select绝大部分问题, 比如:

横轴 Dead connections 是链接数的意思,叫这个名字只是它的测试工具叫deadcon。纵轴是每秒处理请求的数量,可看到epoll每秒处理请求的数量基本不会随着链接变多而下降的。poll 和/dev/poll 就很惨了。但 epoll 有个致命的缺点是只有 linux 支持。

比如平常Nginx为何可以支持4W的QPS是因为它会使用目标平台上面最高效的I/O多路复用模型。

然后你会发现上面的提到过的 *** 作都不是真正的异步,因为两个阶段总要等待会儿!而真正的异步 I/O 是内核数据准备好和数据从内核态拷贝到用户态这两个过程都不用等待。

很庆幸,Linux给我们准备了 aio_read aio_write 函数实现真实的异步,当用户发起aio_read请求后就会自动返回。内核会自动将数据从内核缓冲区拷贝到用户进程空间,应用进程啥都不用管。

我强力推荐C++后端开发免费学习地址:C/C++Linux服务器开发/后台架构师零声教育-学习视频教程-腾讯课堂

同步跟异步的区别在于 数据从内核空间拷贝到用户空间是否由用户线程完成 ,这里又分为同步阻塞跟同步非阻塞两种。

我们以同步非阻塞为例,如下可看到,在将数据从内核拷贝到用户空间这一过程,是由用户线程阻塞完成的。

可发现,用户在调用之后会立即返回,由内核完成数据的拷贝工作,并通知用户线程,进行回调。

在Java中,我们使用socket进行网络通信,IO主要有三种模式,主要看 内核支持 哪些。

同步阻塞IO ,每个客户端的Socket连接请求,服务端都会对应有个处理线程与之对应,对于没有分配到处理线程的连接就会被阻塞或者拒绝。相当于是 一个连接一个线程 。

BIO特点

常量:

主类:

服务端监听线程:

服务端处理线程:

客户端:

同步非阻塞IO之NIO :服务器端保存一个Socket连接列表,然后对这个列表进行轮询,如果发现某个Socket端口上有数据可读时说明读就绪,则调用该socket连接的相应读 *** 作。如果发现某个 Socket端口上有数据可写时说明写就绪,则调用该socket连接的相应写 *** 作。如果某个端口的Socket连接已经中断,则调用相应的析构方法关闭该端口。这样能充分利用服务器资源,效率得到了很大提高,在进行IO *** 作请求时候再用个线程去处理,是 一个请求一个线程 。Java中使用Selector、Channel、Buffer来实现上述效果。

每个线程中包含一个 Selector 对象,它相当于一个通道管理器,可以实现在一个线程中处理多个通道的目的,减少线程的创建数量。远程连接对应一个channel,数据的读写通过buffer均在同一个 channel 中完成,并且数据的读写是非阻塞的。通道创建后需要注册在 selector 中,同时需要为该通道注册感兴趣事件(客户端连接服务端事件、服务端接收客户端连接事件、读事件、写事件), selector 线程需要采用 轮训 的方式调用 selector 的 select 函数,直到所有注册通道中有兴趣的事件发生,则返回,否则一直阻塞。而后循环处理所有就绪的感兴趣事件。以上步骤解决BIO的两个瓶颈:

下面对以下三个概念做一个简单介绍,Java NIO由以下三个核心部分组成:

channel和buffer有好几种类型。下面是Java NIO中的一些主要channel的实现:

正如你所看到的,这些通道涵盖了UDP和TCP网络IO,以及文件IO。以下是Java NIO里关键的buffer实现:

在微服务阶段,一个请求可能涉及到多个不同服务之间的跨服务器调用,如果你想实现高性能的PRC框架来进行数据传输,那就可以基于Java NIO做个支持长连接、自定义协议、高并发的框架,比如Netty。Netty本身就是一个基于NIO的网络框架, 封装了Java NIO那些复杂的底层细节,给你提供简单好用的抽象概念来编程。比如Dubbo底层就是用的Netty。

AIO是异步非阻塞IO,相比NIO更进一步,进程读取数据时只负责发送跟接收指令,数据的准备工作完全由 *** 作系统来处理。

推荐一个零声教育C/C++后台开发的免费公开课程,个人觉得老师讲得不错,分享给大家:C/C++后台开发高级架构师,内容包括Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK等技术内容,C/C++Linux服务器开发/后台架构师零声教育-学习视频教程-腾讯课堂 立即学习

原文:阻塞、非阻塞、多路复用、同步、异步、BIO、NIO、AIO 一锅端


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13408135.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-30
下一篇 2023-07-30

发表评论

登录后才能评论

评论列表(0条)

保存