*** 作系统(4) -- 文件管理、IO管理

 *** 作系统(4) -- 文件管理、IO管理,第1张

引入—为解决变长记录文件的顺序存取低效问题。

索引文件—为变长记录文件建立一张索引表。

与文件管理系统和文件集合相关联的是文件目录。包含文件的相关信息,如:属性、位置和所有权等。

对目录管理的要求如下:

从文件管理角度看,文件由FCB和文件体(文件本身)两部分组成。

文件控制块是 *** 作系统为管理文件而设置的数据结构,存放了文件的有关说明信息,是文件存在的标志。

FCB 中的信息:

文件目录

把所有的FCB组织在一起,就构成了文件目录,即文件控制块的有序集合。

目录项

构成文件目录的项目(目录项就是FCB)

目录文件

为了实现对文件目录的管理,通常将文件目录以文件的形式保存在外存,称为目录文件。

所有的用户使用一个目录

为每个用户创建一个单独的目录

在两级目录中若允许用户建立自己的子目录,则形成3级或多级目录结构(即树型目录结构)

一盘磁带、一张光盘片、一个硬盘分区或一张软盘片都称为一 ,卷是存储介质的物理单位。一个卷可以保存一个文件或多个文件,也可以一个文件保存在多个卷上。

是存储介质上连续信息所组成的一个区域,也叫做物理记录。块是主存储器和辅助存储设备进行信息交换的物理单位,每次总是交换一块或整数块信息。

每个文件在磁盘上占用一组连续的物理块。磁盘地址构成一个线性空间,文件逻辑块顺序与文件物理块顺序相同。

磁盘块分配方法:

可以通过合并(consolidation)将一个文件的各个簇连续存放,以提高I/O访问性能。

链接表FAT,每项保存下一块链接地址,整个磁盘仅设置一张。

链接分配方式虽然解决了连续分配方式所存在的问题, 但又出现了另外两个问题, 即:

为每一个文件分配一个索引块(表),再把分配给该文件的所有块号,都记录在该索引块中。故索引块就是一个含有许多块号地址的数组。

优点 :

缺点 :

索引顺序文件

程序直接控制方式 是指由程序直接控制内存或CPU和外围设备之间进行信息传送的方式。通常又称为“忙—等”方式或循环测试方式。

(1)把一个启动位为“1”的控制字写入该设备的控制状态寄存器。

(2)将需输出数据送到数据缓冲寄存器。

(3)测试控制状态寄存中的“完成位”,若为0,转(2),否则转(4)。

(4)输出设备将数据缓冲寄存器中的数据取走进行实际的输出。

(1)进程需要数据时,将允许启动和允许中断的控制字写入设备控制状态寄存器中,启动该设备进行输入 *** 作。

(2)该进程放弃处理机,等待输入的完成。 *** 作系统进程调度程序调度其他就绪进程占用处理机。

(3)当输入完成时,输入设备通过中断请求线向CPU发出中断请求信号。CPU在接收到中断信号之后,转向中断处理程序。

(4)中断处理程序首先保护现场,然后把输入缓冲寄存器中的数据传送到某一特定单元中去,同时将等待输入完成的那个进程唤醒,进入就绪状态,最后恢复现场,并返回到被中断的进程继续执行。

(5)在以后的某一时刻, *** 作系统进程调度程序选中提出的请求并得到获取数据的进程,该进程从约定的内存特定单元中取出数据继续工作。

DMA方式又称直接内存访问(Direct Memory Access)方式。其基本思想是在外设和主存之间开辟直接的数据交换通路。DMA采用总线周期挪用实现I/O。

缓冲(Buffering) - 在设备之间传送数据时,(暂时)保存数据。

单缓冲是 *** 作系统提供的最简单的一种缓冲形式。每当一个进程发出一个I/O请求时, *** 作系统便在主存中为之分配一个缓冲区,该缓冲区用来临时存放输入/输出数据。

设备先把数据写入缓冲区,然后用户进程从缓冲区读走数据。

从自由主存中分配一组缓冲区即可构成缓冲池。

缓冲区可以在收容输入、提取输入、收容输出和提取输出四种方式下工作。

F指向队首,L指向队尾。(emq指空缓冲区队列,inq装满输入数据的输入缓冲队列 ,out装满输出数据的输出缓冲队列 )

1、当一进程对文件进行 *** 作时,首先对其它进行加锁

2、这里只有该进程有权对文件进行读取,其它进程如果现在读,是完全没有问题,但如果这时有进程试图想对其进行更新,会遭到 *** 作拒绝,

3、先前对文件进行加锁的进程这时如果对文件的更新 *** 作完毕,这就释放独占的标识,这时文件又恢复到了可更改的状态

4、接下来同理,如果那个进程在 *** 作文件时,文件没有加锁,这时,它就可以放心大胆的对文件进行锁定,独自享用!

标准IO与文件IO 的不同之处,先来说说标准IO:标准I/O是ANSI C建立的一个标准I/O模型,是一个标准函数包和stdio.h头文件中的定义,具有一定的可移植性。标准IO库处理很多细节。例如缓存分配,以优化长度执行IO等。标准的IO提供了三种类型的缓存。

(1)全缓存:当填满标准IO缓存后才进行实际的IO *** 作。 (2)行缓存:当输入或输出中遇到新行符时,标准IO库执行IO *** 作。 (3)不带缓存:stderr就是了。

文件IO:文件IO称之为不带缓存的IO(unbuffered I/O)。不带缓存指的是每个read,write都调用内核中的一个系统调用。也就是一般所说的低级I/O—— *** 作系统提供的基本IO服务,与os绑定,特定于linix或unix平台。

2不同的地方

首先:两者一个显著的不同点在于,标准I/O默认采用了缓冲机制,比如调用fopen函数,不仅打开一个文件,而且建立了一个缓冲区(读写模式下将建立两个缓冲区),还创建了一个包含文件和缓冲区相关数据的数据结构。低级I/O一般没有采用缓冲,需要自己创建缓冲区,不过其实在linix或unix系统中,都是有使用称为内核缓冲的技术用于提高效率,读写调用是在内核缓冲区和进程缓冲区之间进行的数据复制。

其次从 *** 作的设备上来区分,文件I/O主要针对文件 *** 作,读写硬盘等,它 *** 作的是文件描述符,标准I/O针对的是控制台,打印输出到屏幕等,它 *** 作的是字符流。对于不同设备得特性不一样,必须有不同api访问才最高效。

软件开发专业网关注,其实最重要的还是他们各自的函数了;

1.fopen与open

标准I/O使用fopen函数打开一个文件:

FILE* fp=fopen(const char* path,const char *mod)

其中path是文件名,mod用于指定文件打开的模式的字符串,比如"r","w","w+","a"等等,可以加上字母b用以指定以二进制模式打开(对于 *nix系统,只有一种文件类型,因此没有区别),如果成功打开,返回一个FILE文件指针,如果失败返回NULL,这里的文件指针并不是指向实际的文 件,而是一个关于文件信息的数据包,其中包括文件使用的缓冲区信息。

文件IO使用open函数用于打开一个文件:

int fd=open(char *name,int how)

与fopen类似,name表示文件名字符串,而how指定打开的模式:O_RDONLY(只读),O_WRONLY(只写),O_RDWR (可读可写),还有其他模式请man 2 open。成功返回一个正整数称为文件描述符,这与标准I/O显著不同,失败的话返回-1,与标准I/O返回NULL也是不同的。

2.fclose与close

与打开文件相对的,标准I/O使用fclose关闭文件,将文件指针传入即可,如果成功关闭,返回0,否则返回EOF比如:

if(fclose(fp)!=0) printf("Error in closing file")

而文件IO使用close用于关闭open打开的文件,与fclose类似,只不过当错误发生时返回的是-1,而不是EOF,成功关闭同样是返回0。C语言用error code来进行错误处理的传统做法。

3. 读文件,getc,fscanf,fgets和read

标 准I/O中进行文件读取可以使用getc,一个字符一个字符的读取,也可以使用gets(读取标准io读入的)、fgets以字符串单位进行读取(读到遇 到的第一个换行字符的后面),gets(接受一个参数,文件指针)不判断目标数组是否能够容纳读入的字符,可能导致存储溢出(不建议使用),而fgets使用三个参数: char * fgets(char *s, int size, FILE *stream)

第一个参数和gets一样,用于存储输入的地址,第二个参数为整数,表示输入字符串的最大长度,最后一个参数就是文件指针,指向要读取的文件。最 后是fscanf,与scanf类似,只不过增加了一个参数用于指定 *** 作的文件,比如fscanf(fp,"%s",words)文件IO中使用read函数用于读取open函数打开的文件,函数原型如下:

ssize_t numread=read(int fd,void *buf,size_t qty)

其中fd就是open返回的文件描述符,buf用于存储数据的目的缓冲区,而qty指定要读取的字节数。如果成功读取,就返回读取的字节数目(小于等于qty)

4. 判断文件结尾

如果尝试读取达到文件结尾,标准IO的getc会返回特殊值EOF,而fgets碰到EOF会返回NULL,而对于*nix的read函数,情况有所不 同。read读取qty指定的字节数,最终读取的数据可能没有你所要求的那么多(qty),而当读到结尾再要读的话,read函数将返回0.

5. 写文件:putc,fputs,fprintf和write

与读文件相对应的,标准C语言I/O使用putc写入字符,比如:

putc(ch,fp)

第一个参数是字符,第二个是文件指针。而fputs与此类似:

fputs(buf,fp)

仅仅是第一个参数换成了字符串地址。而fprintf与printf类似,增加了一个参数用于指定写入的文件,比如:

fprintf(stdout,"Hello %s.\n","dennis")

切记fscanf和fprintf将FILE指针作为第一个参数,而putc,fputs则是作为第二个参数。

在文件IO中提供write函数用于写入文件,原型与read类似:

ssize_t result=write(int fd,void *buf ,size_t amt)

fd是文件描述符,buf是将要写入的内存数据,amt是要写的字节数。如果写入成功返回写入的字节数,通过result与amt的比较可以判断是否写入正常,如果写入失败返回-1

6. 随机存取:fseek()、ftell()和lseek()

标准I/O使用fseek和ftell用于文件的随机存取,先看看fseek函数原型

int fseek(FILE *stream, long offset, int whence)

第一个参数是文件指针,第二个参数是一个long类型的偏移量(offset),表示从起始点开始移动的距离。第三个参数就是用于指定起始点的模式,stdio.h指定了下列模式常量:

SEEK_SET文件开始处 SEEK_CUR当前位置 SEEK_END文件结尾处

看几个调用例子: fseek(fp,0L,SEEK_SET)//找到文件的开始处 fseek(fp,0L,SEEK_END)//定位到文件结尾处 fseek(fp,2L,SEEK_CUR)//文件当前位置向前移动2个字节数

而ftell函数用于返回文件的当前位置,返回类型是一个long类型,比如下面的调用:

fseek(fp,0L,SEEK_END)//定位到结尾 long last=ftell(fp)//返回当前位置

那么此时的last就是文件指针fp指向的文件的字节数。

与标准I/O类似,*nix系统提供了lseek来完成fseek的功能,原型如下:

off_t lseek(int fildes, off_t offset, int whence)

fildes是文件描述符,而offset也是偏移量,whence同样是指定起始点模式,唯一的不同是lseek有返回值,如果成功就 返回指针变化前的位置,否则返回-1。whence的取值与fseek相同:SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整数 0,1,2相应代替。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12102982.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存