什么是文件的逻辑结构和物理结构?_教程

逻辑结构：指一个文件在用户面前所呈现的形式.物理结构：指文件在文件存储器上的存储形式.

逻辑结构有两种形式：①记录式文件(有结构式文件).②字符流式文件（无结构式文件）,也称流式文件.

物理结构：所谓文件系统的物理结构是指数据存放在硬盘上时硬盘磁粉的排列形状.

物理结构的形式：①连续文件结构②串联文件结构③索引文件结构④散列文件结构.

一、顺序结构

优点：

1、支持顺序存取和随机存取。

2、顺序存取速度快。

3、所需的磁盘寻道次数和寻道时间最少。

缺点：

1、需要为每个文件预留若干物理块以满足文件增长的部分需要。

2、不利于文件插入和删除。

二、链式结构

优点：

1、提高了磁盘空间利用率，不需要为每个文件预留物理块。

2、有利于文件插入和删除。

3、有利于文件动态扩充。

缺点：

1、存取速度慢，不适于随机存取。

2、当物理块间的连接指针出错时，数据丢失。

3、更多的寻道次数和寻道时间。

4、链接指针占用一定的空间，降低了空间利用率。

三、索引结构

优点：

1、不需要为每个文件预留物理块。

2、既能顺序存取，又能随机存取。

3、满足了文件动态增长、插入删除的要求。

缺点：

1、较多的寻道次数和寻道时间。

2、索引表本身带来了系统开销。如：内外存空间，存取时间等。

拓展资料：

文件存取方法：

顺序存取：顺序存取是按照文件的逻辑地址顺序存取。

固定长记录的顺序存取是十分简单的。读 *** 作总是读出上一次读出的文件的下一个记录，同时，自动让文件记录读指针推进，以指向下一次要读出的记录位置。如果文件是可读可写的。再设置一个文件记录指针，它总指向下一次要写入记录的存放位置，执行写 *** 作时，将一个记录写到文件末端。允许对这种文件进行前跳或后退N（整数）个记录的 *** 作。顺序存取主要用于磁带文件，但也适用于磁盘上的顺序文件。

可变长记录的顺序文件，每个记录的长度信息存放于记录前面一个单元中，它的存取 *** 作分两步进行。读出时，根据读指针值先读出存放记录长度的单元。然后，得到当前记录长后再把当前记录一起写到指针指向的记录位置，同时，调整写指针值。

由于顺序文件是顺序存取的，可采用成组和分解 *** 作来加速文件的输入输出。

直接存取（随机存取法）：

很多应用场合要求以任意次序直接读写某个记录。例如，航空订票系统，把特定航班的所有信息用航班号作标识，存放在某物理块中，用户预订某航班时，需要直接将该航班的信息取出。直接存取方法便适合于这类应用，它通常用于磁盘文件。

为了实现直接存取，一个文件可以看作由顺序编号的物理块组成的，这些块常常划成等长，作为定位和存取的一个最小单位，如一块为1024字节、4096字节，视系统和应用而定。于是用户可以请求读块22、然后，写块48，再读块9等等。直接存取文件对读或写块的次序没有限制。用户提供给 *** 作系统的是相对块号，它是相对于文件开始位置的一个位移量，而绝对块号则由系统换算得到。

索引存取：

第三种类型的存取是基于索引文件的索引存取方法。由于文件中的记录不按它在文件中的位置，而按它的记录键来编址，所以，用户提供给 *** 作系统记录键后就可查找到所需记录。通常记录按记录键的某种顺序存放，例如，按代表健的字母先后次序来排序。对于这种文件，除可采用按键存取外，也可以采用顺序存取或直接存取的方法。信息块的地址都可以通过查找记录键而换算出。实际的系统中，大都采用多级索引，以加速记录查找过程。

参考资料：百度百科：文件存取法

Log File物理结构

从 ib_logfile0和 ib_logfile1这两个文件的物理结构可以看出，在Log Header部分还是有些许差异的， ib_logfile0会多一些额外的信息，主要是checkpoint信息。

并且每个Block的单位是512字节，对应到磁盘每个扇区也是512字节，因此redo log写磁盘是原子写，保证能够写成功，而不像index page一样需要double write来保证安全写入。

我们依次从上到下来看每个Block的结构

Log File Header Block

Log Goup ID，可能会配置多个redo组，每个组对应一个id，当前都是0，占用4字节

Start LSN，这个redo log文件开始日志的lsn，占用8字节

Log File Number，总是为0，占用4字节

Created By，备份程序所占用的字节数，占用32字节

另外在ib_logfile0中会有两个checkpoint block，分别是 LOG_CHECKPOINT_1/ LOG_CHECKPOINT_2，两个记录InnoDB Checkpoint信息的字段，分别从文件头的第二个和第四个block开始记录，并且只在每组log的第一个文件中存在，组内其他文件虽然没有checkpoint相关信息，但是也会预留相应的空间出来。这里为什么有两个checkpoint的呢？原因是设计为交替写入，避免因为介质失败而导致无法找到可用的checkpoint的情况。

Log blocks

请点击输入图片描述

log block结构分为日志头段、日志记录、日志尾部

Block Header，占用12字节

Data部分

Block tailer，占用4字节

Block Header

这个部分是每个Block的头部，主要记录的块的信息

Block Number，表示这是第几个block，占用4字节，是通过LSN计算得来的，占用4字节

Block data len，表示该block中有多少字节已经被使用了，占用2字节

First Rec offet，表示该block中作为第一个新的mtr开始的偏移量，占用2字节

Checkpoint number，表示该log block最后被写入时的检查点的值，占用4字节

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/tougao/11622101.html

什么是文件的逻辑结构和物理结构?

发表评论

评论列表（0条）