1)文件的类型
文件是数据的抽象和集合,可以理解为文件是存储在辅助存储器上的数据序列,是数据存储的一种形式。具体来说,文件都是以二进制方式来存储的,但是它有不同的展现形态。在程序设计中一般有两种展现形态,分别叫文本文件和二进制文件。
文本文件和二进制文件只是文件的展示方式。从本质上来讲,所有文件都是以二进制形式存储在计算机上。但是形式上我们将存储的文件由程序读出进行使用时,那么文件就可以采用文本方式或二进制方式进行处理。这两种方式其实可以应用于任何文件上,但是有些文件天然是文本文件,有些文件天然是二进制文件。
因为文件是数据的抽象和集合,如果这些数据是由单一特定编码组成,那这样的文件就是文本文件,比如我们使用UTF-8编码将所有的信息进行组织,并且在一个文件中只用这样的编码去存储数据,那么这样的文件就叫文本文件。由于存在编码,文本文件也被看成是存储着的长字符串,简单来说,文本文件就是一个字符串,比如WIndows系统中的.txt文件、Python的源文件.py文件等。
二进制文件是指直接由比特0、1构成的文件,而在这个文件中,数据之间没有使用统一的字符编码。在这样的文件中,一般0、1是根据一些预定义的格式进行了结构组织,它形成了一些特定的文件类型,比如.png文件、.avi文件等,它们本身就是有很多的0、1按照特定的方式进行组织,对于这些0、1之上是不存在任何编码,这类文件就叫二进制文件。
所有文件都是以二进制0、1形式存储,有统一编码的称之为文本文件,没有统一编码的称之为二进制文件,但是无论什么类型的文件都可以以二进制方式打开。
2)文件的打开和关闭
Python和其他语言类似,在处理文件时遵循一个特定的步骤:打开- *** 作-关闭。
对于一个文件,如果不对它进行处理的时候,它体现的是一个文件的存储状态,此时文件在计算机的硬盘中存储。如果一个程序想处理一个文件,首先要使这个文件变成占用状态,在占用状态中,一个程序可以唯一的、排它的对文件进行相关的处理。那么文件的存储状态和文件的占用状态之间通过文件的打开和关闭进行转换,所以在文件处理之间我们需要对文件进行打开,处理完成后我们需要对文件进行关闭。在打开文件之后,我们可以对文件进行数据读入和数据输出,简称为读文件和写文件。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)